> 文章列表 > 几种常用的相似度或者相关性算法

几种常用的相似度或者相关性算法

几种常用的相似度或者相关性算法

相似度算法是一种用于比较两个对象之间相似程度的算法。 关于相似度的计算,现有的几种基本方法都是基于向量(Vector)的,其实也就是计算两个向量的距离,距离越近相似度越大。在推荐的场景中,在用户-物品偏好的二维矩阵中,我们可以将一个用户对所有物品的偏好作为一个向量来计算用户之间的相似度,或者将所有用户对某个物品的偏好作为一个向量来计算物品 之间的相似度。在计算机科学中,它是一种常见的技术,被广泛应用于文本、图像、音频等地方。

余弦相似度算法

简介:

余弦相似度算法是一种用于计算两个向量之间相似度的算法,它是基于向量空间模型的。它的基本思想是将向量看作多维空间中的点,通过计算两个向量之间的夹角余弦值来衡量它们的相似程度。如果两个向量之间的夹角越小,它们的相似度就越高,反之则越低。

公式:

余弦相似度的计算公式如下:

 

 

使用场景:</