欢迎大家来到IT世界,在知识的湖畔探索吧!
余弦夹角相似度(Cosine Similarity)是一种用来衡量两个向量之间相似度的方法。它通过计算两个向量之间的夹角的余弦值来表示它们的相似程度。值的范围在 -1 到 1 之间,其中 1 表示两个向量完全相似,0 表示没有相似性,-1 表示完全相反。
大白话解释
想象一下两根箭头(向量),它们从同一个点出发。余弦相似度就是看这两根箭头之间的夹角有多大。如果它们指向完全相同的方向,夹角是 0 度,余弦相似度是 1;如果它们指向完全相反的方向,夹角是 180 度,余弦相似度是 -1;如果它们互相垂直,夹角是 90 度,余弦相似度是 0。
计算方法
余弦相似度的计算公式是:
[ \text{Cosine Similarity} = \frac{A \cdot B}{|A| |B|} ]
其中:
- (A \cdot B) 是两个向量的点积。
- (|A|) 和 (|B|) 分别是向量 (A) 和 (B) 的模(即向量的长度)。
计算步骤
- 点积:计算两个向量的点积。
[ A \cdot B = \sum_{i=1}^{n} A_i B_i ] - 模:计算每个向量的模。
[ |A| = \sqrt{\sum_{i=1}^{n} A_i^2} ]
[ |B| = \sqrt{\sum_{i=1}^{n} B_i^2} ] - 余弦相似度:将点积除以两个向量模的乘积。
[ \text{Cosine Similarity} = \frac{A \cdot B}{|A| |B|} ]
示例
假设有两个向量 (A) 和 (B):
[ A = [1, 2, 3] ]
[ B = [4, 5, 6] ]
- 计算点积:
[ A \cdot B = (1 \times 4) + (2 \times 5) + (3 \times 6) = 4 + 10 + 18 = 32 ] - 计算模:
[ |A| = \sqrt{1^2 + 2^2 + 3^2} = \sqrt{1 + 4 + 9} = \sqrt{14} ]
[ |B| = \sqrt{4^2 + 5^2 + 6^2} = \sqrt{16 + 25 + 36} = \sqrt{77} ] - 计算余弦相似度:
[ \text{Cosine Similarity} = \frac{32}{\sqrt{14} \times \sqrt{77}} = \frac{32}{\sqrt{1078}} \approx 0.974 ]
总结
余弦相似度是通过计算两个向量之间夹角的余弦值来衡量它们相似度的一种方法。它特别适用于高维空间中的向量比较,因为它只关注向量的方向而不考虑它们的大小。简单来说,余弦相似度告诉你两个向量在多大程度上指向相同的方向。
免责声明:本站所有文章内容,图片,视频等均是来源于用户投稿和互联网及文摘转载整编而成,不代表本站观点,不承担相关法律责任。其著作权各归其原作者或其出版社所有。如发现本站有涉嫌抄袭侵权/违法违规的内容,侵犯到您的权益,请在线联系站长,一经查实,本站将立刻删除。 本文来自网络,若有侵权,请联系删除,如若转载,请注明出处:https://itzsg.com/98021.html