【算法】Cosine similarity

cosine similarity

sent A: 我喜欢看电视,不喜欢看电影

sent B: 我不喜欢看电视,也不喜欢看电影

 

step1: segment

sent A: 我 喜欢 看 电视 不 喜欢 看 电影

sent B: 我 不 喜欢 看 电视,也 不 喜欢 看 电影

 

step2: TF(TF * IDF)

sent A:我 1,喜欢 2,看 2,电视 1,电影 1,不 1,也 0。

sent B:我 1,喜欢 2,看 2,电视 1,电影 1,不 2,也 1。

 

step3: vector

sent A:[1, 2, 2, 1, 1, 1, 0]

sent B:[1, 2, 2, 1, 1, 2, 1]

 

step4: calculate

 

 

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。