【用Python玩Machine Learning】KNN * 测试

样本我就用的《machine learning in action》中提供的数据样例,据说是婚恋网站上各个候选人的特征,以及当前人对这些人的喜欢程度。一共1k条数据,前900条作为训练样本,后100条作为测试样本。

数据格式如下:

46893	3.562976	0.445386	didntLike
8178	3.230482	1.331698	smallDoses
55783	3.612548	1.551911	didntLike
1148	0.000000	0.332365	smallDoses
10062	3.931299	0.487577	smallDoses
74124	14.752342	1.155160	didntLike
66603	10.261887	1.628085	didntLike
11893	2.787266	1.570402	smallDoses
50908	15.112319	1.324132	largeDoses
39891	5.184553	0.223382	largeDoses
65915	3.868359	0.128078	didntLike
65678	3.507965	0.028904	didntLike

最后的测试结果,100个测试样本有11个样本分类错误,错误率最终是11%。

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。