machine learning比赛系列———2015阿里巴巴天池移动推荐

本以为鄙人学完Andrew Ng的coursera的课还有UFLDL的教程,已经可以自居一隅了,没想到这次参加比赛着实让我长了见识。
下载完数据,一看,OMG!500多M(原谅我见识少)。刚开始啥也不懂,用Excel打开后删除掉其中两列,保存后就没再多看(后来才发现居然就剩30多m,坑爹的Excel)。然后就用这30多兆的数据进行处理,结果可想而知:技术分享

总结一下:

  • 不会SQL:导致在前期数据删选的时候碰壁
  • Matlab不是很熟悉:在导入数据的时候很吃力

思路

  • 首先linear regression预测出在19号会有购买行为的用户userName
  • 筛选出用户行为是3的商品itemName(本意是筛选出2,3,4的item,奈何机器内存不够)
  • 通过userName和itemName进行协同过滤

也不知道这样的思路是否正确,欢迎评论交流,QQ:379940325

郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。