[MySQL Help]答朋友问:5000W记录的Innodb表如何快速的去重复数据
朋友问:
5000万数据的一张表,怎么去重快,根据两个字段判断是否重复。
回复之:把2个字段以及主键id select 出来建立一张临时表t1,t1建立好主键索引以及2个对比的字段联合索引。然后在临时表里面 比对重复的记录,把重复的记录录入第二张临时表t2,t2表结构和t1一模一样。然后根据你的业务来决定如何处理t2表里面的重复记录,用t2关联原来的5000W记录的表来进行处理,大概通常的是group by2个字段,取出主键id较大的值的记录删除掉。
郑重声明:本站内容如果来自互联网及其他传播媒体,其版权均属原媒体及文章作者所有。转载目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,也不构成任何其他建议。