msqlserver 千万级别单表数据去掉重复记录使用临时表

时间：2016-04-08 08:57:18 阅读：194 评论：0 收藏：0 [点我收藏+]

标签：

由于上周末小写把数据数据重复写入数据库，没办法，得去重！

最新使用的语句：

use data

set nocount on
delete DoRecordProperty from
(

select TID,SN,COUNT(0) as num,Max(id) as maxid from DoRecordProperty with (nolock) group by TID,SN having count(0)>1

) p where p.TID=DoRecordProperty.TID and p.SN=DoRecordProperty.SN and DoRecordProperty.Id<>p.maxid

set nocount off

语句执行了5分钟，还没有出结果，再执行下去，估计也没有结果。

如果单独执行

select TID,SN,COUNT(0) as num,Max(id) as maxid from DoRecordProperty with (nolock) group by TID,SN having count(0)>1

9秒钟就查询出来结果了。

于是想是否把重复的数据放在临时表里，然后再删除，效果会如何呢？

于是有了下面的语句

use data
go

set nocount on

create table #Tmp --创建临时表#Tmp
(
   TID int ,
   SN varchar(50),
   maxid int ,
   num int
);

insert into #Tmp(TID,SN,num,maxid)
select TID,SN,COUNT(0) as num,Max(id) as maxid from DoRecordProperty with (nolock) group by TID,SN having count(0)>1

delete DoRecordProperty from
#Tmp p where p.TID=DoRecordProperty.TID and p.SN=DoRecordProperty.SN and DoRecordProperty.Id<>p.maxid

Select COUNT(0) as num from #Tmp --查询临时表的数据
truncate table #Tmp --清空临时表的所有数据和约束
drop table #Tmp
set nocount off

果然，在40秒的时候，执行成功了。

以上是在服务器：CPU 2u E5-2620 ;内存 96G 硬盘是1T 企业级 7200转；数据是sql server 2008上进行操作的。

msqlserver 千万级别单表数据去掉重复记录使用临时表

标签：

原文地址：http://www.cnblogs.com/wdkshy/p/5366472.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行