大量数据去除重复记录

2023-08-06 06:33:11

前几天老大吩咐我一个任务:去除一张表里的重复(一个字段)记录.

table为表名, filed 为待去重复的字段, id 为主键数据库采用的是 sql server 2005 数量量一百多万.

思索未几,得出方案一如下:

SELECT filed ,min(ID) as id into #TBA  FROM table group by filed  having count(*) > 1 order by id

DECLARE mycur CURSOR FOR SELECT filed ,id FROM #TBA 
OPEN mycur

declare @filed  varchar(50),@id int
FETCH NEXT FROM mycur Into @filed ,@id

WHILE @@FETCH_STATUS = 0
BEGIN 
delete from table where filed = @filed  and id > @id
FETCH NEXT FROM mycur Into @filed ,@id
END

okay,方案得出,运行,吃饭时间到,先填饱肚子去.

大概一个多小时后,居然还在运行..无奈只得中止查询分析器.

此时老大过来要结果了.于是做苦思冥想状.

忽然灵光一现,得出方案二如下:

SELECT min(ID) as id into #TBA  FROM table group by filed   order by id

delete from table where id not in (select id from #TBA)

激动中..运行..速度那可不是提高了一点点..

总结:换个方向思考,或许可以得出意外结果..

大量数据去除重复记录

继续阅读

龙珠训练营task04

阿里云天池龙珠计划SQL训练营打卡

阿里云天池龙珠计划SQL训练营day1

实验楼sql进阶之成绩管理系统的数据操作(window)

20/20: Top 20 Programming Lessons I've Learned in 20 Years

20条编程经验

【观点】风雨20年：我所积累的20条编程经验【观点】风雨20年：我所积累的20条编程经验

【转载】风雨20年：我所积累的20条编程经验

如何存取图片到数据库(SQL Server)

Oracle的基本操作

SQL优化SQL语句优化的目的

JAVA高效编程指南

关于SQL语言

SQL语言基础：常用的数据查询语句

neo4j之cypher使用文档

sqlServer根据经纬查距离