删除重复数据思路

1.在操作数据库的时候往往会出现一条数据重复出现多次，而且没有唯一标识的情况下该如何删除重复数据呢？

解决方案： 先用distinct 查出所有不重复的数据，然后存入到一个临时表中，删除现有表的所以数据，把临时表数据导入。

select   distinct   *   into   #tmp    from   emp   
    delete   from   emp   
    insert   into   emp   select   *   from   #tmp
(2)但是如果不可以使用临时表，那该怎么办？ 
我们观察到我们没办法区分数据（物理位置不一样，对 SQL Server来说没有任何区别），思路自然是想办法把数据区分出来了，既然现在的所有的列都没办法区分数据，唯一的办法就是再加个列让它区分出来，加什么列好？最佳选择是identity列：
alter   table   emp   add   chk   int   identity(1,1)
表示例：
name   age   chk     
    Tom     16     1     
    Sun      14     2     
    Tom     16     3     
    Tom     16     4
重复记录可以表示为：
select   *   from   emp where (select   count(*)   from   emp   e   where   e.name=emp.name)>1
要删除的是：
delete   from   emp 
    where (select   count(*)   from   emp   e     where   e.name=emp.name   and   e.chk>=emp.chk)>1
再把添加的列删掉，出现结果。
alter   table   emp   drop   column   chk
posted @ 2015-10-10 20:13 Sam萨姆阅读(107) 评论(0) 收藏举报
刷新页面返回顶部
删除重复数据思路

公告