删除重复数据思路

1.在操作数据库的时候往往会出现一条数据重复出现多次,而且没有唯一标识的情况下该如何删除重复数据呢?

解决方案: 先用distinct 查出所有不重复的数据,然后存入到一个临时表中,删除现有表的所以数据,把临时表数据导入。

select   distinct   *   into   #tmp    from   emp   
    delete   from   emp   
    insert   into   emp   select   *   from   #tmp
(2)但是如果不可以使用临时表,那该怎么办? 
我们观察到我们没办法区分数据(物理位置不一样,对 SQL Server来说没有任何区别),思路自然是想办法把数据区分出来了,既然现在的所有的列都没办法区分数据,唯一的办法就是再加个列让它区分出来,加什么列好?最佳选择是identity列:
alter   table   emp   add   chk   int   identity(1,1)
表示例:
name   age   chk     
    Tom     16     1     
    Sun      14     2     
    Tom     16     3     
    Tom     16     4
重复记录可以表示为:
select   *   from   emp where (select   count(*)   from   emp   e   where   e.name=emp.name)>1
要删除的是:
delete   from   emp 
    where (select   count(*)   from   emp   e     where   e.name=emp.name   and   e.chk>=emp.chk)>1
再把添加的列删掉,出现结果。
alter   table   emp   drop   column   chk

 

posted @ 2015-10-10 20:13  Sam萨姆  阅读(106)  评论(0)    收藏  举报