关于数组去重

【本文源址:http://blog.csdn.net/q1056843325/article/details/73277063 转载请添加该地址】

JavaScript数组去重问题虽然在实际开发中很少应用 
但却是面试(或笔试)中可能被问到的题 
如果只能说出一两种方法的话,就显得我们很low 
所以这里我总结了数组去重的六种方法供大家参考

直接遍历

首先先来一种简单粗暴的方法 
也是很容易就可以想到的办法 
声明一个新数组 
直接遍历这个待去重数组 
然后把新数组中没有的元素推进去

function unique(arr){
  var newArr = [];
  for(var i = 0, item; item = arr[i++];){
    if(newArr.indexOf(item) === -1){
      newArr.push(item);
    }
  }
  return newArr;
};

测试数组

var arr = [1,3,2,1,4,5,2,4,1,5];
console.log(unique(arr)); //[1,3,2,4,5]

这个结果是正确的 
但是如果元素中有undefined或者null就会出现问题

var arr = [1,3,2,1,null,4,5,2,4,1,5,null];
console.log(unique(arr)); //[1,3,2]

这是因为for(var i = 0, item; item = arr[i++];) 
null导致提前跳出了循坏 
没办法虽然我很喜欢这种循环方式 
但是为了保持严谨还是要使用正常的for循环

function unique(arr){
  var newArr = [];
  var item;
  for(var i = 0, len = arr.length; i < len; i++){
    item = arr[i];
    if(newArr.indexOf(item) === -1){
      newArr.push(item);
    }
  }
  return newArr;
};
var arr = [1,3,2,1,null,4,5,2,4,1,5,null];
console.log(unique(arr)); //[1,3,2,null,4,5]

当然也可以使用ES5的forEach方法 
虽然它没有for循环的效率高

function unique(arr){
  var newArr = [];
  arr.forEach(function(item){
    if(newArr.indexOf(item) === -1){
      newArr.push(item);
    }
  });
  return newArr;
}

下面的其他方法也可以把for循环替换成forEach


除此之外,我们还可以使用ES5的reduce方法 
让代码看起来更加高大上

function unique(arr){
  return arr.reduce(function(prev, next){
    if(prev.indexOf(next) === -1){
      prev.push(next);
    }
    return prev;
  }, []);
}

indexOf也可以替换成循环判断 
不过既然有好使的API就直接拿来用了 
顺便一提,方法不能够处理数组NaN的去重

var arr = [4, 2, 1, 3, 2, 3, NaN, NaN];
console.log(unique(arr)); //[4,2,1,3,NaN,NaN]

包括下面的方法都不可以 
不过可以把indexOf()换成ES6的Array.contains() 
真正意义上的绝对相等 
这里我就不讨论太复杂的情况了

索引判断

这种方法是利用了数组indexOf的特点 
它会找到数组中第一个该元素值的索引 
所以我们可以判断数组元素的indexOf索引判断和元素本身的索引是否相同 
如果相同,代表这是数组第一次出现的该元素值

function unique(arr){
  var newArr = [];
  var item;
  for(var i = 0, len = arr.length; i < len; i++){
    item = arr[i];
    if(arr.indexOf(item) === i){
      newArr.push(item);
    }
  }
  return newArr;
}

我们还可以做一些小小的优化 
因为实际上第一次是不需要判断的 
数组元素的第一个值一定是首次出现的 
所以从数组的第二个元素开始循环就可以了

function unique(arr){
  var newArr = [arr[0]];
  var item;
  for(var i = 1, len = arr.length; i < len; i++){
    item = arr[i];
    if(arr.indexOf(item) === i){
      newArr.push(item);
    }
  }
  return newArr;
}

排序去邻

这种方法的原理就是首先调用数组的sort方法 
我们的目的不是给数组元素排序 
所以也不需要为sort添加处理函数 
目的是为了把相同的元素值聚在一起 
这样只需要判断数组元素值和上一个索引值不同就可以了

function unique(arr){
  var newArr = [arr[0]];
  var item;
  arr.sort();
  for(var i = 1, len = arr.length; i < len; i++){
    item = arr[i];
    if(item !== arr[i - 1]){
      newArr.push(item);
    }
  }
  return newArr;
}

优化遍历

这种方法看起来特别梦幻 
原理是不断的将数组最右边不重复的值推入新数组

function unique(arr){
  var newArr = [];
  for(var i = 0, len = arr.length; i < len; i++){
    for(var j = i + 1; j < len; j++){
      if(arr[i] === arr[j]){
        j = ++i;
      }
    }
    newArr.push(arr[i]);
  }
  return newArr;
};

说的再详细一下 
就是对数组的每一个元素都进行判断(指针i) 
还有另一个指针从判断元素的下一位进行判断 
移动这个指针(指针j下移) 
如果发现判断元素与指针指向的值相等 
证明该判断元素不是数组中唯一的 
那么就继续往下判断(指针i下移,指针j回到i的下一位) 
直到j移到数组终点 
证明判断元素(指针i指向的元素)是数组中唯一的 
推入新数组

临时对象

这种方法是很好的一种方法 
借用了一个临时对象的数据结构 
这个对象用来存储数组的元素

function unique(arr){
  var newArr = [];
  var temp = {};
  var item;
  for(var i = 0, len = arr.length; i < len; i++){
    item = arr[i];
    if(!temp[item]){
      temp[item] = true;
      newArr.push(item);
    }
  }
  return newArr;
}

这是典型的空间换取时间思想的算法 
如果数组很大可能会很占内存 
但是效率很高这是毋庸置疑的 
其实现在这个函数还是有缺点

var arr = [1,3,2,1,4,5,2,4,1,5,'1','2'];
console.log(unique(arr)); //[1,3,2,4,5]

从这个测试中可以看到数组和字符没能有效区分 
这是因为它们传入对象中会调用toString() 
对象的键都是字符串 
既然这样我们可以对函数做一些修改 
让对象的键对应一个数组 
数组存储着已有的类型

function unique(arr){
  var newArr = [];
  var temp = {};
  var item;
  var type;
  for(var i = 0, len = arr.length; i < len; i++){
    item = arr[i];
    type = typeof item;
    if(!temp[item]){
      temp[item] = [type];
      newArr.push(item);
    }else if(temp[item].indexOf(type) === -1){
      temp[item].push(type);
      newArr.push(item);
    }
  }
  return newArr;
}

这样内存占用更大了 
但是却更加严谨了

var arr = [1,3,2,1,4,5,2,4,1,5,'1','2'];
console.log(unique(arr)); //[1,3,2,4,5,"1","2"]

集合转换

集合这个数据结构最大的特点就是 
集合内部的元素都是唯一的 
ES6标准给我们提供了Set集合 
利用这个新的数据结构我们可以很容易的实现数组去重 
容易到什么程度呢? 
一行.. 
就够了

function unique(arr){
  return Array.from(new Set(arr));
}

这才是真正的简单粗暴 
将数组转为集合,抛弃多余数值 
最后利用ES6的新数组方法Array.from将集合转为数组返回


function unique(arr){returnArray.from(new Set(arr)); }

posted @ 2018-08-14 17:40  刘凌枫羽  阅读(209)  评论(0编辑  收藏  举报