Leetcode - 面试经典 150 题 - 删除排序数组中的重复项
题目:删除排序数组中的重复项
题目描述
给你一个非严格递增排列的数组 nums,请你原地删除重复出现的元素,使每个元素只出现一次,返回删除后数组的新长度。元素的相对顺序应该保持一致。然后返回 nums 中唯一元素的个数。考虑 nums 的唯一元素的数量为 k。去重后,返回唯一元素的数量 k。nums 的前 k 个元素应包含排序后的唯一数字。下标 k - 1 之后的剩余元素可以忽略。
判题标准:
系统会用下面的代码来测试你的题解,如果所有断言都通过,那么您的题解将被通过。
int[] nums = [...]; // 输入数组
int[] expectedNums = [...]; // 长度正确的期望答案
int k = removeDuplicates(nums); // 调用
assert k == expectedNums.length;
for (int i = 0; i < k; i++) {
assert nums[i] == expectedNums[i];
}
示例 1:
输入:nums = [1,1,2]
输出:2, nums = [1,2,_]
解释:函数应该返回新的长度 2 ,并且原数组 nums 的前两个元素被修改为 1, 2 。不需要考虑数组中超出新长度后面的元素。
示例 2:
输入:nums = [0,0,1,1,1,2,2,3,3,4]
输出:5, nums = [0,1,2,3,4,,,,,_]
解释:函数应该返回新的长度 5 , 并且原数组 nums 的前五个元素被修改为 0, 1, 2, 3, 4 。不需要考虑数组中超出新长度后面的元素。
提示:
1 <= nums.length <= 3 * 104
-100 <= nums[i] <= 100
nums 已按 非递减 顺序排列。
题解
双指针
思路
若数组长度为1,则直接返回1即可。
若数组长度大于1,由于其本身非严格递增,如果存在一个元素与其前面1个元素不同,则这个元素一定是在本次数组中第一次出现,因此只需要找到所有的符合该特征的 k 个元素,将其放到原数组的前 k 位,即可实现题目要求。
为此,设置两个指针,分别用于确定下一个填入位置和遍历数组所有元素,当遍历指针完成遍历后,填入指针指向所有非重复元素的后一个,刚好为非重复元素个数,即需要的返回值 k。
实现
class Solution:
def removeDuplicates(self, nums: List[int]) -> int:
if len(nums) == 1:
return 1
first, last = 1, 1
while last < len(nums):
if nums[last] != nums[last - 1]:
nums[first] = nums[last]
first += 1
last += 1
return first
上面是我完成改题目的代码,执行用时3ms,下面的实现可以达到0ms:
class Solution:
def removeDuplicates(self, nums: List[int]) -> int:
k = 1
for i in range(1, len(nums)):
if nums[i] != nums[i - 1]:
nums[k] = nums[i]
k += 1
return k
对比一下两种代码,发现主要差异在于 for 和 while 的使用,那为什么 for 就快于 while 呢?
核心原因在于底层实现:
-
while循环每次迭代都要显式检查条件,并且在循环体内手动递增索引。这种显式控制的方式导致解释器每次循环都要多执行一次条件判断语句,同时索引的递增和判断是分离的操作,多了一些字节码指令; -
for循环执行时,range在循环开始时就生成了一个高效的整数序列对象,同时其控制逻辑由C层实现(在CPython解释器中),而不是Python层,因此迭代和索引递增非常快。
总结来说,for 循环不需要执行边界检查和自增操作,因此效率明显好于 while 循环。可以尝试一下在 for 循环中加入边界检查和自增操作再次进行执行时间对比,具体的对比可以看这篇文章:Python 实现循环的最快方式(for、while 等速度对比)。
复杂度
-
时间复杂度:遍历一次数组,复杂度为
O(n); -
空间复杂度:只需维护指针,复杂度为
O(1)。

浙公网安备 33010602011771号