> 文章列表 > 哈希表题目:数组中重复的数据

哈希表题目:数组中重复的数据

哈希表题目:数组中重复的数据

文章目录

  • 题目
    • 标题和出处
    • 难度
    • 题目描述
      • 要求
      • 示例
      • 数据范围
  • 解法

题目

标题和出处

标题:数组中重复的数据

出处:442. 数组中重复的数据

难度

6 级

题目描述

要求

给你一个长度为 n\\texttt{n}n整数数组 nums\\texttt{nums}nums,其中 nums\\texttt{nums}nums 的所有整数都在范围 [1,n]\\texttt{[1, n]}[1, n] 内,且每个整数出现一次两次。请你找出所有出现两次的整数,并以数组形式返回。

你必须设计并实现一个时间复杂度为 O(n)\\texttt{O(n)}O(n) 且仅使用常量额外空间的算法解决此问题。

示例

示例 1:

输入:nums=[4,3,2,7,8,2,3,1]\\texttt{nums = [4,3,2,7,8,2,3,1]}nums = [4,3,2,7,8,2,3,1]
输出:[2,3]\\texttt{[2,3]}[2,3]

示例 2:

输入:nums=[1,1,2]\\texttt{nums = [1,1,2]}nums = [1,1,2]
输出:[1]\\texttt{[1]}[1]

示例 3:

输入:nums=[1]\\texttt{nums = [1]}nums = [1]
输出:[]\\texttt{[]}[]

数据范围

  • n=nums.length\\texttt{n} = \\texttt{nums.length}n=nums.length
  • 1≤n≤105\\texttt{1} \\le \\texttt{n} \\le \\texttt{10}^\\texttt{5}1n105
  • 1≤nums[i]≤n\\texttt{1} \\le \\texttt{nums[i]} \\le \\texttt{n}1nums[i]n
  • nums\\texttt{nums}nums 中的每个元素出现一次两次

解法

思路和算法

这道题要求找出数组 nums\\textit{nums}nums 中的所有出现两次的整数并返回。常规的做法是使用哈希表存储数组中的整数,遍历数组并将每个整数存入哈希表,如果遍历到一个元素时发现该元素已经在哈希表中,则该元素是出现两次的整数。对于长度为 nnn 的数组,使用哈希表的时间复杂度是 O(n)O(n)O(n),符合题目要求,但是空间复杂度是 O(n)O(n)O(n),不符合题目要求的常数空间。

为了将空间复杂度降低到常数,不能额外创建哈希表,只能原地修改数组。由于数组 nums\\textit{nums}nums 的长度是 nnn,下标范围是 [0,n−1][0, n - 1][0,n1],每个元素都在范围 [1,n][1, n][1,n] 内,因此可以将数组看成哈希表,利用数组下标的信息表示每个整数是否出现两次。对于下标 index\\textit{index}index,满足 0≤index<n0 \\le \\textit{index} < n0index<n1≤index+1≤n1 \\le \\textit{index} + 1 \\le n1index+1nnums[index]\\textit{nums}[\\textit{index}]nums[index] 可以用于表示整数 index+1\\textit{index} + 1index+1 是否出现两次。

遍历数组 nums\\textit{nums}nums。对于元素 num\\textit{num}num,其对应的下标为 index=∣num∣−1\\textit{index} = |\\textit{num}| - 1index=num1,根据 nums[index]\\textit{nums}[\\textit{index}]nums[index] 的正负性执行如下操作:

  • 如果 nums[index]>0\\textit{nums}[\\textit{index}] > 0nums[index]>0,则将 nums[index]\\textit{nums}[\\textit{index}]nums[index] 的值更新为其相反数;

  • 如果 nums[index]<0\\textit{nums}[\\textit{index}] < 0nums[index]<0,则 ∣nums∣=index+1|\\textit{nums}| = \\textit{index} + 1nums=index+1 是出现两次的整数,将其添加到结果中。

上述做法的原理如下:

  1. 初始时数组 nums\\textit{nums}nums 中的整数都是正数,表示尚未被访问;

  2. 当一个整数被访问时,如果该整数对应的下标处的元素是正数,则该整数尚未被访问,因此将该整数对应的下标处的元素改成其相反数,相反数是负数,表示被访问了一次;

  3. 当一个整数被访问时,如果该整数对应的下标处的元素是负数,则该整数已经被访问,因此该整数被第二次访问,即该整数是出现两次的整数。

需要注意的是,遍历数组 nums\\textit{nums}nums 的过程中,遍历到的元素 num\\textit{num}num 可能已经被改成负数,因此在计算下标 index\\textit{index}index 时需要对 num\\textit{num}num 取绝对值然后减 111

代码

class Solution {public List<Integer> findDuplicates(int[] nums) {List<Integer> duplicates = new ArrayList<Integer>();int n = nums.length;for (int i = 0; i < n; i++) {int num = nums[i];int index = Math.abs(num) - 1;if (nums[index] > 0) {nums[index] = -nums[index];} else {duplicates.add(index + 1);}}return duplicates;}
}

复杂度分析

  • 时间复杂度:O(n)O(n)O(n),其中 nnn 是数组 nums\\textit{nums}nums 的长度。需要遍历数组 nums\\textit{nums}nums 一次,对于每个元素的操作时间都是 O(1)O(1)O(1)

  • 空间复杂度:O(1)O(1)O(1)。由于是原地修改数组,因此额外使用的空间是常数。注意返回值不计入空间复杂度。