Java程序：移除给定栈中的重复元素

在本文中，我们将探讨两种在Java中从栈中移除重复元素的方法。我们将比较使用**嵌套循环**的直接方法和使用HashSet的更高效的方法。目标是演示如何优化重复元素移除并评估每种方法的性能。

问题陈述

编写一个Java程序，从栈中移除重复元素。

输入

Stack<Integer> data = initData(10L);

输出

Unique elements using Naive Approach: [1, 4, 3, 2, 8, 7, 5]
Time spent for Naive Approach: 18200 nanoseconds

Unique elements using Optimized Approach: [1, 4, 3, 2, 8, 7, 5]
Time spent for Optimized Approach: 34800 nanoseconds

要从给定栈中移除重复元素，我们有两种方法：

朴素方法：创建两个**嵌套循环**来查看哪些元素已经存在，并阻止将它们添加到结果栈中。
HashSet方法：使用Set存储唯一元素，并利用其**O(1)复杂度**来检查元素是否存在。

生成和克隆随机栈

下面的Java程序首先构建一个随机栈，然后创建它的副本以供进一步使用：

private static Stack initData(Long size) {
    Stack stack = new Stack < > ();
    Random random = new Random();
    int bound = (int) Math.ceil(size * 0.75);
    for (int i = 0; i < size; ++i) {
        stack.add(random.nextInt(bound) + 1);
    }
    return stack;
}

private static Stack < Integer > manualCloneStack(Stack < Integer > stack) {
    Stack < Integer > newStack = new Stack < > ();
    for (Integer item: stack) {
        newStack.push(item);
    }
    return newStack;
}

initData 用于创建一个指定大小的栈，其中包含1到100之间的随机元素。

manualCloneStack 通过复制另一个栈中的数据来生成数据，用于比较两种方法的性能。

使用朴素方法从给定栈中移除重复元素

以下是使用朴素方法从给定栈中移除重复元素的步骤：

启动计时器。
创建一个空栈来存储唯一元素。
使用while循环迭代，直到原始栈为空，弹出顶部元素。
使用resultStack.contains(element)检查重复项，查看元素是否已在结果栈中。
如果元素不在结果栈中，则将其添加到resultStack。
记录结束时间并计算总花费时间。
返回结果

示例

以下是使用朴素方法从给定栈中移除重复元素的Java程序：

public static Stack idea1(Stack stack) {
  long start = System.nanoTime();
  Stack resultStack = new Stack < > ();

  while (!stack.isEmpty()) {
    int element = stack.pop();
    if (!resultStack.contains(element)) {
      resultStack.add(element);
    }
  }
  System.out.println("Time spent for idea1 is %d nanosecond".formatted(System.nanoTime() - start));
  return resultStack;
}

对于朴素方法，我们使用

while (!stack.isEmpty())

处理第一个循环遍历栈中的所有元素，第二个循环

 resultStack.contains(element)

用于检查元素是否已存在。

使用优化方法（HashSet）从给定栈中移除重复元素

以下是使用优化方法从给定栈中移除重复元素的步骤：

启动计时器
创建一个Set来跟踪已查看的元素（用于O(1)复杂度检查）。
创建一个临时栈来存储唯一元素。
使用while循环迭代，直到栈为空。
从栈中移除顶部元素。
为了检查重复项，我们将使用seen.contains(element)来检查元素是否已在集合中。
如果元素不在集合中，则将其添加到seen和临时栈中。
记录结束时间并计算总花费时间。
返回结果

示例

以下是使用HashSet从给定栈中移除重复元素的Java程序：

public static Stack<Integer> idea2(Stack<Integer> stack) {
    long start = System.nanoTime();
    Set<Integer> seen = new HashSet<>();
    Stack<Integer> tempStack = new Stack<>();

    while (!stack.isEmpty()) {
        int element = stack.pop();
        if (!seen.contains(element)) {
            seen.add(element);
            tempStack.push(element);
        }
    }
    System.out.println("Time spent for idea2 is %d nanosecond".formatted(System.nanoTime() - start));
    return tempStack;
}

对于优化方法，我们使用

Set<Integer> seen

在Set中存储唯一元素，利用访问随机元素时的**O(1)复杂度**来减少检查元素是否存在时的计算成本。

结合使用两种方法

以下是使用上述两种方法从给定栈中移除重复元素的步骤：

初始化数据，我们使用initData(Long size)方法创建一个填充有随机整数的栈。
克隆栈，我们使用cloneStack(Stack stack)方法创建原始栈的精确副本。
使用initData生成初始栈。
使用cloneStack克隆此栈。
对原始栈应用朴素方法以移除重复元素。
对克隆栈应用优化方法以移除重复元素。
显示每种方法花费的时间以及两种方法产生的唯一元素。

示例

以下是使用上述两种方法从栈中移除重复元素的Java程序：

import java.util.HashSet;
import java.util.Random;
import java.util.Set;
import java.util.Stack;

public class DuplicateStackElements {
    private static Stack<Integer> initData(Long size) {
        Stack<Integer> stack = new Stack<>();
        Random random = new Random();
        int bound = (int) Math.ceil(size * 0.75);
        for (int i = 0; i < size; ++i) {
            stack.add(random.nextInt(bound) + 1);
        }
        return stack;
    }
    private static Stack<Integer> cloneStack(Stack<Integer> stack) {
        Stack<Integer> newStack = new Stack<>();
        newStack.addAll(stack);
        return newStack;
    }
    public static Stack<Integer> idea1(Stack<Integer> stack) {
        long start = System.nanoTime();
        Stack<Integer> resultStack = new Stack<>();

        while (!stack.isEmpty()) {
            int element = stack.pop();
            if (!resultStack.contains(element)) {
                resultStack.add(element);
            }
        }
        System.out.printf("Time spent for idea1 is %d nanoseconds%n", System.nanoTime() - start);
        return resultStack;
    }
    public static Stack<Integer> idea2(Stack<Integer> stack) {
        long start = System.nanoTime();
        Set<Integer> seen = new HashSet<>();
        Stack<Integer> tempStack = new Stack<>();

        while (!stack.isEmpty()) {
            int element = stack.pop();
            if (!seen.contains(element)) {
                seen.add(element);
                tempStack.push(element);
            }
        }
        System.out.printf("Time spent for idea2 is %d nanoseconds%n", System.nanoTime() - start);
        return tempStack;
    }
    public static void main(String[] args) {
        Stack<Integer> data1 = initData(10L);
        Stack<Integer> data2 = cloneStack(data1);
        System.out.println("Unique elements using idea1: " + idea1(data1));
        System.out.println("Unique elements using idea2: " + idea2(data2));
    }
}

输出

比较

* 测量单位为纳秒。

public static void main(String[] args) {
    Stack<Integer> data1 = initData(<number of stack size want to test>);
    Stack<Integer> data2 = manualCloneStack(data1);
    idea1(data1);
    idea2(data2);
}

方法	100个元素	1000个元素	10000个元素	100000个元素	1000000个元素
方法1	693100	4051600	19026900	114201800	1157256000
方法2	135800	681400	2717800	11489400	36456100

如观察到的，方法2的运行时间短于方法1，因为方法1的复杂度为O(n²) ，而方法2的复杂度为O(n)。因此，当栈的数量增加时，计算所花费的时间也会相应增加。

Anh Tran Tuan

更新于：2024年8月14日

208 次浏览

开启你的职业生涯

完成课程获得认证

开始学习