Java程序:移除给定栈中的重复元素
在本文中,我们将探讨两种在Java中从栈中移除重复元素的方法。我们将比较使用**嵌套循环**的直接方法和使用HashSet的更高效的方法。目标是演示如何优化重复元素移除并评估每种方法的性能。
问题陈述
编写一个Java程序,从栈中移除重复元素。
输入
Stack<Integer> data = initData(10L);
输出
Unique elements using Naive Approach: [1, 4, 3, 2, 8, 7, 5] Time spent for Naive Approach: 18200 nanoseconds Unique elements using Optimized Approach: [1, 4, 3, 2, 8, 7, 5] Time spent for Optimized Approach: 34800 nanoseconds
要从给定栈中移除重复元素,我们有两种方法:
生成和克隆随机栈
下面的Java程序首先构建一个随机栈,然后创建它的副本以供进一步使用:
private static Stack initData(Long size) {
Stack stack = new Stack < > ();
Random random = new Random();
int bound = (int) Math.ceil(size * 0.75);
for (int i = 0; i < size; ++i) {
stack.add(random.nextInt(bound) + 1);
}
return stack;
}
private static Stack < Integer > manualCloneStack(Stack < Integer > stack) {
Stack < Integer > newStack = new Stack < > ();
for (Integer item: stack) {
newStack.push(item);
}
return newStack;
}
initData 用于创建一个指定大小的栈,其中包含1到100之间的随机元素。
manualCloneStack 通过复制另一个栈中的数据来生成数据,用于比较两种方法的性能。
使用朴素方法从给定栈中移除重复元素
以下是使用朴素方法从给定栈中移除重复元素的步骤:
- 启动计时器。
- 创建一个空栈来存储唯一元素。
- 使用while循环迭代,直到原始栈为空,弹出顶部元素。
- 使用resultStack.contains(element)检查重复项,查看元素是否已在结果栈中。
- 如果元素不在结果栈中,则将其添加到resultStack。
- 记录结束时间并计算总花费时间。
- 返回结果
示例
以下是使用朴素方法从给定栈中移除重复元素的Java程序:
public static Stack idea1(Stack stack) {
long start = System.nanoTime();
Stack resultStack = new Stack < > ();
while (!stack.isEmpty()) {
int element = stack.pop();
if (!resultStack.contains(element)) {
resultStack.add(element);
}
}
System.out.println("Time spent for idea1 is %d nanosecond".formatted(System.nanoTime() - start));
return resultStack;
}
对于朴素方法,我们使用
while (!stack.isEmpty())处理第一个循环遍历栈中的所有元素,第二个循环 resultStack.contains(element)
用于检查元素是否已存在。使用优化方法(HashSet)从给定栈中移除重复元素
以下是使用优化方法从给定栈中移除重复元素的步骤:
- 启动计时器
- 创建一个Set来跟踪已查看的元素(用于O(1)复杂度检查)。
- 创建一个临时栈来存储唯一元素。
- 使用while循环迭代,直到栈为空。
- 从栈中移除顶部元素。
- 为了检查重复项,我们将使用seen.contains(element)来检查元素是否已在集合中。
- 如果元素不在集合中,则将其添加到seen和临时栈中。
- 记录结束时间并计算总花费时间。
- 返回结果
示例
以下是使用HashSet从给定栈中移除重复元素的Java程序:
public static Stack<Integer> idea2(Stack<Integer> stack) {
long start = System.nanoTime();
Set<Integer> seen = new HashSet<>();
Stack<Integer> tempStack = new Stack<>();
while (!stack.isEmpty()) {
int element = stack.pop();
if (!seen.contains(element)) {
seen.add(element);
tempStack.push(element);
}
}
System.out.println("Time spent for idea2 is %d nanosecond".formatted(System.nanoTime() - start));
return tempStack;
}
对于优化方法,我们使用
Set<Integer> seen在Set中存储唯一元素,利用访问随机元素时的**O(1)复杂度**来减少检查元素是否存在时的计算成本。
结合使用两种方法
以下是使用上述两种方法从给定栈中移除重复元素的步骤:
- 初始化数据,我们使用initData(Long size)方法创建一个填充有随机整数的栈。
- 克隆栈,我们使用cloneStack(Stack stack)方法创建原始栈的精确副本。
- 使用initData生成初始栈。
- 使用cloneStack克隆此栈。
- 对原始栈应用朴素方法以移除重复元素。
- 对克隆栈应用优化方法以移除重复元素。
- 显示每种方法花费的时间以及两种方法产生的唯一元素。
示例
以下是使用上述两种方法从栈中移除重复元素的Java程序:
import java.util.HashSet;
import java.util.Random;
import java.util.Set;
import java.util.Stack;
public class DuplicateStackElements {
private static Stack<Integer> initData(Long size) {
Stack<Integer> stack = new Stack<>();
Random random = new Random();
int bound = (int) Math.ceil(size * 0.75);
for (int i = 0; i < size; ++i) {
stack.add(random.nextInt(bound) + 1);
}
return stack;
}
private static Stack<Integer> cloneStack(Stack<Integer> stack) {
Stack<Integer> newStack = new Stack<>();
newStack.addAll(stack);
return newStack;
}
public static Stack<Integer> idea1(Stack<Integer> stack) {
long start = System.nanoTime();
Stack<Integer> resultStack = new Stack<>();
while (!stack.isEmpty()) {
int element = stack.pop();
if (!resultStack.contains(element)) {
resultStack.add(element);
}
}
System.out.printf("Time spent for idea1 is %d nanoseconds%n", System.nanoTime() - start);
return resultStack;
}
public static Stack<Integer> idea2(Stack<Integer> stack) {
long start = System.nanoTime();
Set<Integer> seen = new HashSet<>();
Stack<Integer> tempStack = new Stack<>();
while (!stack.isEmpty()) {
int element = stack.pop();
if (!seen.contains(element)) {
seen.add(element);
tempStack.push(element);
}
}
System.out.printf("Time spent for idea2 is %d nanoseconds%n", System.nanoTime() - start);
return tempStack;
}
public static void main(String[] args) {
Stack<Integer> data1 = initData(10L);
Stack<Integer> data2 = cloneStack(data1);
System.out.println("Unique elements using idea1: " + idea1(data1));
System.out.println("Unique elements using idea2: " + idea2(data2));
}
}
输出

比较
* 测量单位为纳秒。
public static void main(String[] args) {
Stack<Integer> data1 = initData(<number of stack size want to test>);
Stack<Integer> data2 = manualCloneStack(data1);
idea1(data1);
idea2(data2);
}
| 方法 | 100个元素 | 1000个元素 | 10000个元素 |
100000个元素 |
1000000个元素 |
| 方法1 | 693100 |
4051600 |
19026900 |
114201800 |
1157256000 |
| 方法2 | 135800 |
681400 |
2717800 |
11489400 |
36456100 |
如观察到的,方法2的运行时间短于方法1,因为方法1的复杂度为O(n²) ,而方法2的复杂度为O(n)。因此,当栈的数量增加时,计算所花费的时间也会相应增加。
广告
数据结构
网络
RDBMS
操作系统
Java
iOS
HTML
CSS
Android
Python
C语言编程
C++
C#
MongoDB
MySQL
Javascript
PHP