如何在Java中查找流中的重复元素
查找数据流中的重复元素是Java面试和许多学生考试中常见的题目。Java提供了多种查找重复元素的方法,我们将主要关注两种方法:第一种是使用Java集合框架的Set,另一种是使用流的内置方法Collections.frequency()。
Java程序:查找流中的重复元素
在讨论从数据集合中获取重复项的不同方法之前,有必要首先讨论filter()方法。它将成为示例程序的关键部分。
filter()
它允许我们根据指定的条件筛选流中的元素。它是高阶函数的一部分,用于对流项应用某种行为。此方法接受一个谓词作为参数,并返回与谓词匹配的元素列表。
语法
filter(predicate);
使用Java集合框架的Set
它是Java集合接口的子接口,不允许重复值。它与数学集合非常相似。我们可以使用add()方法,它只将不同的元素添加到集合中。要使用Set接口的属性,我们需要使用实现此接口的HashSet类。
示例
以下示例说明了在流中查找重复元素时Set接口的使用。
方法
使用Arrays.asList()方法创建一个列表来存储固定大小的列表。
然后,使用HashSet类定义一个Set来存储仅有的不同元素。
现在,使用filter()方法以及stream()和forEach()来仅筛选出重复项。这里,stream()指定以流的形式输入,我们将使用forEach()迭代并打印重复元素。
import java.util.*; public class Duplicate { public static void main(String []args) { // create a list with duplicate items List<Integer> itemsList = Arrays.asList(10, 12, 10, 33, 40, 40, 61, 61); // declaring a new Set Set<Integer> newitemSet = new HashSet<>(); System.out.println("The list of duplicate Items: "); itemsList.stream() // converting list to stream .filter(nums -> !newitemSet.add(nums)) // to filter out the elementsthat are not added to the set .forEach(System.out::println); // print the duplicates } }
输出
The list of duplicate Items: 10 40 61
使用Collections.frequency()方法
从流或集合中筛选重复元素的另一种最简单的方法是使用'java.util'包的Collections.frequency()方法,该方法用于返回指定集合中元素的总数。
语法
Collections.frequency(nameOfCollection, obj);
这里,
nameOfCollection表示流,obj表示需要确定其频率的元素。
示例
在下面的示例中,我们将使用Collections.frequency()方法来计算流中每个元素出现的次数,然后返回出现次数超过一次的元素。我们将打印重复元素的完整出现列表及其计数。
import java.util.*; public class FindDuplicates { public static void main(String[] args) { // create a list with duplicate items List<Integer> itemslist = Arrays.asList(10, 12, 10, 10, 33, 40, 40, 61, 61); System.out.println("The list of duplicate Items with frequency: "); itemslist.stream() // converting list to stream .filter(itr -> Collections.frequency(itemslist, itr) > 1) // checking the frequency of duplicate items .forEach(System.out::println); // printing the frequency of duplicate items System.out.println("Count of duplicate items: "); // to count the duplicate items System.out.println(itemslist.stream() .filter(itr -> Collections.frequency(itemslist, itr) > 1) .count()); } }
输出
The list of duplicate Items with frequency: 10 10 10 40 40 61 61 Count of duplicate items: 7
示例
这是一个另一个示例,我们将同时使用Set接口和Collections.frequency()方法来获取重复元素。Collections.frequency()方法将计算流中每个元素出现的次数,然后将计数大于一的元素收集到Set中以去除重复项。结果Set将只包含流中的重复元素。
import java.util.stream.*; import java.util.*; public class FindDuplicates { public static void main(String[] args) { // create a list with duplicate items List<Integer> itemslist = Arrays.asList(10, 12, 10, 10, 33,40, 40, 61, 61); // set to store duplicate items Set<Integer> duplicates = itemslist.stream() .filter(itr -> Collections.frequency(itemslist, itr) > 1) // checking the frequency of duplicate items .collect(Collectors.toSet()); // adding only duplicate items to set // printing the duplicate items System.out.println("The list of duplicate Items:" + duplicates); } }
输出
The list of duplicate Items:[40, 10, 61]
结论
在本节中,我们将总结以上示例和概念的一些要点。我们可以使用filter()方法从数据集合中筛选出特定类型的元素。它在后台工作,通过对每个元素应用谓词。Set接口能够仅存储不同的元素,这使其成为此任务的绝佳选择。