如何在Java中查找流中的重复元素


查找数据流中的重复元素是Java面试和许多学生考试中常见的题目。Java提供了多种查找重复元素的方法,我们将主要关注两种方法:第一种是使用Java集合框架的Set,另一种是使用流的内置方法Collections.frequency()。

Java程序:查找流中的重复元素

在讨论从数据集合中获取重复项的不同方法之前,有必要首先讨论filter()方法。它将成为示例程序的关键部分。

filter()

它允许我们根据指定的条件筛选流中的元素。它是高阶函数的一部分,用于对流项应用某种行为。此方法接受一个谓词作为参数,并返回与谓词匹配的元素列表。

语法

                
filter(predicate);

使用Java集合框架的Set

它是Java集合接口的子接口,不允许重复值。它与数学集合非常相似。我们可以使用add()方法,它只将不同的元素添加到集合中。要使用Set接口的属性,我们需要使用实现此接口的HashSet类。

示例

以下示例说明了在流中查找重复元素时Set接口的使用。

方法

  • 使用Arrays.asList()方法创建一个列表来存储固定大小的列表。

  • 然后,使用HashSet类定义一个Set来存储仅有的不同元素。

  • 现在,使用filter()方法以及stream()和forEach()来仅筛选出重复项。这里,stream()指定以流的形式输入,我们将使用forEach()迭代并打印重复元素。

import java.util.*;
public class Duplicate {
   public static void main(String []args) {
      // create a list with duplicate items
      List<Integer> itemsList = Arrays.asList(10, 12, 10, 33, 40, 40, 61, 61);
      // declaring a new Set 
      Set<Integer> newitemSet = new HashSet<>();
      System.out.println("The list of duplicate Items: ");
      itemsList.stream() // converting list to stream
         .filter(nums -> !newitemSet.add(nums)) // to filter out the elementsthat are not added to the set
         .forEach(System.out::println); // print the duplicates
   }
}

输出

The list of duplicate Items: 
10
40
61

使用Collections.frequency()方法

从流或集合中筛选重复元素的另一种最简单的方法是使用'java.util'包的Collections.frequency()方法,该方法用于返回指定集合中元素的总数。

语法

Collections.frequency(nameOfCollection, obj);

这里,

nameOfCollection表示流,obj表示需要确定其频率的元素。

示例

在下面的示例中,我们将使用Collections.frequency()方法来计算流中每个元素出现的次数,然后返回出现次数超过一次的元素。我们将打印重复元素的完整出现列表及其计数。

import java.util.*;
public class FindDuplicates {
   public static void main(String[] args) {
      // create a list with duplicate items
      List<Integer> itemslist = Arrays.asList(10, 12, 10, 10, 33, 40, 40, 61, 61);
      System.out.println("The list of duplicate Items with frequency: ");
      itemslist.stream() // converting list to stream 
         .filter(itr -> Collections.frequency(itemslist, itr) > 1) // checking the frequency of duplicate items
         .forEach(System.out::println); // printing the frequency of duplicate items
      System.out.println("Count of duplicate items: ");    
      // to count the duplicate items    
      System.out.println(itemslist.stream()
       .filter(itr -> Collections.frequency(itemslist, itr) > 1)
       .count());
    }
}

输出

The list of duplicate Items with frequency: 
10
10
10
40
40
61
61
Count of duplicate items: 
7

示例

这是一个另一个示例,我们将同时使用Set接口和Collections.frequency()方法来获取重复元素。Collections.frequency()方法将计算流中每个元素出现的次数,然后将计数大于一的元素收集到Set中以去除重复项。结果Set将只包含流中的重复元素。

import java.util.stream.*;
import java.util.*;
public class FindDuplicates {
   public static void main(String[] args) {
      // create a list with duplicate items
      List<Integer> itemslist = Arrays.asList(10, 12, 10, 10, 33,40, 40, 61, 61);
      // set to store duplicate items
      Set<Integer> duplicates = itemslist.stream()
         .filter(itr -> Collections.frequency(itemslist, itr) > 1) // checking the frequency of duplicate items
         .collect(Collectors.toSet()); // adding only duplicate items to set
      // printing the duplicate items    
      System.out.println("The list of duplicate Items:" + duplicates); 
   }
}

输出

The list of duplicate Items:[40, 10, 61]

结论

在本节中,我们将总结以上示例和概念的一些要点。我们可以使用filter()方法从数据集合中筛选出特定类型的元素。它在后台工作,通过对每个元素应用谓词。Set接口能够仅存储不同的元素,这使其成为此任务的绝佳选择。

更新于:2023年7月19日

10K+ 浏览量

启动您的职业生涯

完成课程获得认证

开始学习
广告