打印两个给定句子中所有不重复的单词
在本教程中,我们将识别并打印两个给定句子中所有不重复的单词。不重复的单词是指在两个句子中只出现一次的单词,这意味着它们不会在另一个句子中重复出现。这项任务涉及对输入句子的分析、单个单词的识别以及跨两个句子比较它们以查找哪些单词只出现一次。输出应为所有此类单词的列表。这项任务可以通过各种编程方法来完成,例如使用循环、数组或字典。
方法
以下是打印两个给定句子中所有不重复单词的两种方法:
方法 1:使用字典
方法 2:使用集合
方法 1:使用字典
使用字典,统计每个单词在两个短语中出现的次数。然后,我们可以遍历字典并打印所有只出现一次的单词。C++ 中的字典函数通常用于输出两个指定句子中所有不重复的单词。此方法包括使用字典或哈希表数据结构存储两个短语中每个单词的频率。然后,我们可以迭代地遍历字典并打印出只出现一次的术语。
语法
这是在 C++ 中使用字典方法打印两个给定句子中所有不重复单词的语法,不包含实际代码:
声明一个字典来存储单词频率
map<string, int> freqDict;
将两个句子作为字符串输入
string sentence1 = "first sentence"; string sentence2 = "second sentence";
将句子拆分成单词并将它们插入字典
istringstream iss (sentence1 + " " + sentence2); string word; while (iss >> word) { freqDict[word]++; }
遍历字典并打印不重复的单词
for (const auto& [word, frequency]: freqDict) { if (frequency == 1) { cout << word << " "; } }
算法
在 C++ 中,以下是使用字典方法打印两个指定句子中所有不重复术语的分步技术:
步骤 1 - 创建两个字符串 s1 和 s2,其中包含句子。
步骤 2 - 声明空的无序映射 string, int> dict 来记录句子中每个单词的频率。
步骤 3 - 使用 C++ 的字符串流类,解析这两个短语以提取单个单词。
步骤 4 - 对于每个提取的单词,检查它是否出现在 dict 中。如果出现,则将其频率增加一。否则,将其添加到 dict 中,频率为 1。
步骤 5 - 处理完两个句子后,遍历 dict 并显示所有频率为一的术语。这些是不重复的单词。
步骤 6 - 此方法的时间复杂度为 O(n),
示例 1
此代码使用无序映射来存储组合短语中每个单词的频率。然后,它循环遍历映射,将每个只出现一次的单词添加到不重复单词的向量中。最后,它发布不重复的单词。此示例暗示两个句子是硬编码到程序中的,而不是由用户输入的。
#include <iostream> #include <string> #include <unordered_map> #include <sstream> #include <vector> using namespace std; vector<string> getNonRepeatingWords(string sentence1, string sentence2) { // Combine the two sentences into a single string string combined = sentence1 + " " + sentence2; // Create a map to store the frequency of each word unordered_map<string, int> wordFreq; // Use a string stream to extract each word from the combined string stringstream ss(combined); string word; while (ss >> word) { // Increment the frequency of the word in the map wordFreq[word]++; } // Create a vector to store the non-repeating words vector<string> nonRepeatingWords; for (auto& pair : wordFreq) { if (pair.second == 1) { nonRepeatingWords.push_back(pair.first); } } return nonRepeatingWords; } int main() { string sentence1 = "The quick brown fox jumps over the lazy dog"; string sentence2 = "A quick brown dog jumps over a lazy fox"; vector<string> nonRepeatingWords = getNonRepeatingWords(sentence1, sentence2); // Print the non-repeating words for (auto& word : nonRepeatingWords) { cout << word << " "; } cout << endl; return 0; }
输出
a A the The
方法 2:使用集合
此策略包括使用集合来查找在两个短语中只出现一次的术语。我们可以为每个短语构建术语集合,然后识别这些集合的交集。最后,我们可以遍历交集集合并输出所有只出现一次的术语。
集合是一个关联容器,它按排序顺序保持不同的元素。我们可以将两个短语中的术语插入到集合中,任何重复项都将自动删除。
语法
当然!以下是在 Python 中使用的语法,用于打印两个给定句子中所有不重复的单词:
将两个句子定义为字符串
sentence1 = "The fox jumps over dog" sentence2 = "A dog jumps over fox"
将每个句子拆分成单词列表
words1 = sentence1.split() words2 = sentence2.split()
从两个单词列表创建集合
set1 = set(words1) set2 = set(words2)
通过取集合的交集来查找不重复的单词
Nonrepeating = set1.symmetric_difference(set2)
打印不重复的单词
for word in non-repeating: print(word)
算法
按照以下说明使用 C++ 中的集合函数输出两个给定句子中所有不重复的单词:
步骤 1 - 创建两个字符串变量来存储两个句子。
步骤 2 - 使用字符串流库,将每个句子拆分成独立的单词,并将它们存储在两个单独的数组中。
步骤 3 - 创建两个集合,每个句子一个,用于存储唯一的单词。
步骤 4 - 遍历每个单词数组并将每个单词插入到正确的集合中。
步骤 5 - 遍历每个集合并打印出不重复的单词。
示例 2
在此代码中,我们使用字符串流库将每个句子拆分成单独的单词。然后,我们使用两个集合 uniqueWords1 和 uniqueWords2 来存储每个句子中唯一的单词。最后,我们遍历每个集合并打印出不重复的单词。
#include <iostream> #include <string> #include <sstream> #include <set> using namespace std; int main() { string sentence1 = "This is the first sentence."; string sentence2 = "This is the second sentence."; string word; stringstream ss1(sentence1); stringstream ss2(sentence2); set<string> uniqueWords1; set<string> uniqueWords2; while (ss1 >> word) { uniqueWords1.insert(word); } while (ss2 >> word) { uniqueWords2.insert(word); } cout << "Non-repeating words in sentence 1:" << endl; for (const auto& w : uniqueWords1) { if (uniqueWords2.find(w) == uniqueWords2.end()) { cout << w << " "; } } cout << endl; cout << "Non-repeating words in sentence 2:" << endl; for (const auto& w : uniqueWords2) { if (uniqueWords1.find(w) == uniqueWords1.end()) { cout << w << " "; } } cout << endl; return 0; }
输出
Non-repeating words in sentence 1: first Non-repeating words in sentence 2: second
结论
总之,打印两个给定句子中所有不重复单词的任务是使用各种编程方法实现的,例如将句子分解成单个单词,使用字典来量化每个单词的频率,以及过滤出不重复的单词。生成的非重复单词集合可以报告到控制台,也可以保存在列表或数组中以供进一步使用。这项工作对于基本的编程文本操作和数据结构操作是有益的练习。