执行给定操作后不同可能字符串的计数

确定通过对字符串执行一组给定操作可以获得的唯一字符串的数量是计算机科学和数学中的一个常见挑战。可以对字符串执行多种操作，包括字符删除、交换或字符串反转。目标是计算通过这些操作可以实现的不同输出字符串的总数，而不管其顺序如何。解决此问题的技术包括动态规划、递归和组合数学等——具体取决于所执行的特定操作的性质。

方法

为了计算执行给定操作后不同的可能字符串，可以使用以下方法：

暴力法。
集合法。
动态规划。
组合方法。

方法 1：暴力法

此函数允许您创建任何可能通过执行指定过程而产生的字符串。然后，计算获得的不同字符串的总数。对于大型输入，此方法可能很耗时且效率低下。

语法

此方法可以遵循以下步骤：

string_count = 0
for operation_combination in all_possible_combinations(operations_list):
   new_string = apply_operations(original_string, operation_combination)
   if is_distinct(new_string):
   string_count += 1
return string_count

算法

步骤 1 - 从头创建一个集合来保存不同的字符串。

步骤 2 - 生成每个可以通过给定过程生成的可能字符串。

步骤 3 - 验证每个生成的字符串是否已存在于不同字符串的集合中。

步骤 4 - 如果字符串不在集合中，则需要将其添加到集合中。

步

骤 5 - 继续执行步骤 2-4，直到创建并验证了每个可能的字符串。

步骤 6 - 将不同可能字符串的数量作为唯一字符串集合的长度返回。

示例 1

我们有一个 C++ 的暴力法示例：

在此示例中，我们将从将输入字符串 s 作为向量的起始值开始。通过更改向量中每个字符串中的字符来执行给定的操作。我们重复此过程 k 次，将生成的每个字符串存储在向量中。最后，我们使用 unique 函数对向量进行排序并确定有多少个不同的字符串。结果作为最终计数返回。

#include <iostream>
#include <string>
#include <vector>
#include <algorithm>
using namespace std;
int countDistinctStrings(string s, int n, int k) {
   vector<string> v;
   v.push_back(s);
   for(int i=0; i<k; i++) {
      int len = v.size();
      for(int j=0; j<len; j++) {
        string temp = v[j];
         for(int x=0; x<n; x++) {
            for(int y=x+1; y<n; y++) {
               if(temp[x] != temp[y]) {
                  swap(temp[x], temp[y]);
                  v.push_back(temp);
                  swap(temp[x], temp[y]);
              }
            }
         }
      }
   }
   sort(v.begin(), v.end());
   int cnt = unique(v.begin(), v.end()) - v.begin();
   return cnt;
} 
int main() {
   string s = "abb";
   int n = s.length();
   int k = 2;
   int ans = countDistinctStrings(s, n, k);
   cout << "Distinct strings after " << k << " operations: " << ans << endl;
   return 0;
}

输出

Distinct strings after 2 operations: 3

方法 2：集合法

在此方法中，可以通过执行指定过程获得的所有不同字符串都可以存储在一个集合中。如果生成的字符串不存在，则可以将其添加到集合中。可以通过计算集合的大小来确定创建每个可能的字符串后不同字符串的数量。

语法

在此方法中，计算执行给定操作后不同的可能字符串，语法通常包含以下步骤：

初始化一个空集来存储不同的字符串。

distinct_strings = set ()

通过将给定操作应用于原始字符串来生成所有可能的字符串。

def generate_strings(original_string, operations):
return new_strings

将每个生成的字符串添加到集合中以确保唯一性。

for string in generate_strings(original_string, operations):
   distinct_strings.add(string)

最后，检索不同字符串的数量。

count = len(distinct_strings)

这种基于集合的解决方案利用了集合自动消除重复项的特殊能力，从而只存储不同的字符串。在将指定过程应用于原始字符串后，您可以使用此方法有效地计算许多可能的字符串。

算法

步骤 1 - 创建一个名为“distinct_strings”的集合，用于保存所有可获得的不同字符串。

步骤 2 - 将初始字符串 S 包含在集合中。

步骤 3 - 对于列表中的每个 M 个操作 (L, R, X)

对于集合中的每个唯一字符串：
- 复制字符串。
- 在复制的字符串中，将索引 L 到 R（包含）处的字符更改为 X。
- 将复制的字符串添加到集合中。

步骤 4 - 提供“distinct_strings”集合的大小。

示例 2

为了存储所有长度为 k 的不同子字符串，我们使用此代码建立一个空的 distinctStrings 集合。我们通过循环遍历给定的字符串 s 来创建每个长度为 k 的可能子字符串。然后使用每个子字符串更新不同的 Strings 集合。集合的大小告诉我们，在所有子字符串插入后，总共有多少个不同的潜在字符串。这个值是函数的输出，我们将其返回。

在前面的示例中，字符串 s 是“abbabc”，目标是确定有多少个长度为 k=2 的唯一字符串是可行的。程序返回的值为 3，表示可以通过将指定过程应用于字符串 s 来创建 3 个长度为 2 的唯一字符串。

#include<bits/stdc++.h>
using namespace std;

// Function to count the distinct possible strings
int countDistinctStrings(int n, int k, string s) {
   set<string> distinctStrings; // Create an empty set to store distinct strings

   // Create all possible sub strings of length k and insert them into the set
   for (int i = 0; i <= n-k; i++) {
      string temp = s.substr(i, k);
      distinctStrings.insert(temp);
   }

   // Calculate the total number of distinct strings
   int ans = distinctStrings.size();

   return ans;
}

// Driver code
int main() {
   int n = 6, k = 2; // Given values of n and k
      string s = "abbabc"; // Given string

   // Call the countDistinctStrings function and print the result
   int distinctStrings = countDistinctStrings(n, k, s);
   cout << "The number of distinct possible strings is: " << distinctStrings << endl;

   return 0;
}

输出

The number of distinct possible strings is: 4

方法 3：动态规划

此方法有效地利用动态规划来计算唯一字符串的数量。您可以定义一个状态，该状态可以表示在特定数量的操作后可以获得的不同字符串的数量。可以使用递推关系根据先前状态计算后续状态的不同字符串的数量。对于大型输入，此方法可能更有效。

语法

C++ 中动态规划方法的示例语法：

int countDistinctStrings(int n, vector& operations) {

初始化表格或数组

vector<int> dp(n + 1, 0);

设置基本情况

dp[0] = 1;

迭代子问题

for (int i = 1; i <= n; i++) {

根据先前的子问题计算值

for (int op : operations) {
   if (i >= op) {
      dp[i] += dp[i - op];
   }
}
}

返回最终答案

   return dp[n];
}

算法

以下是用动态规划算法计算执行给定操作后不同可能字符串的数量：

步骤 1 - 初始化二维数组 DP[n][k]，其中 n 表示原始字符串的长度，k 表示允许的操作数。DP[i][j] 的值表示可以使用原始字符串的前 i 个字符和 j 个操作创建的不同字符串的数量。

步骤 2 - 因为只能使用零个字符和零个操作创建一个字符串，所以将 DP[0][0] 设置为 1。

步骤 3 - 程序应将 DP[i][j] 设置为 DP[x][j-1] 的累加和，其中 x 表示操作 j 中最后一个修改字符的索引，范围从 0 到 i-1。如果没有先前的操作，则 x 为零。

步骤 4 - 要计算 DP[i][j]，请从 0 到 i-1 减去所有 DP[x][j-1] 的总和，其中 x 表示在第 j 次操作期间用相同的字符替换的最后一个字符。如果没有先前的操作，则将 x 设置为 0。

步骤 5 - 返回 DP[n][k] 的值，该值表示通过将起始字符串的所有 n 个字符与 k 个操作组合可以创建多少个唯一字符串。

示例 1

一个 C++ 示例，说明如何使用动态规划来计算执行指定操作后不同的潜在字符串：

此示例中的 countDistinctStrings 方法有四个输入参数：n、k、x 和 y。X 和 Y 是模值，而 n 表示字符串的长度，k 表示可以包含在字符串中的最大连续 1 的数量。

该函数在名为 dp 的二维数组中存储每个长度 i 处不同字符串的数量和连续 1 的数量 j。使用 memset 方法将数组设置为 0。

然后，根据之前的长度 i-1 和连续 1 的数量 j-1 更新 dp 数组，该函数遍历每个长度 i 和连续 1 的数量 j。如果连续 1 的数量等于 k，则使用模 y 代替模 x。

然后，该函数输出 dp [n% 2][k]，它是可以具有长度 n 并且最多有 k 个连续 1 的唯一字符串的数量。

主函数使用 n、k、x 和 y 的指定值调用 countDistinctStrings 函数。然后将最终计数打印到控制台。

#include <iostream>
#include <cstring>
using namespace std;

int countDistinctStrings(int n, int k, int x, int y) {
   int dp[2][k + 1];
   memset(dp, 0, sizeof(dp));
   dp[0][0] = 1;

   for (int i = 1; i <= n; i++) {
      int cur = i % 2;
      int prev = (i - 1) % 2;

      for (int j = 0; j <= k; j++) {
         dp[cur][j] = dp[prev][j];

         if (j > 0) {
            dp[cur][j] += dp[prev][j - 1];
            dp[cur][j] %= x;
         }   

         if (j == k) {
            dp[cur][j] -= dp[prev][j - 1];
            dp[cur][j] %= y;
            dp[cur][j] += y;
            dp[cur][j] %= y;
         }
      }
   }
   return dp[n % 2][k];
}

int main() {
   int n = 4;
   int k = 2;
   int x = 1000000007;
   int y = 998244353;

   int count = countDistinctStrings(n, k, x, y);

   cout << "Count of distinct possible strings: " << count << endl;

   return 0;
}

输出

Count of distinct possible strings: 0

方法 4：组合方法

此方法可以使用组合数学直接计算不同的字符串。例如，如果可以将“a”或“b”添加到字符串的末尾，则可以使用“a”和“b”组合的公式来计算生成的唯一字符串的数量。当处理最少的输入量和过程计数时，此策略可能会有所帮助。

语法

完成上述操作后，组合方法计算不同潜在字符串的语法如下：

命名操作组：

operations are op1, op2,..., opk.

指定限制：

restrictions = "c1, c2,..., cn"

确定有多少个不同的字符串：

count is equal to f(operations, constraints),

其中 f 是一个组合函数，用于确定可以从给定的操作集和限制中生成多少个唯一字符串。

根据操作和情况，可以使用不同的 f 函数实现。为了枚举潜在的字符串，它通常涉及使用组合公式，例如排列、组合或生成函数。

算法

步骤 1 - 将第一个字符串“s”添加到字符串集合 S 中。

步骤 2 - 对每个操作 (li, ri) 执行以下操作：

通过翻转子字符串 s[li:ri] 中的字符，为 S 中的每个字符串 t 创建一个新字符串 u。
将字符串“u”包含在集合“S”中。

步骤 3 - 提供集合 S 的大小。

步骤 4 - 算法完成。

该算法的时间复杂度为 O(k * 2ⁿ)，其中 n 是初始字符串的长度，k 是操作次数。这是因为在最坏情况下，可能存在 2ⁿ 个不同的字符串，每个字符串都可能进行 k 次操作，从而产生总共 k * 2ⁿ 个字符串。然而，实际中不同的字符串数量可能更少，并且可以通过避免生成重复字符串来改进算法。

示例 4

本示例演示了如何使用 C++ 实现组合方法来计算应用操作后可能的字符串数量。

在这个场景中，有一个长度为 n=5 的字符串，可以使用 k=2 个过程生成唯一的字符串。操作由一个整数向量表示，其中 1 表示在两个相邻的 1 之间插入一个字符，0 表示在两个相邻的 0 之间插入一个字符。我们将计算这些操作产生的唯一字符串的数量。

count_possible_strings() 函数的输入参数是字符串长度 n、操作次数 k 和操作向量。然后，该函数使用二项式系数公式，在循环遍历过程的过程中确定每次操作后可以形成的潜在字符串的数量。所有操作完成后，它会累加可以生成的潜在字符串数量并返回总计数。

一个名为 binomial_coefficient() 的辅助函数使用公式 n! / (k! * (n-k)!) 计算二项式系数 nCk。为了防止溢出，分子和分母使用循环分别计算。

在主代码中，我们使用输入值调用 count_possible_strings() 方法，然后返回结果。

#include <iostream>
#include <vector>
#include <algorithm>
using namespace std;
// Helper function to calculate the binomial coefficient nCk
int binomial_coefficient(int n, int k) {
   if (k > n - k) k = n - k;
   int res = 1;
   for (int i = 0; i < k; i++) {
      res *= (n - i);
      res /= (i + 1);
   }
    return res;
}
// Function to count the distinct possible strings after performing given operations
int count_possible_strings(int n, int k, vector<int>& operations) {
   int num_ones = 1, num_zeros = 0, res = 0;
   for (int i = 0; i < operations.size(); i++) {
      if (operations[i] == 1) {
         res += binomial_coefficient(num_ones + num_zeros, num_ones);
         num_ones++;
      } else {
         num_zeros++;
      }
   }
   res += binomial_coefficient(num_ones + num_zeros, num_ones);
   return res;
}
// Driver code
int main() {
   int n = 5, k = 2;
   vector<int> operations = {1, 0, 1};
   int count = count_possible_strings(n, k, operations);
   cout << "Count of distinct possible strings = " << count << endl;
   return 0;
}

输出

Count of distinct possible strings = 8

结论

总之，确定特定操作集产生的不同潜在字符串的数量是一个具有多种解决方案的挑战性问题。可以使用排列和组合等数学概念以及动态规划等算法技术来快速计算给定操作形成的唯一字符串的数量。但是，这些算法的执行时间和内存需求可能会随着问题规模和新增操作呈指数级增长。因此，在选择哪种方法能够在效率和准确性之间取得平衡时，务必考虑每个问题的实例。

Sakshi Koshta

更新于：2023年7月31日

677 次浏览

开启你的职业生涯

完成课程获得认证

开始