VBScript - 正则表达式

正则表达式是由一系列字符组成的模式，主要用于搜索和替换。创建模式的目的是匹配特定的字符串，以便开发者可以根据条件提取字符并替换某些字符。

RegExp 对象

RegExp 对象帮助开发者匹配字符串的模式，其属性和方法使我们能够轻松地使用正则表达式。它类似于 JavaScript 中的 RegExp。

属性

Pattern − Pattern 方法表示用于定义正则表达式的字符串，在使用正则表达式对象之前应先设置它。
IgnoreCase − 一个布尔属性，表示如果为 true，则正则表达式是否应针对字符串中的所有可能匹配项进行测试；如果为 false，则不进行测试。如果未显式指定，则 IgnoreCase 值设置为 False。
Global − 一个布尔属性，表示正则表达式是否应针对字符串中的所有可能匹配项进行测试。如果未显式指定，则 Global 值设置为 False。

方法

Test(search-string) − Test 方法接受一个字符串作为参数，如果正则表达式可以成功与字符串匹配，则返回 True；否则返回 False。
Replace(search-string, replace-string) − Replace 方法接受 2 个参数。如果搜索成功，则它将该匹配项替换为 replace-string，并返回新的字符串。如果没有匹配项，则返回原始 search-string。
Execute(search-string) − Execute 方法的工作方式类似于 Replace，不同之处在于它返回一个 Matches 集合对象，其中包含每个成功匹配项的 Match 对象。它不会修改原始字符串。

Matches 集合对象

Matches 集合对象作为 Execute 方法的结果返回。此集合对象可以包含零个或多个 Match 对象，并且此对象的属性为只读。

Count − Count 方法表示集合中 Match 对象的数量。
Item − Item 方法使可以从 Matches 集合对象访问 Match 对象。

Match 对象

Match 对象包含在 Matches 集合对象中。这些对象表示搜索字符串后成功的匹配项。

FirstIndex − 它表示匹配项在原始字符串中出现的位置。此索引为基于零的索引，这意味着字符串中的第一个位置为 0。
Length − 表示匹配字符串的总长度的值。
Value − 表示匹配的值或文本的值。访问 Match 对象时，这也是默认值。

关于 Pattern 参数

模式构建类似于 PERL。模式构建是使用正则表达式时最重要的事情。在本节中，我们将讨论如何根据各种因素创建模式。

位置匹配

位置匹配的重要性在于确保我们将正则表达式放在正确的位置。

符号	描述
^	仅匹配字符串的开头。
$	仅匹配字符串的结尾。
\b	匹配任何单词边界
\B	匹配任何非单词边界

字面量匹配

任何形式的字符，例如字母、数字或特殊字符，甚至十进制、十六进制都可以作为字面量处理。由于某些字符在正则表达式的上下文中已经具有特殊含义，因此我们需要使用转义序列对其进行转义。

符号	描述
字母数字	仅匹配字母和数字字符。
\n	匹配换行符。
\[	仅匹配 [ 字面量
\]	仅匹配 ] 字面量
\(	仅匹配 ( 字面量
\)	仅匹配 ) 字面量
\t	匹配水平制表符
\v	匹配垂直制表符
\\|	仅匹配 \| 字面量
\{	仅匹配 { 字面量
\}	仅匹配 } 字面量
\\	仅匹配 \ 字面量
\?	仅匹配 ? 字面量
\*	仅匹配 * 字面量
\+	仅匹配 + 字面量
\.	仅匹配 . 字面量
\b	匹配任何单词边界
\B	匹配任何非单词边界
\f	匹配换页符
\r	匹配回车符
\xxx	匹配八进制数 xxx 的 ASCII 字符。
\xdd	匹配十六进制数 dd 的 ASCII 字符。
\uxxxx	匹配 UNICODE 字面量 xxxx 的 ASCII 字符。

字符类匹配

字符类是由自定义分组形成的模式，并包含在 [ ] 大括号中。如果我们期望的字符类不应在列表中，则应使用负号（^），这是一个帽子符号来忽略该特定字符类。

符号	描述
[xyz]	匹配字符集中包含的任何字符类。
[^xyz]	匹配字符集中未包含的任何字符类。
.	匹配除 \n 之外的任何字符类
\w	匹配任何单词字符类。等效于 [a-zA-Z_0-9]
\W	匹配任何非单词字符类。等效于 [^a-zA-Z_0-9]
\d	匹配任何数字类。等效于 [0-9]。
\D	匹配任何非数字字符类。等效于 [^0-9]。
\s	匹配任何空格字符类。等效于 [ \t\r\n\v\f]
\S	匹配任何非空格字符类。等效于 [^ \t\r\n\v\f]

重复匹配

重复匹配允许在正则表达式中进行多次搜索。它还指定正则表达式中元素重复的次数。

符号	描述
*	匹配给定正则表达式的零个或多个出现。等效于 {0,}。
+	匹配给定正则表达式的一个或多个出现。等效于 {1,}。
?	匹配给定正则表达式的零个或一个出现。等效于 {0,1}。
{x}	精确匹配给定正则表达式的 x 个出现。
{x,}	至少匹配给定正则表达式的 x 个或更多出现。
{x,y}	匹配给定正则表达式的 x 到 y 个出现。

替换和分组

替换和分组帮助开发者创建更复杂的正则表达式，尤其是在处理正则表达式中的复杂子句时，这提供了极大的灵活性和控制能力。

符号	描述
()	分组子句以创建子句。“(xy)?(z)”匹配“xyz”或“z”。
\|	替换组合一个正则表达式子句，然后匹配任何单个子句。“(ij)\|(23)\|(pq)”匹配“ij”或“23”或“pq”。

构建正则表达式

下面是一些清楚地解释如何构建正则表达式的示例。

正则表达式	描述
"^\s.." 和 "..\s$"	表示在一行中可以有任意数量的前导和尾随空格字符。
"((\$\s?)\|(#\s?))?"	表示可选的 $ 或 # 符号，后跟可选空格。
"((\d+(\.(\d\d)?)?))"	表示至少存在一个数字，后跟可选小数点和小数点后两位数字。

示例

以下示例检查用户输入的电子邮件 ID 格式是否匹配，例如，电子邮件 ID 后跟“@”，然后后跟域名。

<!DOCTYPE html>
<html>
   <body>
      <script language = "vbscript" type = "text/vbscript">
         strid = "welcome.user@tutorialspoint.co.us"
         Set re = New RegExp
         With re
            .Pattern    = "^[\w-\.]{1,}\@([\da-zA-Z-]{1,}\.){1,}[\da-zA-Z-]{2,3}$"
            .IgnoreCase = False
            .Global     = False
         End With
        
         ' Test method returns TRUE if a match is found
         If re.Test( strid ) Then
            Document.write(strid & " is a valid e-mail address")
         Else
            Document.write(strid & " is NOT a valid e-mail address")
         End If
        
        Set re = Nothing
      </script>
   </body>
</html>

打印页面