Python正则表达式中字符类内部的元字符是什么?


大多数字母和字符本身就匹配自身。但是,有一些字符称为元字符,它们不匹配自身。相反,它们指示应该匹配某种模式,或者重复或更改正则表达式的部分内容。

以下是元字符的完整列表

. ^ $ * + ? { } [ ] \ | ( )

首先,我们将看看`[`和`]`。它们用于指示字符类,它是一组要匹配的字符。字符可以单独列出,或者可以通过给出两个字符并用“-”分隔它们来指示字符范围。例如,`[xyz]`将匹配字符x、y或z中的任何一个;这与`[x-z]`相同,后者使用范围来表示相同的字符集。如果只想匹配小写字母,则正则表达式为`[a-z]`。

元字符在类内不起作用。例如,`[abc$]`将匹配'a'、'b'、'c'或'$'中的任何一个字符;'$'是一个元字符,但在字符类内部,它失去了其特殊含义。

如果类中的第一个字符是`^`,则表示所有不是此类的字符;例如,`[^8]`将匹配除'8'之外的任何字符。

也许最重要的元字符是反斜杠`\`。它也用于转义所有元字符,因此您仍然可以在模式中匹配它们;例如,如果您需要匹配`]`或`\`,您可以用反斜杠在它们前面来移除它们的特殊含义:`]`或`\\`。

更新于:2020年6月13日

344 次浏览

开启您的职业生涯

完成课程获得认证

开始学习
广告
© . All rights reserved.