当前位置:首页 > Windows程序 > 正文

C#正则表达式语法规则详解

2021-05-26 Windows程序

正则表达式通常包含字母文本(Literaltext)和元字符(metacharacter) 
字母文本指的是普通文本如"abcde"可匹配字符串中任何包含"abcde"的字符串。

元字符则更加灵活运用通用的表达式匹配所有符合此表达式规律的字符串。
C#正则表达式语法一、

匹配单个字符 []——从中选择一个字符匹配

中间支持的类型:单词字符([ae])、非单词字符([!?,;@#$*])、字母范围([A-Z])、数字范围([0])

eg.正则表达式[ae]ffect
可匹配字符串 affect,effect

(此例中"[ae]"为元字符,"ffect"为字母文本)

注意:
1.要在字符类中匹配连字符,那么把连字符号作为第一个字符列出即可。

2.可以在单个正则表达式中包含多个字符类。

eg.[01][0-9]:[0-5][0-9][ap]m可以用来匹配如12:59pm格式的所有时间

^——排除某些字符(在[]中表此意,还可表示字符串的开头)

eg.正则表达式m[^a]t
可匹配字符串
不可匹配字符串 met,mit,m&t……mat

C#正则表达式语法二、
匹配特殊字符 可以使用的特殊字符:

\t——匹配制表符 \r——匹配硬回车符 \f——匹配换页符 \n——匹配换行符 描述表示字符类的元字符:

.——匹配任何除了\n以外的字符(或者在单行模式中的任何字符) \w——匹配任何单词字符(任何字母或数字) 
\W——匹配任何非单词字符(除了字母和数字以外的任何字符) \s——匹配任何空白字符(包括空格、换行、制表符等) 
\S——匹配任何非空白字符(除了空格、换行、制表符等的任何字符) \d——匹配任何数字字符(0~9的数字) 
\D——匹配任何非数字字符(除了0~9以外的任何字符) 表示字符串中字符位置: ^——匹配字符串的开头(或者多行模式下行的开头)。 
$——匹配字符串的结尾,或者是字符串结尾“\n”之前的最后一个字符,或者是多行模式中的行结尾。 
\A——匹配字符串的开头(忽略多行模式) \Z——匹配字符串的结尾或字符串结尾“\n”之前的最后一个字符(忽略多行模式)。 
\z——匹配字符串的结尾。 \G——匹配当前搜索开始的位置。 \b——匹配单词的边界。 \B——匹配单词的非边界。 
注意:

1.句点字符(.)特别有用。可以用它来表示任何一个字符。

eg.正则表达式01.17.84
可匹配字符串 01/17/84,01-17-84,011784,01.17.84

2.可以使用\b匹配单词的边界

eg.正则表达式
可匹配字符串 \blet\blet
不可匹配字符串letter,hamlet

3.\A和\z在确保字符串所包含的是某个表达式,而不是其他内容时很用。

eg.要判断Text控件是否包含单词"sophia",而不含任何额外的字符、换行符或者空白。

\Asophia\z

4.句点字符(.)具有特殊的含义,若要表示字母字符本身的含义,在前面加一个反斜杠:\.

C#正则表达式语法三、
匹配二选一的字符序列

|——匹配二选一

eg.正则表达式col(o|ou)r
可匹配字符串 color,colour

注意:\b(bill|ted)和\bbill|ted是不同的。

后者还可以匹配"malted"因为\b元字符只应用于"bill"。

C#正则表达式语法四、
用量词匹配 *——匹配0次或多次 +——匹配1次或多次 ?——匹配0次或1次 {n}——恰好匹配n次 {n,}——至少匹配n次 {n,m}——至少匹配n次,
但不多于m次 
eg.正则表达式brothers?
可匹配字符串 brother,brothers

eg.正则表达式\bp\d{3,5}
可匹配字符串 \b以p开头,且后跟3~5个数字结尾

注意:也可以把量词与()一起使用,以便把该量词应用到整个字母序列。

eg.正则表达式(The)?schoolisbeautiful.
可匹配字符串 schoolisbeautiful,Theschoolisbeautiful.

C#正则表达式语法五、
识别正则表达式和贪婪 有些量词是贪婪的(greedy).他们会尽可能多的匹配字符。

如量词*匹配0个或多个字符。假设要匹配字符串中任何HTML标签。你可能会用如下正则表达式:

<.*>

现有字符串A<i>quantifier</i>canbe<big>greedy</big>

结果<.*>把<i>quantifier</i>canbe<big>greedy</big>都匹配上了。

要解决该问题,需要与量词一起使用一个特殊的非贪婪字符“?”,因此表达式变化如下:

<.*?>

这样就可以正确匹配<i>、</i>、<big>、</big>。

?能强制量词尽可能少地匹配字符,?还可以用在以下几个量词中:

温馨提示: 本文由Jm博客推荐,转载请保留链接: https://www.jmwww.net/file/71441.html