正则表达式:修订间差异
来自运维百科
(创建页面,内容为“正则表达式(Regular Expression,简称 regex 或 regexp)是一种用于匹配、搜索或操作文本的强大工具。它通过特定的语法规则,定义了一种字符串的模式(pattern),可以用来快速检索、替换或验证符合该模式的文本内容。 == 模式匹配 == * 正则表达式不是匹配固定的字符串,而是匹配符合某种规则的文本模式。例…”) |
无编辑摘要 |
||
第25行: | 第25行: | ||
正则表达式的用途很广,比如在dataC中,我们用于获取商品地址 | 正则表达式的用途很广,比如在dataC中,我们用于获取商品地址 | ||
[[File:正则表达式获取商品地址.png.webp]] | [[File:正则表达式获取商品地址.png.webp]] |
2025年6月21日 (六) 11:44的最新版本
正则表达式(Regular Expression,简称 regex 或 regexp)是一种用于匹配、搜索或操作文本的强大工具。它通过特定的语法规则,定义了一种字符串的模式(pattern),可以用来快速检索、替换或验证符合该模式的文本内容。
模式匹配
* 正则表达式不是匹配固定的字符串,而是匹配符合某种规则的文本模式。例如:
- \d 匹配任意数字(等价于 [0-9])。
- a+ 匹配一个或多个连续的字母 a(如 a, aa, aaa)。
基本语法
- 普通字符(如 a、1)直接匹配自身。
- 元字符(特殊符号)具有特殊含义,例如:
- . 匹配任意单个字符(除换行符)。
- ^ 匹配字符串开头,$ 匹配结尾。
- * 匹配前一个字符 0 次或多次,+ 匹配 1 次或多次,? 匹配 0 或 1 次。
- | 表示“或”(如 a|b 匹配 a 或 b)。
- 字符类
- [abc] 匹配 a、b 或 c。
- [a-z] 匹配任意小写字母。
- [^abc] 匹配非 a、b、c 的字符。
分组与捕获
- (abc) 将多个字符作为一个分组,并可提取匹配的内容。
- 非捕获分组 (?:abc) 仅分组但不捕获。
预定义字符集
- \w 匹配单词字符(字母、数字、下划线)。
- \s 匹配空白符(空格、制表符等)。
- \b 匹配单词边界。
正则表达式的用途很广,比如在dataC中,我们用于获取商品地址