正则表达式:修订间差异

来自运维百科
(创建页面,内容为“正则表达式(Regular Expression,简称 ​​regex​​ 或 ​​regexp​​)是一种用于​​匹配、搜索或操作文本​​的强大工具。它通过特定的语法规则,定义了一种字符串的​​模式(pattern)​​,可以用来快速检索、替换或验证符合该模式的文本内容。 == ​​模式匹配 == ​* 正则表达式不是匹配固定的字符串,而是匹配符合某种规则的文本模式。例…”)
 
无编辑摘要
 
第25行: 第25行:


正则表达式的用途很广,比如在dataC中,我们用于获取商品地址
正则表达式的用途很广,比如在dataC中,我们用于获取商品地址
[[File:正则表达式获取商品地址.png.webp]]
[[File:正则表达式获取商品地址.png.webp]]

2025年6月21日 (六) 11:44的最新版本

正则表达式(Regular Expression,简称 ​​regex​​ 或 ​​regexp​​)是一种用于​​匹配、搜索或操作文本​​的强大工具。它通过特定的语法规则,定义了一种字符串的​​模式(pattern)​​,可以用来快速检索、替换或验证符合该模式的文本内容。

​​模式匹配

​* 正则表达式不是匹配固定的字符串,而是匹配符合某种规则的文本模式。例如:

  • \d 匹配任意数字(等价于 [0-9])。
  • a+ 匹配一个或多个连续的字母 a(如 a, aa, aaa)。

​​基本语法​​

  • ​​普通字符​​(如 a、1)直接匹配自身。
  • ​​元字符​​(特殊符号)具有特殊含义,例如:
  • . 匹配任意单个字符(除换行符)。
  • ^ 匹配字符串开头,$ 匹配结尾。
  • * 匹配前一个字符 0 次或多次,+ 匹配 1 次或多次,? 匹配 0 或 1 次。
  • | 表示“或”(如 a|b 匹配 a 或 b)。
  • ​​字符类​​
  • [abc] 匹配 a、b 或 c。
  • [a-z] 匹配任意小写字母。
  • [^abc] 匹配​​非​​ a、b、c 的字符。

​​分组与捕获​​

  • (abc) 将多个字符作为一个分组,并可提取匹配的内容。
  • 非捕获分组 (?:abc) 仅分组但不捕获。

​​预定义字符集​​

  • \w 匹配单词字符(字母、数字、下划线)。
  • \s 匹配空白符(空格、制表符等)。
  • \b 匹配单词边界。

正则表达式的用途很广,比如在dataC中,我们用于获取商品地址