简介
正则表达式可以按照一定的规则(模式)对文本进行处理,Python中可以通过自带的re模块使用正则表达式。re模块无需安装直接import re
。
正则表达式的基础语法
元字符
[] 字符集内的一个字符
^ 字符串开头, 放在字符集[]内的开头位置则表示补集合,除……之外
$ 字符串结尾或者换行字符后面的任何位置
| 多个字符集的或
() 分组
转义字符
\ 转义字符后+元字符可取消元字符,转化为普通字符
\ 转义字符+不同字符表示特别含义
\d 匹配任何十进制数 [0-9]
\D 匹配任何非数字字符 [^0-9]
\s 匹配任何空白字符 [\t\n\r\f\v]
\S 匹配任何非空白字符 [^\t\n\r\f\v]
\w 匹配任何字母数字字符 [a-zA-Z0-9]
\W 匹配任何非字母数字字符 [^a-zA-Z0-9]
重复次数
? 0或1次,也可以用来表示非贪婪匹配
- 0次及以上
- 1次及以上
{2} 重复2次
{2-3} 重复2-3次
编译标志-flags
DOTALL,S 使.匹配换行在内的所有字符
IGNORECASE,I 使匹配对大小写不敏感
MULTINE,M 多行匹配
re的常用方法
1 | # 将正则表达式进行编译后,提高程序执行效率 |
That’s all.
Happy writing!