简介
正则表达式可以按照一定的规则(模式)对文本进行处理,Python中可以通过自带的re模块使用正则表达式。re模块无需安装直接import re。
正则表达式的基础语法
元字符
[] 字符集内的一个字符
^  字符串开头, 放在字符集[]内的开头位置则表示补集合,除……之外
$  字符串结尾或者换行字符后面的任何位置
|  多个字符集的或
() 分组
转义字符
\  转义字符后+元字符可取消元字符,转化为普通字符
\  转义字符+不同字符表示特别含义
\d 匹配任何十进制数      [0-9]
\D 匹配任何非数字字符    [^0-9]
\s 匹配任何空白字符      [\t\n\r\f\v]
\S 匹配任何非空白字符     [^\t\n\r\f\v]
\w 匹配任何字母数字字符   [a-zA-Z0-9]
\W 匹配任何非字母数字字符  [^a-zA-Z0-9]
重复次数
? 0或1次,也可以用来表示非贪婪匹配
- 0次及以上
- 1次及以上
 {2} 重复2次
 {2-3} 重复2-3次
编译标志-flags
DOTALL,S 使.匹配换行在内的所有字符
IGNORECASE,I 使匹配对大小写不敏感
MULTINE,M 多行匹配
re的常用方法
| 1 | # 将正则表达式进行编译后,提高程序执行效率 | 
That’s all.
Happy writing!