正则表达式的作用
正则表达式用于处理字符串,检测目标字符串与给出的表达式是否一致。
常用的正则表达式
re.py 标准库文档中文版
该模块支持正则表达式匹配操作,类似Perl。
查找的模式(Pattern)和字符串(String)可以是统一编码Unicode,也可以是8位bit,不过二者不能混淆,也就是说你不能使用一个字节模式或vice-versa去匹配一个统一编码的字符串。同样的,在使用替换功能时,替换后的字符串必须和被替换字符串及模式一个类型。
正则表达式使用反斜杠(’\’)去表示特殊的形式或使一个字符不与其特殊的含义冲突。这与Python对其的用法是一致的。比如说为了匹配字面上的’\’,你需要写4个’\’作为模式,因为正则表达式需要2个’\‘,而在Python的字符串规则中,每个’\’又都需要增加1个’\’来表达。
这个问题的解决办法是对正则表达式模式使用Python的原生字符串标记法(raw string notation),BALABALA
一般的,使用compile 方法将正则表达式pattern转化为一个Pattern 的对象,这样更有效率
|
|
等价于
|
|