今天翻大佬们的blog的时候,突然看到了正则表达式,想了一下这么好用的东西还没学会,实在是惭愧,于是便找了下教程,学习一波
先贴两个连接
python re库入门
正则表达式操作符
re库中常用函数
函数 |
功能 |
re.search() |
在字符串中匹配正则表达式第一次出现的位置,返回match对象 |
re.match() |
从字符串的开始位置匹配正则表达式,返回match对象 |
re.findall() |
搜索字符串,以列表形式返回所有匹配的字符串 |
re.split() |
将一个字符串以正则表达式匹配结果分割,返回列表类型 |
re.finditer() |
搜索一个字符串,返回一个匹配结果的迭代类型,每个迭代元素是match对象 |
re.sub() |
在一个字符串中替换所有匹配正则表达式的子串,返回替换后的字符串 |
常用操作符
操作符 |
说明 |
实例 |
. |
表示任何单个字符 |
|
[ ] |
字符集,对单个字符给出范围 |
[abc]表示a、b、c,[a-z]表示a-z的单个字符 |
[^ ] |
非字符集,对单个字符给出排除范围 |
[^abc]表示非a或b或c的单个字符 |
* |
前一个字符零次或无限次扩展 |
abc* 表示ab、abc、abcc、abccc等 |
+ |
前一个字符1次或无限次扩展 |
abc+ 表示 abc、abcc、abccc等 |
? |
前一个字符0次或1次扩展 |
abc? 表示 ab、abc |
| |
左右表达式的任意一个 |
abc|def 表示 abc、def |
{m} |
扩展前一个字符m次 |
ab{2}c 表示 abbc |
{m,n} |
扩展前一个字符m到n次 |
ab{1,2}c 表示 abc、abbc |
^ |
匹配字符串开头 |
^abc 表示 abc且在一个字符串的开头 |
$ |
匹配字符串结尾 |
abc$ 表示 abc且在一个字符串结尾 |
( ) |
分组标记内部只能使用|操作符 |
(abc)表示abc,(abc|def)表示abc、def |
\d |
数字,等价于0-9 |
|
\w |
单词字符,等价于[a-z0-9A-Z_] |
|