网址怎么输入_网站建设价格a电联真甲先生_万词霸屏百度推广seo_2023国内外重大新闻事件10条

正则表达式详解及re模块中的常用函数

概念、作用和步骤

概念：本身也是一个字符串，其中的字符具有特殊含义，将来我们可以根据这个字符串【正则表达式】去处理其他的字符串，比如可以对其他字符串进行匹配，切分，查找，替换等一系列操作。
作用：可以对其他字符串进行匹配，切分，查找，替换等处理操作。
编写的步骤：- 需要大量的文本信息——找规律——使用正则语法编写出正则表达式

是一个独立于任何一门语言的技术，任何一门语言中都可以使用同一个正则表达式去操作

语法

需要先导入内置函数re，import re

字符串本身就是一个正则表达式
[] 表示可选项

代码展示：

import re
s1 = '今天是个好天气，我的快递1-67，12-21343，ert_134找不到了，手机号码是12345685769，邮箱是12345678@qq.com和12134.163.com。希望我的三个快递能找到'
r1 = re.findall(r'\d+[16]',s1)
print(r1,type(r1))

运行结果：

在这里插入图片描述

英文字母范围
- [a-z] 表示查找 a-z
- [A-Za-z]
- [0-9]

注意[]需要用’ '括起才能使用，否则报错
[**A-Za-z]不能改变如[A-z]因为使用的是ASCII码，会出现非英文部分。

代码展示：

s1 = '今天是个好天气，我的快递1-67，12-21343，ert_134找不到了，手机号码是12345685769，邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'[f-z]',s1)
r2 = re.findall(r'[A-Za-z]',s1)
r3 = re.findall(r'[3-9]',s1)
print(r1)
print(r2)
print(r3)

运行结果：
在这里插入图片描述

\d 数字
- **\d？**表示出现了0次或者1次
- \d+ 表示出现了1次或者n次
- \d*表示出现了0次或者n次
\d同时需’'括起使用

代码展示：

s1 = '今天是个好天气，我的快递1-67，12-21343，ert_134找不到了，手机号码是12345685769，邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'\d',s1)
r4 = re.findall(r'\d?',s1)
r2 = re.findall(r'\d+',s1)
r3 = re.findall(r'\d*',s1)
print(r1)
print(r4)
print(r2)
print(r3)

运行结果：
在这里插入图片描述

{}出现次数
- {m,n} 表示出现的次数范围，m表示至少出现的次数，n表述最多出现的次数
- {m,} 表示出现的次数，至少为m个，上不封顶
- {m} 表示出现了m次

代码展示：

s1 = '今天是个好天气，我的快递1-67，12-21343，ert_134找不到了，手机号码是12345685769，微信是微信2342345，qq是qq1234，邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'1\d{1,2}',s1)
r2 = re.findall(r'是\d{,2}',s1)
r4 = re.findall(r'1\d{3,}',s1)
r3 = re.findall(r'\d{2}',s1)
print(r1)
print(r2)
print(r4)
print(r3)

运行结果：
在这里插入图片描述

\w 表示英文字母大写或者小写，或者下划线，或者是中文汉字
\W 表示除了大小写英文字母，数字，汉字，下划线之外，都能匹配

如果我们没有写re.ASCII参数，那么第一个\w+会将汉字也匹配上，因为\w本身就可以匹配汉字的，但是当我们加上了re.ASCII参数，python正则表达式匹配的时候，\w只会匹配ASCII码上有的字符。

代码展示：

s1 = '今天是个好天气，我的快递1-67，12-21343，ert_134找不到了，手机号码是12345685769，微信是微信2342345，qq是qq1234，邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'\W',s1)
r2 = re.findall(r'qq\w+',s1)
r3 = re.findall(r'qq\w+',s1,re.ASCII)
print(r1)
print(r2)
print(r3)

运行结果：
在这里插入图片描述

匹配以某个字符串开头
- ^ 表示以某个字符串开头

.com在re里可写成\.com

代码展示：

s1 = '今天是个好天气，我的快递1-67，12-21343，ert_134找不到了，手机号码是12345685769，微信是wx2342345，qq是qq1234，邮箱是12345678@qq.com和12134.163.com。希望我的三个ABC快递能找到'
r1 = re.findall(r'qq\w+',s1,re.ASCII)
r2 = re.findall(r'12\w+\@\w+\.com',s1,re.ASCII)
s2 = '123ajdhsa2134'
s3 = 'ajdhsa$2134$'
r3 = re.findall(r'^aj',s2,re.ASCII)
r4 = re.findall(r'^aj',s3,re.ASCII)
print(r1)
print(r2)
print(r3)
print(r4)

运行结果：
在这里插入图片描述

() 分组

可以
多个()进行分组，，结果按()顺序
代码展示：

s1 = '身份证号：342300200105198866'
r1 = re.findall(r'(342\d{3}(\d{4})(\d{4}))',s1,re.ASCII)
print(r1)
for i in r1:print(i)

运行结果：
在这里插入图片描述

或 | 多个字符之间的或使用小括号

代码展示：

s1 = '身份证号1：342300200105198866,另一个身份证号2：342200200806116688'
r1 = re.findall(r'(342\d{3}(\d{4})(\d{4}))',s1)
r2 = re.findall(r'(342(300|200)(\d{4})(\d{2})(\d{2}))',s1)
print(r1)
print(r2)

运行结果：
在这里插入图片描述

. 表示任意字符

使用\转义字符，将.变成普通的点字符进行匹配

代码展示：

s1 = '今天天气正好，适合买xiaomipro，邮箱是12345678@qq.com'
r1 = re.findall(r'xiao.{5}',s1)
r2 = re.findall(r'天气.{5}',s1)
r3 = re.findall(r'12\d+@+\w+\.com',s1)print(r1)
print(r2)
print(r3)

运行结果：
在这里插入图片描述

re模块中的常用函数

re.findall 在大字符串中查找符合正则表达式特点的式子
re.match() 匹配整个字符串是否符合某个正则表达式特点
re.search() 从左向右匹配正则表达式，只会匹配一次符合条件, 得到的是一个对象

match和search返回的是对象，需要group查看

代码展示：

s1 = '今天天气正好，适合买xiaomipro，邮箱是12345678@qq.com'
s2 = 'xiaom'
r1 = re.findall(r'xiao.{5}',s1)
r2 = re.match(r'xiao',s2)
r3 = re.match(r'xiao',s1)
r4 = re.search(r'xiao',s2)
print(r1)
print(r2)
print(r2.group())
print(r3)
print(r4)
print(r4.group())

运行结果：

re.split()切割

代码展示：

s1 = 'xiaomi.pro@12345'
r1 = re.split(r'[.,@]',s1)
print(r1)

运行结果：
在这里插入图片描述

re.finditer() 在大字符串中查找符合正则表达式特点的式子,得到的是一个迭代器
代码展示：

s1 = 'xiaomi.pro@12345'
r1 = re.finditer(r'[(\d+)]',s1,re.ASCII)
for i in r1:print(i.group())
print(r1)

运行结果：
在这里插入图片描述

fullmatch() 将字符串整体与正则表达式进行匹配

代码展示：

text = '安徽省-合肥市'
res1 = re.fullmatch(f'(\w+)-(\w+)', text)
print(f"省份:{res1.group(1)}")
print(f"市:{res1.group(2)}")

运行结果：
在这里插入图片描述

网址怎么输入_网站建设价格a电联真甲先生_万词霸屏百度推广seo_2023国内外重大新闻事件10条

正则表达式详解及re模块中的常用函数

概念、作用和步骤

语法

re模块中的常用函数

最新新闻

热搜词