Python中正则表达式详解

脚本专栏 2024/11/16 佚名

3 1 2

基础篇

正则表达式在python中运用的非常多，因为他可以进行任意的匹配，可以匹配我们想要提取的信息。当我们接触正则的时候你就会知道正则的强大。正则有一个库re 在一些工程中我们会经常调用正则的库来做与匹配相关的问题。

字符串是编程时涉及到的最多的一种数据结构，对字符串进行操作的需求几乎无处不在。比如判断一个字符串是否是合法的Email地址，虽然可以编程提取 @ 前后的子串，再分别判断是否是单词和域名，但这样做不但麻烦，而且代码难以复用。

正则表达式是一种用来匹配字符串的强有力的武器。它的设计思想是用一种描述性的语言来给字符串定义一个规则，凡是符合规则的字符串，我们就认为它“匹配”了，否则，该字符串就是不合法的。

所以我们判断一个字符串是否是合法的Email的方法是：

1.创建一个匹配Email的正则表达式；

2.用该正则表达式去匹配用户的输入来判断是否合法。

因为正则表达式也是用字符串表示的，所以，我们要首先了解如何用字符来描述字符。

在正则表达式中，如果直接给出字符，就是精确匹配。用 \d 可以匹配一个数字， \w 可以匹配一个字母或数字，所以：

"htmlcode">

s = 'ABC\\-001' # Python的字符串
# 对应的正则表达式字符串变成：
# 'ABC\-001'

因此我们强烈建议使用Python的 r 前缀，就不用考虑转义的问题了：

s = r'ABC\-001' # Python的字符串
# 对应的正则表达式字符串不变：
# 'ABC\-001'

先看看如何判断正则表达式是否匹配：

> import re
> re.match(r'^\d{3}\-\d{3,8}$', '010-12345')
<_sre.SRE_Match object at 0x1026e18b8>
> re.match(r'^\d{3}\-\d{3,8}$', '010 12345')
>

match() 方法判断是否匹配，如果匹配成功，返回一个 Match 对象，否则返回 None 。常见的判断方法就是：

test = '用户输入的字符串'
if re.match(r'正则表达式', test):
  print 'ok'
else:
  print 'failed'

切分字符串

用正则表达式切分字符串比用固定的字符更灵活，请看正常的切分代码：

> 'a b  c'.split(' ')
['a', 'b', '', '', 'c']

嗯，无法识别连续的空格，用正则表达式试试：

> re.split(r'\s+', 'a b  c')
['a', 'b', 'c']

无论多少个空格都可以正常分割。加入,试试：

> re.split(r'[\s\,]+', 'a,b, c d')
['a', 'b', 'c', 'd']

再加入;试试：

> re.split(r'[\s\,\;]+', 'a,b;; c d')
['a', 'b', 'c', 'd']

如果用户输入了一组标签，下次记得用正则表达式来把不规范的输入转化成正确的数组。

分组

除了简单地判断是否匹配之外，正则表达式还有提取子串的强大功能。用 () 表示的就是要提取的分组（Group）。比如：

^(\d{3})-(\d{3,8})$ 分别定义了两个组，可以直接从匹配的字符串中提取出区号和本地号码：

 
> m = re.match(r'^(\d{3})-(\d{3,8})$', '010-12345')
> m
<_sre.SRE_Match object at 0x1026fb3e8>
> m.group(0)
'010-12345'
> m.group(1)
'010'
> m.group(2)
'12345'

如果正则表达式中定义了组，就可以在Match对象上用group()方法提取出子串来。

注意到 group(0) 永远是原始字符串， group(1) 、 group(2) ……表示第1、2、……个子串。

提取子串非常有用。来看一个更凶残的例子：

> t = '19:05:30'
> m = re.match(r'^(0[0-9]|1[0-9]|2[0-3]|[0-9])\:(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])\:(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])$', t)
> m.groups()
('19', '05', '30')

这个正则表达式可以直接识别合法的时间。但是有些时候，用正则表达式也无法做到完全验证，比如识别日期：
'^(0[1-9]|1[0-2]|[0-9])-(0[1-9]|1[0-9]|2[0-9]|3[0-1]|[0-9])$'

对于 '2-30' ， '4-31' 这样的非法日期，用正则还是识别不了，或者说写出来非常困难，这时就需要程序配合识别了。

贪婪匹配

最后需要特别指出的是，正则匹配默认是贪婪匹配，也就是匹配尽可能多的字符。举例如下，匹配出数字后面的 0 ：

> re.match(r'^(\d+)(0*)$', '102300').groups()
('102300', '')

由于\d+采用贪婪匹配，直接把后面的0全部匹配了，结果0*只能匹配空字符串了。

必须让 \d+ 采用非贪婪匹配（也就是尽可能少匹配），才能把后面的 0 匹配出来，加个 "htmlcode">

> re.match(r'^(\d+"htmlcode">

> import re
# 编译:
> re_telephone = re.compile(r'^(\d{3})-(\d{3,8})$')
# 使用：
> re_telephone.match('010-12345').groups()
('010', '12345')
> re_telephone.match('010-8086').groups()
('010', '8086')



编译后生成Regular Expression对象，由于该对象自己包含了正则表达式，所以调用对应的方法时不用给出正则字符串。
小结
正则表达式非常强大，要在短短的一节里讲完是不可能的。要讲清楚正则的所有内容，可以写一本厚厚的书了。如果你经常遇到正则表达式的问题，你可能需要一本正则表达式的参考书。
请尝试写一个验证Email地址的正则表达式。版本一应该可以验证出类似的Email：

someone@gmail.com

Demonzjs93@gmail.com


总结一下python中常用的匹配符：


\w     可以匹配一个字母或者数字
\d     匹配数字
\d+    可以匹配多个数字
\d+"htmlcode">

>'Demon is a good %s' % ('boy')
'Demon is a good boy'




只要可以熟料运用上面的匹配符，今后运用正则表达式可以做很多功能，当你动手做的时候就知道正则的强大了。


                                
                                    Python中正则表达式,Python正则表达式,Python正则 
                                华山资源网 Design By www.eoogi.com


                        
                            
                                广告合作：本站广告合作请联系QQ：858582 申请时备注：广告合作（否则不回）

                                免责声明：本站资源来自互联网收集,仅供用于学习和交流,请遵循相关法律法规,本站一切资源不代表本站立场,如有侵权、后门、不妥请联系本站删除！
                            
                        
                        
                            
                                
                                    上一篇
                                    详解使用python的logging模块在stdout输出的两种方法
                                
                            
                            
                                
                                    下一篇
                                    用Python设计一个经典小游戏
                                
                            
                        
                        
                        华山资源网 Design By www.eoogi.com
                        
                            
                                
                                
                                    评论“Python中正则表达式详解”
                                
                            
                            
                                
                                    
                                        
                                            
                                                
                                                    
                                                
                                                
                                                    
                                                
                                                
                                                    
                                                    
                                                    
                                                
                                                
                                                     再想想
                                                    
                                                    
                                                    
                                                    
                                                    
                                                
                                            
                                            
                                        
                                    
                                    
                                    
                                        暂无评论...


                    
                        
                            
                                
                                    
                                        
                                    
                                    
                                        
                                            
                                        
                                    
                                
                                
                                    www.eoogi.com
                                            
                                                华山资源网 
                                    
                                    
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                        
                                            
                                        
                                    
                                    
                                    
                                        
                                            120,135影音资源
                                        
                                        
                                            344,641技术资源
                                        
                                        
                                            22,817软件资源
                                        
                                        
                                            435,032站长资源
                                        
                                    
                                
                            
                            
                                最新文章
                                
                                    
                                         
                                       
                                            
                                                
                                            
                                            
                                                
                                                    柏菲·万山红《花开原野1》限量开盘母带ORMC
                                                
                                                
                                                    
                                                        2024/11/16
                                                        
                                                         77
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    柏菲·万山红《花开原野2》限量开盘母带ORMC
                                                
                                                
                                                    
                                                        2024/11/16
                                                        
                                                         15
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    潘安邦《思念精选集全纪录》5CD［WAV+CUE]
                                                
                                                
                                                    
                                                        2024/11/16
                                                        
                                                         12
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    杨千嬅《千嬅新唱金牌金曲》金牌娱乐 [WAV+
                                                
                                                
                                                    
                                                        2024/11/16
                                                        
                                                         10
                                                    
                                                
                                            
                                        
 
                                       
                                            
                                                
                                            
                                            
                                                
                                                    杨钰莹《依然情深》首版[WAV+CUE][1G]
                                                
                                                
                                                    
                                                        2024/11/16
                                                        
                                                         25
                                                    
                                                
                                            
                                        


                                    
                                
                            
                            一句话新闻
苹果官宣WWDC 2024！预计会有大批AI功能 - 2024/11/16

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。


            RTX 5090要首发 性能要翻倍！三星展示GDDR7显存
三星在GTC上展示了专为下一代游戏GPU设计的GDDR7内存。首次推出的GDDR7内存模块密度为16GB，每个模块容量为2GB。其速度预设为32 Gbps（PAM3），但也可以降至28 Gbps，以提高产量和初始阶段的整体性能和成本效益。
据三星表示，GDDR7内存的能效将提高20%，同时工作电压仅为1.1V，低于标准的1.2V。通过采用更新的封装材料和优化的电路设计，使得在高速运行时的发热量降低，GDDR7的热阻比GDDR6降低了70%。
            
                
                    
                        
                            更新日志
                        
                        
                            
                                
                                    2024年11月16日
                                
                                                    
                        
 
                            柏菲·万山红《花开原野1》限量开盘母带ORMCD[低速原抓WAV+CUE]
 
                            柏菲·万山红《花开原野2》限量开盘母带ORMCD[低速原抓WAV+CUE]
 
                            潘安邦《思念精选集全纪录》5CD［WAV+CUE]
 
                            杨千嬅《千嬅新唱金牌金曲》金牌娱乐 [WAV+CUE][985M]
 
                            杨钰莹《依然情深》首版[WAV+CUE][1G]

                        
                    
                    
                        2024年11月16日
                    
                    
                        
 
                            第五街的士高《印度激情版》3CD [WAV+CUE][2.4G]
 
                            三国志8重制版哪个武将智力高 三国志8重制版智力武将排行一览
 
                            三国志8重制版哪个武将好 三国志8重制版武将排行一览
 
                            三国志8重制版武将图像怎么保存 三国志8重制版武将图像设置方法
 
                            何方.1990-我不是那种人【林杰唱片】【WAV+CUE】
 
                            张惠妹.1999-妹力新世纪2CD【丰华】【WAV+CUE】
 
                            邓丽欣.2006-FANTASY【金牌大风】【WAV+CUE】
 
                            饭制《黑神话》蜘蛛四妹手办
 
                            《燕云十六声》回应跑路：年内公测版本完成95%
 
                            网友发现国内版《双城之战》第二季有删减：亲亲环节没了！
 
                            邓丽君2024-《漫步人生路》头版限量编号MQA-UHQCD[WAV+CUE]
 
                            SergeProkofievplaysProkofiev[Dutton][FLAC+CUE]
 
                            永恒英文金曲精选4《TheBestOfEverlastingFavouritesVol.4》[WAV+CUE]
 
                            群星《国风超有戏 第9期》[320K/MP3][13.63MB]
 
                            群星《国风超有戏 第9期》[FLAC/分轨][72.56MB]

                        
                    
                            
                        
                    
                
            
            
                
                    友情链接 
                
                    
                        杰晶网络
                        DDR爱好者之家
                        桃源资源网
                        杰网资源
                        富贵资源网
                        南强小屋
                        铁雪资源网
                        幽灵资源网
                        万梅资源网
                        狼山资源网
                        白云岛资源网
                        昆仑资源网
                        相思资源网
                        明霞山资源网
                        内蒙古资源网
                        黑松山资源网
                        茶园资源网
                        饿虎岗资源网
                        大旗谷资源网
                        常春岛资源网
                        岱庙资源网
                        兴国资源网
                        快活林资源网
                        蝙蝠岛资源网
                        帝王谷资源网
                        白云城资源网
                        伏龙阁资源网
                        清风细雨楼
                        天枫庄资源网
                        圆月山庄资源网
                        无争山庄资源网
                        神水资源网
                        移花宫资源网
                        神剑山庄资源网
                        无为清净楼资源网
                        金钱帮资源网
                        丐帮资源网
                        华山资源网
                        极乐门资源网
                        小李飞刀资源网
                        凤求凰客栈
                        风云阁资源网
                        金狮镖局
                        鸳鸯亭资源网
                        千金楼资源网
                        更多链接
                    
                
            
            华山资源网 Design By www.eoogi.com
            
                
                    
                        
                    
                    
                        
                    
                
                
                    
                        Copyright © 2006~2023
                         华山资源网 Design by www.eoogi.com  手机版

Python中正则表达式详解

详解使用python的logging模块在stdout输出的两种方法

用Python设计一个经典小游戏

评论“Python中正则表达式详解”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存