python中正则表达式与模式匹配

作者 : 开心源码 本文共1951个字,预计阅读时间需要5分钟 发布时间: 2022-05-12 共164人阅读

在之前找工作过程中,面试时经常被问到会不会python,懂不懂正则表达式。心里想:软件的东西和芯片设计有什么关系?咱也不知道由于啥用这个,咱也不敢问啊!在网上搜索到了一篇关于脚本在ASIC领域中应用的文章(原文见参考文献1),里边提到了python的用武之地:

image

本文以《Python编程快速上手——让繁琐工作自动化》书中的示例,讲述利用python实现文本中特定内容提取的方式。

二、提取特定内容示例

需求:找出文本中所有的电话号码和邮件地址。设计方案:在剪贴板的文本中提取出所有与电话号码和邮件地址格式匹配的字符串。有了需求和设计方案,现根据电话号码和邮箱地址格式编写正则表达式。先来看看程序代码,再做讲解。

 1 import pyperclip,re 2  3 #phoneNumber:415-555-4242 x331 4 #email address:info@nostarch.com 5  6 phoneRegex = re.compile(r'''( #0 all 7 (\d{3}|\(\d{3}\))? #1 area code 8 (\s|-|\.)? #2 separator 9 (\d{3}) #3 first 3 digits10 (\s|-|\.) #4 separator11 (\d{4}) #5 last 4 digits12 (\s*(ext|x|ext\.)\s*(\d{2,5}))? #6 7 8extension13 )''',re.VERBOSE)14 15 emailRegex = re.compile(r'''( #0 all16 [a-zA-Z0-9._%+-]+ # username17 @ # @ symbol18 [a-zA-Z0-9.-]+ # domain name19 (\.[a-zA-Z]{2,4}) #1 dot-something20 )''',re.VERBOSE)21 22 #Find matches in clipboard text.23 text = str(pyperclip.paste())24 mo1 = phoneRegex.findall(text)25 mo2 = emailRegex.findall(text)26 print(mo1)27 print(mo2)28 matches = []29 for groups in phoneRegex.findall(text):30 phoneNum = '-'.join([groups[1],groups[3],groups[5]])31 if groups[8] != '':32 phoneNum += ' x' + groups[8]33 matches.append(phoneNum)34 35 for groups in emailRegex.findall(text):36 matches.append(groups[0])37 38 #Copy results to the clipboard39 if len(matches) > 0:40 pyperclip.copy('\n'.join(matches))41 print('Copied to clipboard:')42 print('\n'.join(matches))43 else:44 print('No phone numbers or email address found.')

此处电话号码的格式是:三个数字组成的区号(可选),三个数字,四个数字,任意数空格+ext/x/ext.+任意数空格+2到5个数字组成的分机号(可选)。每个部分间以“-”号连接。邮箱地址格式:由字母、数字以及_%+-符号组成的客户名,@符号以及.后的域名,域名由2-4个字母和数字集合组成。根据上述模式可编写对应的正则表达式。

python的模式匹配有一个简单固定的套路,import导入re包,regex = re.compile(”'<正则表达式>”’)。<模式匹配的内容列表> = regex.findall(<待搜索字符串>)。三步搞定。编写正则表达式时,在字符串前加r防止字符转义。将各个部分分组并换行以提高代码的可读性,此时需要将re.VERBOSE作为re.compile()函数的第二个参数传入来忽略表达式中的空白和换行。

三、运行结果

复制代码首部注释掉的文本,而后运行程序。结果如下:

image

前两行打印出了匹配内容的列表,之后以自己设置的统一格式打印欲搜索的内容。程序运行结果正确。本文以一个小例子测试了python正则表达式提取文本特定内容的功能,之后想尝试利用python自动生成verilogHDL中module的例化模板。

Python学习交流群:556370268,这里有资源共享,技术解答,还有小编从最基础的Python资料到项目实战的学习资料都有整理,希望能帮助你更理解python,学习python。

image

说明
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是摆设,本站源码仅提供给会员学习使用!
7. 如遇到加密压缩包,请使用360解压,如遇到无法解压的请联系管理员
开心源码网 » python中正则表达式与模式匹配

发表回复