经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 其他 » 正则表达式 » 查看文章
Python正则表达式的小练习分享
来源:jb51  时间:2022/4/18 12:05:19  对本文有异议

匹配网址 url 的小练习

定义一个函数,判断 url 是否是一个正常的地址。

定义一个函数,只获取 url 的域名部分

  1. import re
  2.  
  3.  
  4. url_ture = "https://www.csdn.net/"
  5. url_false = "ftp://110.110.110.110:8080"
  6.  
  7. def check_url(url):
  8. result = re.findall('[a-zA-z]{4,5}://\w*\.*\w+\.\w+', url)
  9.  
  10. if not len(result) == 0:
  11. return 'url 是一个合法的网站地址'
  12. else:
  13. return 'url 是一个不合法的网站地址'
  14.  
  15.  
  16. def get_url(url):
  17. result = re.findall('https://(\w*\.*\w+\.\w+)', url)
  18.  
  19. if not len(result) == 0:
  20. return result[0]
  21. else:
  22. return []
  23.  
  24.  
  25.  
  26. if __name__ == '__main__':
  27. result_true = check_url(url_ture)
  28. print(result_true)
  29. result_false = check_url(url_false)
  30. print(result_false)
  31.  
  32. result_url_01 = check_url("http://csdn.com")
  33. print(result_url_01)
  34. result_url_02 = check_url("https://www.csdn.com")
  35. print(result_url_02)
  36.  
  37. get_url_true = get_url(url_ture)
  38. print(get_url_true)
  39. get_url_false = get_url(url_false)
  40. print(get_url_false)

执行结果如下:

匹配邮箱地址的小练习

定义一个函数,获取邮箱的地址。

  1. import re
  2.  
  3.  
  4. email = "Neo@protonmail.com"
  5.  
  6.  
  7. def get_email(email):
  8. # result = re.findall('[0-9a-zA-Z]+@[0-9a-zA-Z]+\.[a-zA-Z]+', email) # 这样写比较复杂,可以使用通配符
  9. result = re.findall('.+@.+\.[a-zA-Z]', email)
  10. return result
  11.  
  12.  
  13. if __name__ == '__main__':
  14. get_email = get_email(email)
  15. print(get_email)
  16. # >>> 执行结果如下:
  17. # >>> ['Neo@protonmail.com']

获取前端代码内容的练习

接下来做一个稍微复杂一些的练习:

定义一个函数,获取一段前端代码中双引号包裹的内容。

定义一个函数,获取该段前端代码中所有的双引号包裹的内容

  1. import re
  2.  
  3.  
  4. html = ('<div class="s-top-nav" style="display:none;">'
  5. '</div><div class="s-center-box"></div>') # 这是前端代码,暂时不用理解是什么意思
  6.  
  7.  
  8. def get_html_data(html):
  9. re_g = re.compile('style="(.*?)"') # 非贪婪模式获取 style 标签的内容
  10. result = re_g.findall(html)
  11. return result
  12.  
  13.  
  14. def get_all_data_html(html):
  15. re_g = re.compile('="(.+?)"')
  16. result = re_g.findall(html)
  17. return result
  18.  
  19.  
  20. if __name__ == '__main__':
  21. get_html_data = get_html_data(html)
  22. print(get_html_data)
  23.  
  24. get_all_data_html = get_all_data_html(html)
  25. print(get_all_data_html)
  26. # >>> 执行结果如下:
  27. # >>> ['display:none;']
  28. # >>> ['s-top-nav', 'display:none;', 's-center-box']

通过获取前端代码标签内容的例子,我们可以看出,只要找到字符串的规律,通过这些规律去定义正则匹配的规则就可以拿到想要的信息。

OK,今天的练习就到这里了。正则表达式最最核心最最重要的就是匹配的相关操作, findall 与 search 函数就是常用的两个函数,以及其它函数的匹配规律都是完全相同的,只不过它们返回的值会存在着不同,或者说这些函数的使用场景存在着一定的区别,但是返回的结果几乎都是相同的。

到此这篇关于Python正则表达式的小练习分享的文章就介绍到这了,更多相关Python正则表达式练习内容请搜索w3xue以前的文章或继续浏览下面的相关文章希望大家以后多多支持w3xue!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号