经验首页 前端设计 程序设计 Java相关 移动开发 数据库/运维 软件/图像 大数据/云计算 其他经验
当前位置:技术经验 » 其他 » 正则表达式 » 查看文章
python 正则表达式获取字符串中所有的日期和时间
来源:jb51  时间:2019/10/29 10:08:15  对本文有异议

提取日期前的处理

1.处理文本数据的日期格式统一化

  1. text = "2015年8月31日,衢州元立金属制品有限公司仓储公司(以下简称元立仓储公司)成品仓库发生一起物体打击事故,造成直接经济损失95万元。"
  2. text1 = "2015/12/28下达行政处罚决定书"
  3. text2 = "2015年8月发生一起物体打击事故"
  4. # 对文本处理一下 # 2015-8-31 2015-12-28
  5. text = text.replace("年", "-").replace("月", "-").replace("日", " ").replace("/", "-").strip()

2.提取时间的正则表达式

  1. # 2019年10月27日 9:46:21
  2. "(\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2}:\d{1,2})"
  3. # 2019年10月27日 9:46"
  4. "(\d{4}-\d{1,2}-\d{1,2})"
  5. # 2019年10月27日
  6. "(\d{4}-\d{1,2}-\d{1,2})"
  7. # 2019年10月
  8. "(\d{4}-\d{1,2})"

3.对其进行封装

  1. def get_strtime(text):
  2. text = text.replace("年", "-").replace("月", "-").replace("日", " ").replace("/", "-").strip()
  3. text = re.sub("\s+", " ", text)
  4. t = ""
  5. regex_list = [
  6. # 2013年8月15日 22:46:21
  7. "(\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2}:\d{1,2})",
  8. # "2013年8月15日 22:46"
  9. "(\d{4}-\d{1,2}-\d{1,2} \d{1,2}:\d{1,2})",
  10. # "2014年5月11日"
  11. "(\d{4}-\d{1,2}-\d{1,2})",
  12. # "2014年5月"
  13. "(\d{4}-\d{1,2})",
  14. ]
  15. for regex in regex_list:
  16. t = re.search(regex, text)
  17. if t:
  18. t = t.group(1)
  19. return t
  20. else:
  21. print("没有获取到有效日期")
  22. return t

ps:下面看下python提取字符串中日期

  1. import re
  2. #删除字符串中的中文字符
  3. def subChar(str):
  4. match=re.compile(u'[\u4e00-\u9fa5]')
  5. return match.sub('',str)
  6. #提取日期
  7. def extractDate(str):
  8. if not str:
  9. return None
  10. raw=subChar(str)
  11. if not raw:
  12. return None
  13. #提取前10位字符
  14. rawdate=raw[:10]
  15. datelist=re.findall("\d+",rawdate)
  16. if not datelist:
  17. return None
  18. if datelist.__len__()==3:
  19. if (float(datelist[0])>2099 or float(datelist[0])<1900) or float(datelist[1])>12 or float(datelist[2])>31:
  20. return None
  21. else:
  22. return '-'.join(datelist)
  23. if datelist.__len__()==2:
  24. if (float(datelist[0])>2099 or float(datelist[0])<1900) or float(datelist[1])>12:
  25. return None
  26. else:
  27. datelist.append('01')
  28. return '-'.join(datelist)
  29. if datelist.__len__()==1:
  30. if float(datelist[0])>20991231 or float(datelist[0])<19000101:
  31. return None
  32. else:
  33. return datelist[0]
  34. return None

总结

以上所述是小编给大家介绍的python 正则表达式获取字符串中所有的日期和时间,希望对大家有所帮助,如果大家有任何疑问请给我留言,小编会及时回复大家的。在此也非常感谢大家对w3xue网站的支持!
如果你觉得本文对你有帮助,欢迎转载,烦请注明出处,谢谢!

 友情链接:直通硅谷  点职佳  北美留学生论坛

本站QQ群:前端 618073944 | Java 606181507 | Python 626812652 | C/C++ 612253063 | 微信 634508462 | 苹果 692586424 | C#/.net 182808419 | PHP 305140648 | 运维 608723728

W3xue 的所有内容仅供测试,对任何法律问题及风险不承担任何责任。通过使用本站内容随之而来的风险与本站无关。
关于我们  |  意见建议  |  捐助我们  |  报错有奖  |  广告合作、友情链接(目前9元/月)请联系QQ:27243702 沸活量
皖ICP备17017327号-2 皖公网安备34020702000426号