• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >编程问答 > python正则表达式的匹配。

python正则表达式的匹配。

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2017-06-07

佚名通过本文主要向大家介绍了python 正则表达式,python正则表达式教程,python正则表达式语法,python3 正则表达式,python中正则表达式等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题:python正则表达式的匹配。
描述:

如果想要匹配这样的html代码

<div>
    xxxxxxxxxxx
</div>

取出其中的xxxxx的内容
我是这样做的

#raw_data为读取的html代码
pattern=re.compile(r'<div>(.*?)</div>$')
items=re.findall(pattern,raw_data)

items为空,我想知道匹配的情况错在了那里


解决方案1:

非要用正则的话,可以这样写:

r'<div>\n\s+(\S+)\s+</div>'

注:\s表示匹配空白字符,\S表示匹配非空白字符,而用+表示非贪婪匹配

解决方案2:

(点符号)匹配的是除了换行符“\n”以外的所有字符
你要进行正则处理的HTML 是有换行的。
所以应该把换行情况也考虑进去(.|\n)

解决方案3:

想了想,我还是推荐题主用xpath去解析HTML或xml。
例子 http://outofmemory.cn/code-snippet/11036/python-xpath-minidom-parse-xm...
在爬虫过程中可能还会遇到更加复杂的结构,用xpath会更加得心应手。

解决方案4:

$,把这个去掉


分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 正则表达式Python正则表达式问题,?i什么意思
  • python正则前瞻后瞻无法匹配到正确的内容
  • python正则表达式,怎么不能搜索所有的符合项。
  • (python)有关正则表达式的问题
  • python这个正则表达式中符号表示什么意思?
  • (python)关于正则显示金额的问题
  • 正则表达式python正则表达式难题。
  • 正则表达式(python)为什么正则表达式抓取不到数据?
  • 正则表达式替换Python正则替换所有标签内的引号
  • 正则表达式python正则表达式?=匹配的问题

相关文章

  • 2017-06-07 (shell)七牛token无法获得?
  • 2017-06-07 django(python)django表单处理
  • 2017-06-07 rails入门时的NoMethodErrorinArticles#show
  • 2017-06-07 急。。求助HQL问题
  • 2017-06-07 关于表单上传的建议
  • 2017-06-07 七牛云存储使用JAVASDK是经过本地服务器中转到云上去么
  • 2017-06-07 一小段scala代码看不懂?
  • 2017-06-07 排队算法问题
  • 2017-06-07 flaskFlask内如何跳转至其他页面。
  • 2017-06-07 王爽<<汇编>>第二章最后一个练习题,没看明白,求解释:

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • 忘记七牛登录邮箱地址如何找回??
    • 关于邻接表占用空间的问题
    • 七牛有没有直接与git仓库绑定的功能
    • python终端无输出结构
    • 运行Python脚本报name"webdriver"isnotdefined,求解决方案
    • 外包一个页面--顺便推荐这个网络收藏夹--偶得
    • (python)用requests进行爬虫,怎么获得有cookie的字典?
    • 关于油画价格计算的规律求解!
    • BloomFilter在爬虫里该如何用?
    • python3分片赋值步长的问题

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有