• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >编程问答 > python正则表达式怎么匹配这段中文?

python正则表达式怎么匹配这段中文?

作者:佚名 字体:[增加 减小] 来源:互联网 时间:2017-06-07

佚名通过本文主要向大家介绍了python 正则表达式,python正则表达式教程,python正则表达式语法,python3 正则表达式,python中正则表达式等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
问题:python正则表达式怎么匹配这段中文?
描述:

下面这段文字,用xpath找到后,需要把意大利和西班牙两部分所包含内容分开保存,用正则表达式应该怎么写?

<div>
    <p>
        意大利:<br />
        1、全称意大利共和国<br />
        2、由南欧的亚平宁半岛及两个位于地中海中的岛屿西西里岛与萨丁岛所组成<br />
        3、国土面积为301333平方公里<br />
        <br />
        西班牙:<br />
        1、1492年10月12日独立<br />
        2、是一个位于欧洲西南部的国家<br />
        3、西邻同处于伊比利亚半岛的葡萄牙,北濒比斯开湾,东北部与法国及安道尔接壤,南隔直布罗陀海峡与非洲的摩洛哥相望<br />
    </p>
</div>

我是这样写的,但是总是匹配不出来:

desc =sel.xpath('//div[@class="des"]').extract()[0]
item['italy'] = re.search('意大利:(.*?)西班牙',desc,re.S).group(1)
item['spain'] = re.search('西班牙:(.*?)</p>',desc,re.S).group(1)

提示信息是:
备注:网页是gbk编码

AttributeError: 'NoneType' object has no attribute 'group'

解决方案1:

你缺了跨行匹配

如果你的desc是str

desc =sel.xpath('//div[@class="des"]').extract()[0]
item['italy'] = re.search('意大利:(.*?)西班牙',desc,re.S | re.M).group(1)
item['spain'] = re.search('西班牙:(.*?)</p>',desc,re.S | re.M).group(1)

如果你的desc是unicode

desc =sel.xpath('//div[@class="des"]').extract()[0]
item['italy'] = re.search(u'意大利:(.*?)西班牙',desc,re.S | re.M).group(1)
item['spain'] = re.search(u'西班牙:(.*?)</p>',desc,re.S | re.M).group(1)


分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 正则表达式Python正则表达式问题,?i什么意思
  • python正则前瞻后瞻无法匹配到正确的内容
  • python正则表达式,怎么不能搜索所有的符合项。
  • (python)有关正则表达式的问题
  • python这个正则表达式中符号表示什么意思?
  • (python)关于正则显示金额的问题
  • 正则表达式python正则表达式难题。
  • 正则表达式(python)为什么正则表达式抓取不到数据?
  • 正则表达式替换Python正则替换所有标签内的引号
  • 正则表达式python正则表达式?=匹配的问题

相关文章

  • 2017-06-07 (python)用pycharm写jinja模版的时候怎么让他自动补全啊?
  • 2017-06-07 python作业题:运算切蛋糕
  • 2017-06-07 百度图片搜索结果图片访问出现“403Forbidden”怎么解决?
  • 2017-06-07 关于JPDL和BPMN对应关系
  • 2017-06-07 AMDMantle与MediaSDK的异同
  • 2017-06-07 python执行cmd命令遇到中文字符
  • 2017-06-07 人弃我取人取我与数组名取地址
  • 2017-06-07 mac下的svn工具cornerstone不显示timeline也不能回滚到以前的版本这是为什么呢
  • 2017-06-07 jboss关闭日志在线等
  • 2017-06-07 哪些算数据请求?

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • 有视频c#的持久化处理的例子吗
    • Shell的iconv命令无法转换带有半角空格的文本,请问原因是?解决方法又是?
    • 微信如何分享音乐应用图标更新后,微信分享仍显示老图标,咋整?
    • golang如何控制打印机打印文件,比如Excel档案?
    • python爬虫python文件wirte方法卡死
    • (python)scrapy抓不到起始网页内容
    • 七牛表单上传图片,不能覆盖?
    • jbossweb有服务,但没有进程
    • 用adobepdfSDK开发
    • database/sql限制只能返回一组行集,mysql的存储过程一次会返回多组行集,怎么解决啊?

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有