• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >C#教程 > C#正则表达式匹配HTML中的图片路径,图片地址代码

C#正则表达式匹配HTML中的图片路径,图片地址代码

作者: 字体:[增加 减小] 来源:互联网 时间:2017-05-28

通过本文主要向大家介绍了c#正则表达式,c#正则表达式语法,c#正则表达式生成器,c#正则表达式用法,c#正则表达式大全等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
一般来说一个 HTML 文档有很多标签,比如“<html>”、“<body>”、“<table>”等,想把文档中的 img 标签提取出来并不是一件容易的事。由于 img 标签样式变化多端,使提取的时候用程序寻找并不容易。于是想要寻找它们就必须写一个非常健全的正则表达式,不然有可能会找得不全,或者找出来的不是正确的 img 标签。
我们可以从 HTML 标签的格式去想应该怎么建这个正则表达式。首先要想一下 img 标签有几种写法,忽略大小写不看的话,下面列出 img 标签可能出现的几种情况。
<img> <img/> <img src=/>
这一些标签不用考虑,因为没有图片资源地址。

<img src = /images/pic.jpg/ > <img src =" /images/pic.jpg" > <img src= '/images/pic.jpg ' / >
这一些标签都有图片资源地址,另外还有一个特点就是有引号对,可能为单引号,也可能为双引号。因为不需要同时匹配引号对,所以正则表达式可以这么写:@"<img\s*src\s*=\s*[""']?\s*(?[^\s""'<>]*)\s*/?\s*>"

<img width="320" height="240" src=/images/pic.jpg onclick="window.open('/images/pic.jpg')">
因为 img 和 src 之间可能会有其他的参数,所以“<img”要有个单词结束,比如说不能是“<imgabc”,同样 src 前面也是一样,使用单词结束符“\b”有一个好处就是省去了表示空格的“\s*”。另外由于 img 标签中不可以出现“<”、“>”这样的符号,所以要改写前面的正则表达式:@"<img\b[^<>]*?\bsrc\s*=\s*[""']?\s*(?<imgUrl>[^\s""'<>]*)[^<>]*?/?\s*>"

<img width="320" height="240" src = "
/images/pic.jpg" />
像这种可能会用回车符折行的问题有时候会出现,所以在有空格分开的地方要包含回车换行和 TAB 字符,另外在图片地址中不能出现空格、TAB、回车和换行字符。所以上面的正则表达式可以改成:@"<img\b[^<>]*?\bsrc[\s\t\r\n]*=[\s\t\r\n]*[""']?[\s\t\r \n]*(?<imgUrl>[^\s\t\r\n""'<>]*)[^<>]*?/?[\s\t\r\n]*>"

下面写出取得HTML中所有图片地址的静态方法。

            // 搜索匹配的字符串             MatchCollection matches = regImg.Matches(sHtmlText);

            int i = 0;
            string[] sUrlList = new string[matches.Count];

            // 取得匹配项列表             foreach (Match match in matches)
                sUrlList[i++] = match.Groups["imgUrl"].Value;

            return sUrlList;
        }
</div>

</div>
分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 浅谈C#中正则表达式的使用
  • C#中常用的正则表达式实例
  • C#使用正则表达式过滤html标签
  • C#中的正则表达式双引号问题
  • C#语法相比其它语言比较独特的地方(三)
  • C#语法相比其它语言比较独特的地方(二)
  • C#语法相比其它语言比较独特的地方(一)
  • C#中实现输入汉字获取其拼音(汉字转拼音)的2种方法
  • C#正则表达式的递归匹配分析
  • C#正则表达式获取下拉菜单(select)的相关属性值

相关文章

  • 2017-05-28C#语法糖(Csharp Syntactic sugar)大汇总
  • 2017-05-28C#七大经典排序算法系列(上)
  • 2017-05-28C#排序算法的比较分析
  • 2017-05-28C#打印类PrintDocument、PrintDialog、PrintPreviewDialog使用示例
  • 2017-05-28C#中字符串的加密的源码
  • 2017-05-28C#枚举中的位运算权限分配浅谈
  • 2017-05-28C#图像线性变换的方法
  • 2017-05-28C#实现获取设置IP地址小工具
  • 2017-05-28c# 删除所有的空文件夹的小例子
  • 2017-05-28C#实现AddRange为数组添加多个元素的方法

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • C#实现创建,删除,查找,配置虚拟目录实例详解
    • c#模拟平抛运动动画的方法详解
    • C#实现从windows剪贴板获取内容的方法
    • 10个C#程序员经常用到的实用代码片段
    • C#使用默认浏览器打开网页的方法
    • C# 汉字转化拼音的简单实例代码
    • C#实现更改MDI窗体背景颜色的方法
    • Windows系统中使用C#读取文本文件内容的小示例
    • C# 判断字符串为空的几种办法
    • 关于System.Convert的那些事儿

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有