• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >正则表达式 > 正则表达式 应用四则

正则表达式 应用四则

作者: 字体:[增加 减小] 来源:互联网 时间:2017-05-11

通过本文主要向大家介绍了正则表达式的应用,js正则表达式的应用,正则表达式应用实例,正则表达式,正则表达式语法等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com
以前就想总结一下,一直没有时间,今天看见了一篇好文,特此贡献出来,尽情享受正则的强大功能吧!!
以下为正文内容:
------------------------------------------------------------

正则表达式(Regular Expression)为字符串模式匹配提供了一种高效、方便的方法。几乎所有高级语言都提供了对正则表达式的支持,或者提供了现成的代码库供调用。本文以ASP环境中常见的处理任务为例,介绍正则表达式的应用技巧。 

    一、检验密码和邮件地址的格式 

    我们的第一个实例示范正则表达式的一项基本功能:抽象地描述任意复杂的字符串。它的意思就是,正则表达式给予程序员一种形式化的字符串描述方法,只需很少的代码即可描述出应用遇到的任意字符串模式。例如,对于不从事技术工作的人来说,密码格式的要求可以描述如下:密码的第一个字符必须是字母,密码最少4个字符且不超过15个字符,密码不能包含除字母、数字和下划线以外的字符。 

    作为程序员,我们必须把上面对密码格式的自然语言描述转换成其他形式,使得ASP页面能够理解并应用它来防止非法的密码输入。描述这个密码格式的正则表达式是:^[a-zA-Z]\w{3,14}$。 

    在ASP应用里,我们可以把密码验证过程写成可重用的函数,如下所示: 

  Function TestPassword(strPassword) 
  Dim re 
  Set re = new RegExp 

  re.IgnoreCase = false 
  re.global = false 
  re.Pattern = "^[a-zA-Z]\w{3,14}$" 

  TestPassword = re.Test(strPassword) 
  End Function 

    下面我们把这个检验密码格式的正则表达式和自然语言描述对比着看看: 

    密码的第一个字符必须是字母:正则表达式描述是“^[a-zA-Z]”,其中“^”表示字符串的开始,连字符告诉RegExp匹配指定范围的所有字符。 

    密码最少4个字符且不超过15个字符:正则表达式描述是“{3,14}”。 

    密码不能包含除字母、数字和下划线以外的字符:正则表达式描述是“\w”。 

    几点说明:{3,14}表示前面的模式匹配至少3个、但不超过14个的字符(加上第一个字符就成了4到15个字符)。注意花括号内的语法要求极其严格,不允许在逗号的两边加入空格。如果加入了空格,它将对正则表达式的含义产生影响,导致密码格式检验时产生错误。另外,上面的正则表达式末尾也没有加上“$”字符。$字符使得正则表达式匹配字符串直至末尾,确保合法的密码后面没有加上任何其他字符。 

    类似于密码格式检验,检查email地址的合法性也是一个很常见的问题,用正则表达式进行简单的email地址检验可以实现如下: 

  <% 
  Dim re 
  Set re = new RegExp 

  re.pattern = "^\w+@[a-zA-Z_]+?\.[a-zA-Z]{2,3}$" 
  Response.Write re.Test("aabb@yahoo.com") 
  %> 
------------------------------------------------------
二、提取HTML页面的特定部分 

    从HTML页面提取内容所面临的主要问题是,我们必须寻找一种方法精确地识别出自己想要的那一部分内容。例如,下面是一个显示新闻标题的HTML代码片断: 

  <table border="0" width="11%" class="Somestory"> 
  <tr> 
  <td width="100%"> 
  <p align="center">其他内容...</td> 
  </tr> 
  </table> 
  <table border="0" width="11%" class="Headline"> 
  <tr> 
  <td width="100%"> 
  <p align="center">伊拉克战争!</td> 
  </tr> 
  </table> 
  <table border="0" width="11%" class="Someotherstory"> 
  <tr> 
  <td width="100%"> 
  <p align="center">其他内容...</td> 
  </tr> 
  </table> 

    观察上述代码,很容易看出新闻标题由位于中间的表格显示,它的class属性设置为Headline。如果HTML页面非常复杂,使用Microsoft IE从5.0开始提供的一项附加功能可以只查看被选中部分页面的HTML代码,请访问http://www.microsoft.com/Windows/ie/WebAccess/default.ASP了解详情。对于本例,我们假定这是唯一class属性设置为Headline的表格。现在我们要创建正则表达式,通过正则表达式找到这个Headline表格并把这个表格包含到自己的页面中。首先是编写支持正则表达式的代码: 

  <% 
  Dim re, strHTML 
  Set re = new RegExp ' 创建正则表达式对象 

  re.IgnoreCase = true 
  re.Global = false ' 第一次匹配之后结束查找 
  %> 

    下面考虑一下我们要提取的区域:在这里,我们要提取的是整个<table>结构,包括结束标记和新闻标题的文本。因此查找的起始字符应该是<table>开始标记: re.Pattern = "<table.*(?=Headline)"。这个正则表达式匹配表格的开始标记,能够返回开始标记直至“Headline”之间的所有内容(换行除外)。下面是返回已匹配HTML代码的方法: 

  ' 把所有匹配的HTML代码放入Matches集合 
  Set Matches = re.Execute(strHTML) 

  ' 显示所有匹配的HTML代码 
  For Each Item in Matches 
  Response.Write Item.Value 
  Next 

  ' 显示其中一项 
  Response.write Matches.Item(0).Value 

    运行这段代码处理前面显示的HTML片断,正则表达式返回一次匹配的内容如下: <table border="0" width="11%" class="。正则表达式中的“(?=Headline)”没有获取字符,所以不能看到表格class属性的值。要获取表格剩余部分的代码也相当简单: re.Pattern = "<table.*(?=Headline)(.|\n)*?</table>"。其中:“(.|\n)”后面的“*”匹配0个到多个任意字符;而“?”使得“*”匹配范围最小化,即在找到表达式的下一部分之前匹配尽可能少的字符。</table>是表格的结束标记。 

    “?”限制符非常重要,它防止了表达式返回其他表格的代码。例如对于前面给出的HTML代码片断,如果删除这个“?”则返回内容将是: 

  <table border="0" width="11%" class="Headline"> 
  <tr> 
  <td width="100%"> 
  <p align="center">伊拉克战争!</td> 
  </tr> 
  </table> 
  <table border="0" width="11%" class="Someotherstory"> 
  <tr> 
  <td width="100%"> 
  <p align="center">其他内容...</td> 
  </tr> 
  </table> 

   
    返回的内容不仅包含了Headline表的<table>标记,而且还包含了Someotherstory表格,由此可以看出,这里的“?”是必不可少的。 

    本例假设了一些相当理想化的前提。实际应用中情况往往要复杂得多,特别是你对正在使用的源HTML代码的编写没有任何影响力时,编写ASP代码尤为困难。最有效的方法是,多花些时间分析待提取内容附近的HTML,经常地测试,确保提取出来的内容正是自己所需要的。另外,应当重视并处理正则表达式不能匹配源HTML页面任何内容的情形。内容的更新可能非常快速,不要只因为别人改变了内容的格式而让自己的页面出现低级可笑的错误。
----------------------------------------------------
三、解析文本数据文件 

    数据文件的格式和种类很多,XML文档、结构化文本甚至非结构化文本都经常成为ASP应用的数据源。下面我们要看的一个例子是使用限定符的结构化文本文件。限定符(比如引号)表示字符串各个部分不可分割,即使字符串内部包含把记录分隔成字段的分隔符也一样。 

    下面是一个简单的结构化文本文件: 

  姓,名, 电话, 说明 
  孙,悟空, 312 
分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • 正则表达式在IOS中的应用及IOS中三种正则表达式的使用与比较
  • 正则表达式检查来访IP是否合法的实际应用
  • 正则表达式 应用四则
  • 正则表达式的应用

相关文章

  • 2017-05-11PHP 正则表达式分析RSS
  • 2017-05-11[正则表达式]贪婪模式与非贪婪模式
  • 2017-05-11让URL只允许一些字符的正则表达式
  • 2017-05-11Javascript Validation for email(正则表达式) 英文翻译
  • 2017-05-11利用正则表达式提取固定字符之间的字符串
  • 2017-05-11判断用户输入的银行卡号是否正确的方法(基于Luhn算法的格式校验)
  • 2017-05-11最全最实用的正则表达式大全分享
  • 2017-05-11asp 正则表达式检测http开头的函数
  • 2017-05-11利用正则快速找出两个字符串的不同字符
  • 2017-05-11vbs:把一段文字中指定字符颜色变成红色的正则

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • 正则表达式详细介绍(下)
    • ubb代码转换为html
    • VS里的正则表达式的替换技巧
    • 用正则表达式来判断素数的代码
    • 正则表达式基本语法详解
    • js正则表达式常用函数详解(续)
    • js 常用正则表达式表单验证代码
    • vbs:一段比较精简的代码实现取得字符串的"字节"数
    • 正则表达式 口诀 学习正则的朋友看看
    • PHP 正则表达式的几则使用技巧

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有