什么是 RegExp?
-
RegExp 是正则表达式(Regular expression)的缩写,作用是对字符串执行模式匹配。
-
通常用于格式验证、正则替换、查找子串等
-
各种编程语言的正则表达式基本相同,不同的语言可能会有一些细小的差别
-
RegExp入门:http://www.w3school.com.cn/js/js_obj_regexp.asp
-
完整的 RegExp 对象参考手册:http://www.w3school.com.cn/jsref/jsref_obj_regexp.asp
-
PHP 正则表达式:http://www.imooc.com/learn/350
-
javascript 正则表达式:http://www.imooc.com/learn/706
-
Python 正则表达式:http://www.imooc.com/learn/550
RegExp 语法
// 直接实例化
var reg = new RegExp(pattern [, flags]);
// 隐式创建(推荐)
var reg = /pattern/flags;
参数 pattern 是一个字符串,指定了正则表达式的模式或其他正则表达式。
参数 [, flags] 是一个可选的字符串,包含属性 “g”(global )、”i” (ignoreCase)和 “m”(multiline)。
ECMAScript 标准化之前,不支持 m 属性。如果 pattern 是正则表达式,而不是字符串,则必须省略该参数。
概念:子表达式
在正则表达式中,使用括号括起来的内容是一个子表达式,子表达式匹配到的内容会被系统捕获至缓冲区,使用\n(n:数字)来反向引用系统的第n号缓冲区的内容。
场景:后面的内容要求与前面的一致,可以使用子表达式
// 查找连续相同的四个数字
var str = "1212ab45677778cd";
var reg = /(\d)\1\1\1/gi;
console.log(str.match(reg));
// OUTPUT:7777
概念:方括号(字符簇)
var str = "Is this all there is?";
var patt1 = /[a-h]/g;
document.write(str.match(patt1));
// OUTPUT:h,a,h,e,e
方括号 | 作用 |
---|---|
[abc] | 查找方括号之间的任何字符。 |
[^abc] | 查找任何不在方括号之间的字符。 |
[0-9] | 查找任何从 0 至 9 的数字。同 \d |
[a-z] | 查找任何从小写 a 到小写 z 的字符。 |
[A-Z] | 查找任何从大写 A 到大写 Z 的字符。 |
[A-z] | 查找任何从大写 A 到小写 z 的字符。 |
[0-9a-zA-Z] | 查找0-9,a-z,A-Z |
概念:元字符
元字符(Metacharacter)是拥有特殊含义的字符:
元字符 | 作用 |
---|---|
\ | 转义符 (、)、/、\ |
| | 选择匹配符,可以匹配多个规则 |
. | 查找单个字符,除了换行和行结束符。 |
\w | 查找单词字符。字符 ( 字母 ,数字,下划线_ ) |
\W | 查找非单词字符。 |
\d | 查找数字。 |
\D | 查找非数字字符。 |
\s | 查找空白字符。空格 |
\S | 查找非空白字符。 |
\b | 匹配单词边界。 |
\B | 匹配非单词边界。 |
\0 | 查找 NUL 字符。 |
\n | 查找换行符。 |
\f | 查找换页符。 |
\r | 查找回车符。 |
\t | 查找制表符。 |
\v | 查找垂直制表符。 |
\xxx | 查找以八进制数 xxx 规定的字符。 |
\xdd | 查找以十六进制数 dd 规定的字符。 |
\uxxxx | 查找以十六进制数 xxxx 规定的 Unicode 字符。 |
概念:量词
量词 | 作用 |
---|---|
n+ | 匹配任何包含至少一个 n 的字符串。同 {1,} |
n* | 匹配任何包含零个或多个 n 的字符串。同 {0,} |
n? | 匹配任何包含零个或一个 n 的字符串。同 {0,1} |
n{X} | 匹配包含 X 个 n 的序列的字符串。 |
n{X,Y} | 匹配包含 X 至 Y 个 n 的序列的字符串。 |
n{X,} | 匹配包含至少 X 个 n 的序列的字符串。 |
n$ | 匹配任何结尾为 n 的字符串。 |
^n | 匹配任何开头为 n 的字符串。注意 /[^a] / 和 /^ [a]/是不一样的,前者是排除的,后者是代表首位。 |
(?=n) | 匹配任何其后紧接指定字符串 n 的字符串。正向预查 |
(?!n) | 匹配任何其后没有紧接指定字符串 n 的字符串。反向预查 |
RegExp 对象方法
test()
test() 方法检索字符串中是否存在指定的值。返回值是 true 或 false。
var patt1 = new RegExp('e');
console.log(patt1.test('some text'));
// OUTPUT:true
var patt2 = new RegExp('ee');
console.log(patt2.test('some text'));
// OUTPUT:false
// 判断是不是QQ号
// 1 首位不能是0 ^[1-9]
// 2 必须是 [5, 11] 位的数字 \d{4, 9}
var str = '80583600';
var regexp = /^[1-9][0-9]{4,10}$/gim;
if (regexp.test(str)) {
alert('is');
} else {
alert('no');
}
exec()
exec() 方法检索字符串中的指定值。返回值是被找到的值。如果没有发现匹配,则返回 null。
var patt1 = new RegExp('e');
console.log(patt1.exec('some text'));
// OUTPUT:e
var patt2 = new RegExp('ee');
console.log(patt2.exec('some text'));
// OUTPUT:null
compile()
compile() 既可以改变检索模式,也可以添加或删除第二个参数。
var patt1=new RegExp("e");
document.write(patt1.test("The best things in life are free")); // true
// 改变了检索模式
patt1.compile("eee");
document.write(patt1.test("The best things in life are free")); // false
支持正则表达式的 String 对象的方法
search 检索与正则表达式相匹配的值。
var str = "Visit W3School!"
console.log(str.search(/W3School/))
// OUTPUT:6
match 找到一个或多个正则表达式的匹配。
var str="1 plus 2 equal 3"
console.log(str.match(/\d+/g))
// OUTPUT:1,2,3
replace 替换与正则表达式匹配的子串。
var str = "Visit Microsoft!"
console.log(str.replace(/Microsoft/, "W3School"));
// OUTPUT:Visit W3School!
// 找重复项最多的字符个数
var str = 'g21ss4aeba_ersb43sgnnsssstht6sss60snnsj8resw0_ss';
// split : 将字符串转化为数组
// sort : 对数组排序,ASCII
// join : 将数组转化为字符串
var str_new = str.split('').sort().join('');
document.write(str + '<br>');
document.write(str.split('') + '<br>');
document.write(str.split('').sort() + '<br>');
document.wri