字符编码
JavaScript内部,字符以UTF-16的格式储存,每个字符固定为2个字节。对于那些需要4个字节储存的字符(Unicode码点大于0xFFFF的字符),JavaScript会认为它们是两个字符。然而汉字往往就是4个字节存储,ES6之前处理起来有些麻烦。
示例:字符编码
var ChineseName = "李刚";
var EnglishName = "ligang";
ChineseName.codePointAt(1); // 0x26446 0x21018
String.fromCodePoint(26446); // 李
**注意:**fromCodePoint方法定义在String对象上,而codePointAt方法定义在字符串的实例对象上。
/* 返回字符串给定位置的字符 */
ChineseName.at(0);// 李
EnglishName.at(0);// l
详见:【乱码,乱码】
查找函数
- includes():返回布尔值,表示是否找到了参数字符串。
- startsWith():返回布尔值,表示参数字符串是否在源字符串的头部。
- endsWith():返回布尔值,表示参数字符串是否在源字符串的尾部。
示例:
var str = "my name is ligang";
str.indexOf("ligang"); // 11
str.includes("ligang"); // true
str.startsWith("my"); // true
str.endsWith("ligang"); // true
repeat()
repeat方法返回一个新字符串,表示将原字符串重复n次。
"x".repeat(3); // xxx
【JavaScript补齐指定位数】中关于可扩充的解决方案,可以变得更简洁
示例:可扩充的解决方案-repeat实现
/**
* 可扩充的解决方案
* @param bits 格式化位数
* @param identifier 补全字符
* @param value 值
*/
function dataLeftCompleting(bits, identifier, value){
value = identifier.repeat(bits) + value;
return value.slice(-bits);
}
padStart()、padEnd()
符串补全长度的功能。如果某个字符串不够指定长度,会在头部或尾部补全。padStart用于头部补全,padEnd用于尾部补全。
"1".padStart(3, "0"); // 001
"123".padStart(3, "0"); // 001
上述补齐到指定位数问题就不存在了!!!
模板字符串
模板字符串(template string)是增强版的字符串,用反引号(`)标识。它可以当作普通字符串使用,也可以用来定义多行字符串,或者在字符串中嵌入变量。
let p = {
name: 'ligang',
age: 25
};
// 常规方法:字符串与变量拼接使用“+”
console.log('my name is ' + p.name + ', my age is ' + p.age);
// 模板字符串:直接使用“`”
console.log(my name is ${p.name}, my age is ${p.age});
示例:支持换行
var sql =
"slect * from Users " +
"where name = 'ligang'";
const sql =
`slect * from Users
where name = 'ligang';`
四、正则的扩展
JavaScript中字符串对象共有4个方法,可以使用正则表达式:match()、replace()、search()和split()。ES6将这4个方法,在语言内部全部调用RegExp的实例方法,从而做到所有与正则相关的方法,全都定义在RegExp对象上。
- String.prototype.match 调用 RegExp.prototype[Symbol.match]
- String.prototype.replace 调用 RegExp.prototype[Symbol.replace]
- String.prototype.search 调用 RegExp.prototype[Symbol.search]
- String.prototype.split 调用 RegExp.prototype[Symbol.split]
正则中存在3种修饰符:g全局匹配、i忽略大小写、m多行匹配;ES6中新增u来正确处理大于\uFFFF的Unicode字符、y“粘连”修饰符,后一次匹配都从上一次匹配成功的下一个位置开始。
RegExp构造函数
// 在ES5中RegExp构造函数只能接受字符串作为参数
var regex = new RegExp("xyz", "i");
// ES6允许RegExp构造函数接受正则表达式作为参数,这时会返回一个原有正则表达式的拷贝
var regex = new RegExp(/xyz/i);
u修饰符
/\u{61}/.test('a'); // false
/\u{61}/u.test('a'); // true
y修饰符
y修饰符的作用与g修饰符类似,也是全局匹配,后一次匹配都从上一次匹配成功的下一个位置开始。不同之处在于,g修饰符只要剩余位置中存在匹配就可,而y修饰符确保匹配必须从剩余的第一个位置开始,这也就是“粘连”的涵义。
var str = "aa_a";
var reg1 = /a+/g;
var reg2 = /a+/y;
// 全局匹配
reg1.exec(str); // ["aa"]
reg1.exec(str); // ["a"]
// 粘连匹配
reg2.exec(str); // ["aa"]
reg2.exec(str); // null
flags属性
可以通过source获取表达式的正文,flags获取表达式的修饰符。
/xyz/ig.source;