• linkedu视频
  • 平面设计
  • 电脑入门
  • 操作系统
  • 办公应用
  • 电脑硬件
  • 动画设计
  • 3D设计
  • 网页设计
  • CAD设计
  • 影音处理
  • 数据库
  • 程序设计
  • 认证考试
  • 信息管理
  • 信息安全
菜单
linkedu.com
  • 网页制作
  • 数据库
  • 程序设计
  • 操作系统
  • CMS教程
  • 游戏攻略
  • 脚本语言
  • 平面设计
  • 软件教程
  • 网络安全
  • 电脑知识
  • 服务器
  • 视频教程
  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号
您的位置:首页 > 程序设计 >C语言 > C++中汉字字符串的截取

C++中汉字字符串的截取

作者: 字体:[增加 减小] 来源:互联网 时间:2017-05-28

通过本文主要向大家介绍了c++输出汉字,c++输入汉字,c++汉字数组,c++截取字符串,c++如何截取字符串等相关知识,希望对您有所帮助,也希望大家支持linkedu.com www.linkedu.com

1、

2、

参看下面的字符串转换函数。

* B、乱码的汉字字符串:
* 1、encoding用ISO8859_1时,每byte也是负数;
* 2、encoding用GB2312时,b[i]大部分是63。
* C、英文字符串
* 1、encoding用ISO8859_1和GB2312时,每byte都大于0;
* 总结:给定一个字符串,用getBytes("iso8859_1")
* 1、如果b[i]有63,不用转码; A-2
* 2、如果b[i]全大于0,那么为英文字符串,不用转码; B-1
* 3、如果b[i]有小于0的,那么已经乱码,要转码。 C-1
*/
private static String toGb2312(String str) {
if (str == null) return null;
String retStr = str;
byte b[];
try {
b = str.getBytes("ISO8859_1");

for (int i = 0; i < b.length; i++) {
byte b1 = b[i];
if (b1 == 63)
break; //1
else if (b1 > 0)
continue;//2
else if (b1 < 0) { //不可能为0,0为字符串结束符
retStr = new String(b, "GB2312");
break;
}
}
} catch (UnsupportedEncodingException e) {
// e.printStackTrace();
}
return retStr;
}

</div>

3、

</div>

有人说:“一个GBK汉字要占两个char空间(二字节),而且第一个字节里的值是小于0的。可以据此判断是否为汉字。”
1、为什么第一个字节的值小于0呢?
2、如果仅通过判断第一个字节如果小于0,则该字节和下一个字节就组成一个汉字,这种逻辑是否保险?
3、因为还看到有人说,GBK编码的汉字有高位和低位两位,第一个是低位吧?需要第一个字节在160-254之间,第二个字节在64-254之间,这样是不是比2中提到的方法要保险?
4、如果DB中的字符集是SIMPLIFIED CHINESE_CHINA.ZHS16GBK,这个是GBK字符集?GBK兼容GB2312

似乎有些字符集中有些汉字占三个字节

“通过判断第一个字节如果小于0,则该字节和下一个字节就组成一个汉字”

//GBK汉字内码范围
//81-A0 ,40-7E 80-FE
//AA-AF ,40-7E 80-A0
//B0-D6 ,40-7E 80-FE
//D7 ,40-7E 80-F9
//D8-F7 ,40-7E 80-FE
//F8-FE ,40-7E 80-A0
例如://81-A0 ,40-7E 80-FE
表示字符的ascii码要在129-160,64-126,128-254这三个区间段内

4、
在工作中,遇到要截取字符串在屏幕上显示出来,因为字符串带有汉字,如果截取不好,会引起乱码,写了下面的函数

在uclinux下与VC6.0中测试可以通过。

view plaincopy to clipboardprint?

 name :要截取的字符串

 store:要存储的字符串

 len:要截取的长度

 */

 void split_name( char * name , char * store , int len )
 {

     int i= 0 ;

     char strTemp[L(NAMEL)]={0};

     if ( strlen(name)
     {

         strcpy( store, name );  *name=0;

         return ;

     }

     //从第1个字节开始判断

     while( i < len )

     {

         if ( name[i]>>7&1 && name[i+1]>>7&1 )       //if ( name[i] < 0 && name[i+1] < 0 )

             i = i + 2 ;

         else

             i = i + 1 ;

     }

     i = i > len ? i-3 :i-1;

     strncpy( store , name , i+1 ); //截取前i+1位

     *(store+i+1)=0;

     strcpy( strTemp , name + i + 1 );

     strcpy( name , strTemp );

 }
</div>

</div>
分享到:QQ空间新浪微博腾讯微博微信百度贴吧QQ好友复制网址打印

您可能想查找下面的文章:

  • C++中汉字字符串的截取

相关文章

  • 2017-05-28C语言static修饰函数详细解析
  • 2017-05-28c++ minicsv库的编译错误与解决方案
  • 2017-05-28浅谈C#互操作的内存溢出问题
  • 2017-05-28C# 使用反射来实现对象的深度复制方法
  • 2017-05-28C++基于hook iat改变Messagebox实例
  • 2017-05-28解析static在C和C++中的用法以及区别
  • 2017-05-28C++用指针变量作为函数的参数接受数组的值的问题详细总结
  • 2017-05-28C++用Dijkstra(迪杰斯特拉)算法求最短路径
  • 2017-05-28浅谈c语言中转义字符的用法及注意事项
  • 2017-05-28C/C++动态分配与释放内存的区别详细解析

文章分类

  • JavaScript
  • ASP.NET
  • PHP
  • 正则表达式
  • AJAX
  • JSP
  • ASP
  • Flex
  • XML
  • 编程技巧
  • Android
  • swift
  • C#教程
  • vb
  • vb.net
  • C语言
  • Java
  • Delphi
  • 易语言
  • vc/mfc
  • 嵌入式开发
  • 游戏开发
  • ios
  • 编程问答
  • 汇编语言
  • 微信小程序
  • 数据结构
  • OpenGL
  • 架构设计
  • qt
  • 微信公众号

最近更新的内容

    • C语言fread和fwrite的用法详解(以数据块的形式读写文件)
    • C语言堆栈入门指南
    • 图文详解C语言位运算基础知识
    • 详解Linux的SOCKET编程
    • C++ 继承详解及实例代码
    • 封装常用正则表达式的用法
    • C语言基础知识点解析(extern,static,typedef,const)
    • 有关C++头文件的包含顺序研究
    • 海量数据处理系列之:用C++实现Bitmap算法
    • C++利用容器查找重复列功能实现

关于我们 - 联系我们 - 免责声明 - 网站地图

©2020-2025 All Rights Reserved. linkedu.com 版权所有