博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
获取文件中汉字个数
阅读量:5462 次
发布时间:2019-06-15

本文共 915 字,大约阅读时间需要 3 分钟。

MINGW + notepad++

strlen遇到汉字的问题:

#include 
#include
using namespace std;int main(){ cout << strlen("汉字") << endl;}
以UTF-8无BOM编码输出结果为:6

以ANSI编码为:4

可见这个问题的答案与采用的字符编码方式有关。

对于GB2312:   

 汉字的第一字节:是从0xB0   开始编码  0xB0-0xF7(176-247)

 汉字的第二字节:是从0xA0   开始编码  0xA0-0xFE(160-254)

#include 
#include
#include
int main(int argc, char *argv[]){ int ch; int count = 0; FILE *fstream; if (argc < 2) { printf("Input Error!\nUsage:programmename filename\n"); printf("输入错误!\n用法:程序名 文件名\n"); return -2; } if ((fstream = fopen(argv[1], "r")) == NULL) { printf("File open error!\n"); printf("文件打开出错!\n"); return -1; } while (!feof(fstream)) { ch = getc(fstream); if (ch >= 0xB0) { ch = getc(fstream); if (ch >= 0XA0) { count++; } } } printf("%s 包含%d个汉字\n", argv[1], count); return 0;}

汉字编码问题请看:

转载于:https://www.cnblogs.com/lgh1992314/p/5834713.html

你可能感兴趣的文章
LPC1788的spi使用
查看>>
HttpContext.Current.Request.ServerVariables.AllKeys
查看>>
django 配置中STATICFILES_DIRS 和STATIC_ROOT不能同时出现
查看>>
MySQL 学习笔记 二
查看>>
Liunx Shell入门
查看>>
C++ 总结
查看>>
poj2593 Max Sequence(两个不相交字段的最大总和与)
查看>>
Mustache 使用心得总结
查看>>
BZOJ 3224: Tyvj 1728 普通平衡树
查看>>
基于PCA的人脸识别步骤
查看>>
perl学习(2) 基本数据类型等
查看>>
组队练习赛(Regionals 2012, North America - East Central NA)
查看>>
libevent源码剖析
查看>>
第24条:将类的实现代码分散到便于管理的数个分类之中
查看>>
LINQ-进行数据转换
查看>>
Yii 事件行为的过程详解(未完待续。。)
查看>>
Solr与MongoDB集成,实时增量索引[转]
查看>>
最长不下降子序列的O(n*logn)算法
查看>>
设计模式(十七)——模板方法模式
查看>>
uva 10954 Add All
查看>>