
基于uchardet,C/C++和C#能够自动识别文件编码。
5星
- 浏览量: 0
- 大小:None
- 文件类型:None
简介:
我自行实现的函数,名为 `GetCodeName`,接受一个字符指针 `path` 作为输入,该参数代表文件路径,例如文本文件。该函数返回一个编码字符串,例如 UTF-8、UTF-16 或 Shift_JIS 等。它具备对包含BOM的文件的稳定识别能力,并且对于没有BOM的文本文件,随着文本数据的量增加,准确率也会相应提高(默认情况下,该函数会读取2048字节的数据进行编码判断)。为了实现这一功能,我使用了开源库 `uchardet`:https://code.google.com/p/uchardet/
全部评论 (0)
还没有任何评论哟~


