tesseract编译各种 “锟斤拷” 等中文乱码编译失败问题

时间：2017-11-10 00:23:47 阅读：438 评论：0 收藏：0 [点我收藏+]

编译tesseract - ocr时各种不通过也很疑惑，完全按照官方指导来的啊

首先以为是vs的编码问题，随切换选项-切换Unicode或多编码字符集，但仍无效。

定位到乱码的文件，用notepad++ 打开，查看编码，是“”“以UTF-8无BOM格式编码”，切换成utf-8编码，将所有有中文的编码都切换了（还好只有两个），然后编译既然成功了。

然后新建了一个工程，一路默认创建。打开默认创建的cpp文件，是ANSI编码，没有任何文件头信息。可能是vs对于无bom的utf8不认识吧，默认把它当成了ANSI编码，所以造成这个问题。

看到一篇博客说vs2008，创建的C++源文件的缺省编码方式为CP936，即GB2312

原文地址：http://www.cnblogs.com/zhishuai/p/7811855.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

周排行

tesseract编译各种 “锟斤拷” 等中文乱码 编译失败问题