利用Tess4J实现图片识别

时间：2018-05-08 00:50:51 阅读：890 评论：0 收藏：0 [点我收藏+]

标签：blank tess4j desktop 需要 file 复制 dem 识别 ati

一、下载

1.进入官网下载页面

https://sourceforge.net/projects/tess4j/

2.点击download

技术分享图片

3.下载后解压，目录如下，圈出的三个文件夹是需要用到的

技术分享图片

二、使用Tess4J

1.将dist和lib下的包导入java项目

技术分享图片

2.将 tessdata 文件夹复制进项目的根目录

技术分享图片

3.示范代码如下

public class OCRDemo {

    public static void main(String[] args) {
        try {
            double start=System.currentTimeMillis();
            File imageFile = new File("C:\\Users\\dan\\Desktop\\12345.png");//图片位置
            ITesseract instance = new Tesseract();
            //instance.setDatapath("");//设置tessdata位置
            instance.setLanguage("chi_sim");//选择字库文件
            String result = instance.doOCR(imageFile);//开始识别
            double end=System.currentTimeMillis();
            System.out.println(result);//打印图片内容
            System.out.println("耗时"+(end-start)/1000+" s");
        } catch (TesseractException e) {
            e.printStackTrace();
        }
    }

}

注意事项：

①如果tessdata没有放入根目录，务必设置teedata的位置

instance.setDatapath("");//设置tessdata位置

②选择字库文件不需要写上后缀，默认 tessdata 包中可能没有 chi_sim 这个中文包，需要自己下载

https://github.com/tesseract-ocr/tessdata

三、运行结果

技术分享图片

官方字库识别率还是偏低的，如果对精度要求高的话需要自己训练字库了

利用Tess4J实现图片识别

标签：blank tess4j desktop 需要 file 复制 dem 识别 ati

原文地址：https://www.cnblogs.com/chestnut-egg/p/9005947.html

踩

(0)

评论一句话评论（0）

分享档案

更多>

2021年07月29日 (22)
2021年07月28日 (40)
2021年07月27日 (32)
2021年07月26日 (79)
2021年07月23日 (29)
2021年07月22日 (30)
2021年07月21日 (42)
2021年07月20日 (16)
2021年07月19日 (90)
2021年07月16日 (35)

周排行