资讯详情

Java基于Tess4J的OCR识别笔记

一、创建项目

1.从百度网盘下载Tess4J-3.4.8-src.zip到桌面,并将其解压到当前文件夹中 2.IDEA==左上文件==新建==项目==左侧新建项目==输入OCR==选择构建系统IDEA==点击创建 3.解压Tess4J文件夹里的==lib src tessdata复制到OCR项目里 4.解压Tess4J文件夹里的==chi_sim.traineddata,放入tessdata文件夹下 5.将Tess4J文件夹里的==dist文件夹下的==tess4j-3.4.8.jar==复制到OCR项目里的lib文件夹下 6.IDEA==选中lib文件夹==将右键添加到库中==点击确定 7.对着src==右键新建==软件包==com.tys.test 8.对着com.tys.test==右键新建==Java类==TestOCR 

二、识别单张图片

1. D盘下创建文件夹,名字叫OCRTest 2. 夹下文件,放入Tess4J文件夹中的测试图片,01-验证码,02-英文,03-中文 3. 图片格式在线转换网站 https://www.gaitubao.com/jpg-gif-png ========================================================================================= //TestOCR.java 替换以下代码  package com.tys.test;  import net.sourceforge.tess4j.*; import java.io.*;  public class TestOCR { 
             public static void main(String[] args) { 
                 try { 
                     //指定图片位置             
       
        File imageFile 
        = 
        new 
        File
        (
        "D:\\OCRTest\\03.png"
        )
        ; 
        ITesseract instance 
        = 
        new 
        Tesseract
        (
        )
        ; 
        //指定IDEA左侧,tessdata文件夹的绝对路径 instance
        .
        setDatapath
        (
        "C:\\Users\\Administrator\\IdeaProjects\\OCR\\tessdata"
        )
        ; instance
        .
        setLanguage
        (
        "chi_sim"
        )
        ;
        //chi_sim 识别中文 eng 识别英文 osd 识别验证码 
        String result 
        = instance
        .
        doOCR
        (imageFile
        )
        ;
        //开始识别 
        System
        .out
        .
        print
        (result
        )
        ; 
        } 
        catch 
        (
        Exception e
        ) 
        { 
          e
        .
        printStackTrace
        (
        )
        ; 
        } 
        } 
        } 
       

三、遍历图片

//1.在IDEA项目路径,OCR项目下,创建imgs文件夹,放入图片
//2.TestOCR.java 替换以下代码
========================================================================================
package com.tys.test;

import net.sourceforge.tess4j.*;
import java.io.*;

public class TestOCR { 
        
    public static void main(String[] args) { 
        
        //user.dir是idea项目的根目录,imgs文件夹名字
        File root = new File(System.getProperty("user.dir") + "/imgs");
        ITesseract instance = new Tesseract();
        //chi_sim 识别中文 eng 识别英文 osd 识别验证码
        //指定文件夹下,批量图片识别中文,英文,验证码
        instance.setLanguage("chi_sim");
        try { 
        
            File[] files = root.listFiles();
            for (File file : files) { 
        
                String result = instance.doOCR(file);
                String fileName = file.toString().substring(file.toString().lastIndexOf("\\")+1);
                String str="图片名:" + fileName +" 识别结果:"+result;
                System.out.print(str);
            }
        } catch (Exception e) { 
        
            e.printStackTrace();
        }
    }
}

标签: tys8g集成电路

锐单商城拥有海量元器件数据手册IC替代型号,打造 电子元器件IC百科大全!

锐单商城 - 一站式电子元器件采购平台