Tesseract——OCR图像识别 入门篇
生活随笔
收集整理的這篇文章主要介紹了
Tesseract——OCR图像识别 入门篇
小編覺得挺不錯的,現在分享給大家,幫大家做個參考.
近期leader給了我一個任務,讓我研究圖像識別,從我們項目的screenshot中識別文字信息,so我開始了學習。與大家分享下。
我看到眼下OCR技術有非常多,最基本的是Asprise OCR,Tesseract OCR和Java OCR。
Asprise OCR速度非常快,Java實現非常easy,可是它是商業的。要收費的。免費版每次都要彈出對話框。是個非常麻煩的事情。
Tesseract OCR是C++的。要使用cmd命令的,速度也非常快,質量也非常好。當然Java也是能夠使用的。
Java OCR是純Java的。效率也不錯。
今天先記錄下Tesseract吧,興許再補充
1. 首先從官網上下載壓縮包,最新版本號是Tesseract 3.03,之前的版本號能夠從這里下載.
2. 解壓下載好的壓縮包到本地文件夾。
3. 打開cmd窗體。進入到tesseract文件夾下。然后就能夠開始我們的測試之旅啦
?1)選擇好你所要識別的圖片。并確定你所要輸出的文件,然后輸入下列命令:
? ?tesseract letter.png 1
? "letter.png": 須要識別的圖片
? ?"1": 輸出的文件 1.txt
?
?2) 我們已經把圖片中的信息解析出來啦。
總結
以上是生活随笔為你收集整理的Tesseract——OCR图像识别 入门篇的全部內容,希望文章能夠幫你解決所遇到的問題。
- 上一篇: MySQL 5.7 for Window
- 下一篇: MongoDB空间分配