天天看點

CENTOS 下 安裝 tesseract-ocr 3.0.4 識别文字

(1)首先安裝依賴的leptonica庫:

wget http://www.leptonica.com/source/leptonica-1.72.tar.gz

tar -xvf leptonica-1.72.tar.gz  

cd leptonica-1.72

./configure && make && make install

(2)編譯tesseract了,所用版本 3.04,編譯需要automake、libtool,直接用yum安裝就可以了。

wget https://github.com/tesseract-ocr/tesseract/archive/3.04.00.tar.gz

mv 3.04.00  Tesseract3.04.00.tar.gz

tar -xvf Tesseract3.04.00.tar.gz  

cd tesseract-3.04.00/

./autogen.sh

./configure

make && make install

(3)下載下傳安裝英文,中文繁體,中文簡體 識别庫。

wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/eng.traineddata

wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_sim.traineddata

wget --no-check-certificate https://github.com/tesseract-ocr/tessdata/raw/master/chi_tra.traineddata

cp/mv *.traineddata /usr/local/share/tessdata/

繼續閱讀