GitHub开源：支持100多种语言的OCR文字识别

2021-12-17 23:50:00

之前为给位朋友分享过：GitHub开源：17M超轻量级中文OCR模型、支持NCNN推理，该项目仅仅支持中文OCR识别，本篇博文将分享支持100多种语言的OCR文字识别项目：Tesseract OCR。

Tesseract是一款由HP实验室开发由Google维护的开源OCR（Optical Character Recognition , 光学字符识别）引擎。Tesseract 支持 unicode（UTF-8），可以“开箱即用” 识别100多种语言。Tesseract 架构如下所示：

使用Tesseract项目识别中文，效果如下所示：

使用Tesseract项目识别英文，效果如下所示：

项目地址请参见：Tesseract OCR

文字识别 OCR发布文字识别语音识别语音转文字教程语音识别功能语音转文字语音识别功能语音转文字教程 OCR图片文字识别

上一篇: 数组基础

下一篇: 基于HTML的飞机射击游戏

继续阅读

怎么使用OCR文字识别？介绍三种方法
文字识别三种方法使用OCR
06-26
果然还是国产手机更懂国人的用机需求，今天就用手头上的OPPOFindX6Pro，给大家盘点几个日常很加分的系统功能体验。
系统功能文字识别插入图片
06-27
python使用tesseract识别图片验证码
Python Selenium 编程开发文字识别 tesseract ocr java
06-29
移动端车牌识别SDK
车牌识别 OCR识别文字识别版面识别文字转换OCR
07-15
文字识别总结（OCR）
ocr 文字识别
07-15
自然场景文字识别工程
文字识别场景文字识别 scene text
07-15
图片文字识别提取用途多多，如何操作OCR
文字识别
07-15
电脑图片文字识别，得力OCR文字识别
文字识别图片识别电脑图片文字识别
07-31
在线识别图片文字，分享识别技巧
文字识别图片识别成文字图片转文字
07-31
如何进行JPG图片文字识别？
文字识别 JPG图片识别图片文字识别识别图片文字
07-31
【Windows】屏幕识别文字
【Windows】文字识别图片文字识别识别文字
07-31
linux内存不足
Linux 文字识别提取图片 word
08-01
互联网那些事儿之OCR
互联网+ ocr 文字识别银行卡识别身份证识别
08-01
使用MODI（Microsoft Office Document Imaging）识别中文，但无法区分段落
ocr MODI 文字识别
08-05
识别PDF文字的软件，得力OCR文字识别
文字识别 PDF文字识别识别文字 OCR文字识别软件
08-05
主流深度学习OCR文字识别方法对比：Tesseract（LSTM）、CTPN+CRNN、Densenetopencv mser算法框出图片文字区域
OCR文字识别 ocr 文字识别
08-05