天天看點

android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測

android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測

向AI轉型的程式員都關注了這個号👇👇👇

機器學習AI算法工程   公衆号:datayx

做票據OCR文字提取的時候,由于票據版面不固定,文字印刷錯位、粘連等,想要提取目标内容非常困難。如果首先能把票據的表格框形式識别出來,再切割出單元格,OCR再識别單元格裡面的内容會容易很多。

運用unet實作對文檔表格的自動檢測

所有代碼擷取:

本文相關代碼 項目擷取方式:

關注微信公衆号 datayx  然後回複  表格  即可擷取。

AI項目體驗位址 https://loveai.tech

擷取項目代碼後,安裝步驟:

1、下載下傳、編譯 darknet

git clone https://github.com/pjreddie/darknet.git

cd darknet && make

2、下載下傳text.weights模型檔案

模型檔案位址: 

http://www.chineseocr.com:9990/static/models/table-ocr/table.weights

拷貝table.weights檔案到models目錄

3、修改config.py 内的 darknet 安裝目錄

運作

python  table.py -jpgPath  test/dd.jpg

效果展示:

android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測
android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測

閱讀過本文的人還看了以下文章:

【全套視訊課】最全的目标檢測算法系列講解,通俗易懂!

《美團機器學習實踐》_美團算法團隊.pdf

《深度學習入門:基于Python的理論與實作》高清中文PDF+源碼

python就業班學習視訊,從入門到實戰項目

2019最新《PyTorch自然語言處理》英、中文版PDF+源碼

《21個項目玩轉深度學習:基于TensorFlow的實踐詳解》完整版PDF+附書代碼

《深度學習之pytorch》pdf+附書源碼

PyTorch深度學習快速實戰入門《pytorch-handbook》

【下載下傳】豆瓣評分8.1,《機器學習實戰:基于Scikit-Learn和TensorFlow》

《Python資料分析與挖掘實戰》PDF+完整源碼

汽車行業完整知識圖譜項目實戰視訊(全23課)

李沐大神開源《動手學深度學習》,加州伯克利深度學習(2019春)教材

筆記、代碼清晰易懂!李航《統計學習方法》最新資源全套!

《神經網絡與深度學習》最新2018版中英PDF+源碼

将機器學習模型部署為REST API

FashionAI服裝屬性标簽圖像識别Top1-5方案分享

重要開源!CNN-RNN-CTC 實作手寫漢字識别

yolo3 檢測出圖像中的不規則漢字

同樣是機器學習算法工程師,你的面試為什麼過不了?

前海征信大資料算法:風險機率預測

【Keras】完整實作‘交通标志’分類、‘票據’分類兩個項目,讓你掌握深度學習圖像分類

VGG16遷移學習,實作醫學圖像識别分類工程項目

特征工程(一)

特征工程(二) :文本資料的展開、過濾和分塊

特征工程(三):特征縮放,從詞袋到 TF-IDF

特征工程(四): 類别特征

特征工程(五): PCA 降維

特征工程(六): 非線性特征提取和模型堆疊

特征工程(七):圖像特征提取和深度學習

如何利用全新的決策樹內建級聯結構gcForest做特征工程并打分?

Machine Learning Yearning 中文翻譯稿

螞蟻金服2018秋招-算法工程師(共四面)通過

全球AI挑戰-場景分類的比賽源碼(多模型融合)

斯坦福CS230官方指南:CNN、RNN及使用技巧速查(列印收藏)

python+flask搭建CNN線上識别手寫中文網站

中科院Kaggle全球文本比對競賽華人第1名團隊-深度學習與特征工程

不斷更新資源

深度學習、機器學習、資料分析、python

 搜尋公衆号添加: datayx  

android ocr識别源碼_票據圖檔複雜表格框識别(票據單元格切割)運用unet實作對文檔表格的自動檢測

長按圖檔,識别二維碼,點關注

繼續閱讀