新全讯博彩点网,博彩网七 ,乐中乐娱乐城官网www.22266.com(中国)·官方网站

不久前，百度技術(shù)團(tuán)隊(duì)在不久前，百度技術(shù)團(tuán)隊(duì)在 GitHub 上正式開(kāi)源了一款 OCR 神器，在發(fā)布后不久便多次沖上 GitHub Trending 榜單，引起了技術(shù)圈內(nèi)開(kāi)發(fā)者的熱議，今天就跟大家好好介紹下這個(gè)項(xiàng)目。

眾所周知，OCR（Optical Charac ter Recognition，光學(xué)字符識(shí)別）技術(shù)已被廣泛應(yīng)用到我們生活中的方方面面，從印刷稿的文字識(shí)別、身份證電子化信息錄入，到傳統(tǒng)郵件自動(dòng)分揀、汽車牌照識(shí)別等領(lǐng)域，都上正式開(kāi)源了一款 OCR 神器，在發(fā)布后不久便多次沖上 GitHub Trending 榜單，引起了技術(shù)圈內(nèi)開(kāi)發(fā)者的熱議，今天就跟大家好好介紹下這個(gè)項(xiàng)目。

在平時(shí)工作的時(shí)候，我也經(jīng)常會(huì)使用一些 OCR 軟件來(lái)掃描圖片并提取文字，而要替代人工完成一系列的文本分析，圖像識(shí)別操作，則必將使用到 AI 技術(shù)。

百度在 GitHub 上開(kāi)源的 PaddleOCR 模型，大小僅有 8.6M，是目前圈內(nèi)為數(shù)不多，能支持中英文圖像、橫豎排排版識(shí)別的 AI 深度學(xué)習(xí)模型之一。

先看下 PaddleOCR 自今年年中開(kāi)源以來(lái)，短短幾個(gè)月在 GitHub 上的表現(xiàn)：

7 月，8.6M 超輕量模型發(fā)布，GitHub Trending 全球日榜榜單第一！

8 月，開(kāi)源 CVPR2020 頂會(huì) SOTA 算法，再上 GitHub 趨勢(shì)榜單！

9 月，GitHub Star 數(shù)量已超過(guò) 4.6K，近期又帶來(lái)哪些重磅更新？

果然，看 9 月最新更新，PaddleOCR 再次誠(chéng)意滿滿為大家?guī)?lái)真干貨，直接看官方介紹：

01. 官方介紹

數(shù)量上，這次 PaddleOCR 一口氣發(fā)布了三個(gè)系列模型，滿足移動(dòng)端、服務(wù)器端各種場(chǎng)景需求。而且，多語(yǔ)言也妥妥安排上了，全部訓(xùn)練代碼和模型毫無(wú)保留開(kāi)源。其中 3.5M 超輕量文字識(shí)別模型，堪稱目前業(yè)界開(kāi)源的最輕量 OCR 模型了。質(zhì)量上，如此輕量的模型，效果有保障嗎？不看廣告，直接看療效。先看幾個(gè)常見(jiàn)的通用場(chǎng)景識(shí)別效果：

3.5M 的模型能達(dá)到這個(gè)識(shí)別精度，絕對(duì)是良心之作了！傳送門 Github：https://github.com/PaddlePaddle/PaddleOCR論文下載鏈接：https://arxiv.org/abs/2009.09941

02. 快速體驗(yàn)

PaddleOCR 的 3.5M 超輕量 OCR 模型1).PC 端快速嘗試：（打開(kāi)網(wǎng)頁(yè)，選一張圖片，即可實(shí)時(shí)看到結(jié)果） https://www.paddlepaddle.org.cn/hub/scene/ocr

2). 手機(jī)端 App 安裝體驗(yàn)PaddleOCR 在百度大腦 EasyEdge 上開(kāi)放了文字識(shí)別 APP demo。示例效果如下（可以在 github 首頁(yè)找到下載二維碼）

多個(gè)開(kāi)源 repo 測(cè)試對(duì)比

簡(jiǎn)單對(duì)比一下目前主流 OCR 方向開(kāi)源 repo 的核心能力：

3). 從性能指標(biāo)來(lái)看：

針對(duì) OCR 實(shí)際應(yīng)用場(chǎng)景，包括合同，車牌，銘牌，火車票，化驗(yàn)單，表格，證書，街景文字，名片，數(shù)碼顯示屏等，收集的 300 張圖像，每張圖平均有 17 個(gè)文本框，PaddleOCR 的 F1-Score 超過(guò) 0.5，這個(gè)性能已經(jīng)很不錯(cuò)了。

4). 從功能完備來(lái)看：

預(yù)訓(xùn)練模型大小：easyOCR 目前暫無(wú)超輕量模型，chineseocr_lite 最新的模型是 4.7M 左右，而 PaddleOCR 提供的 3.5M 無(wú)疑是目前業(yè)界已知最輕量的。

PIP 安裝：目前僅 PaddleOCR 和 easyOCR 支持。

自定義訓(xùn)練：實(shí)際業(yè)務(wù)場(chǎng)景中，預(yù)訓(xùn)練模型往往不能滿足需求，對(duì)于自定義訓(xùn)練和模型 Finetuning，目前只有 PaddleOCR 支持。

部署方面：easyOCR 模型較大不適合端側(cè)部署，Chineseocr_lite 和 PaddleOCR 都具備端側(cè)部署能力。

開(kāi)發(fā)者可以根據(jù)自己的實(shí)際需求，選擇適合自己的開(kāi)源方案。對(duì)于 PaddleOCR3.5MB 的超輕量模型，是如何做到的，repo 中也給出了解釋。

3.5M 超輕量模型應(yīng)用了一套超輕量 OCR 系統(tǒng) PP-OCR，主要由 DB 文本檢測(cè)、檢測(cè)框矯正和 CRNN 文本識(shí)別三部分組成。該系統(tǒng)從骨干網(wǎng)絡(luò)選擇和調(diào)整、預(yù)測(cè)頭部的設(shè)計(jì)、數(shù)據(jù)增強(qiáng)、學(xué)習(xí)率變換策略、正則化參數(shù)選擇、預(yù)訓(xùn)練模型使用以及模型自動(dòng)裁剪量化 8 個(gè)方面，采用 19 個(gè)有效策略，對(duì)各個(gè)模塊的模型進(jìn)行效果調(diào)優(yōu)和瘦身。其中，飛槳模型壓縮庫(kù) PaddleSlim 為 PaddleOCR 超輕量化模型的實(shí)現(xiàn)提供了核心的技術(shù)支撐。從超輕量模型 8.1M 的壓縮到 3.5M，模型大小降低了 56.79%，其中檢測(cè)模型速度提升 21%，而且整體模型精度還有提升。

除了 3.5M 超輕量 OCR 模型，PaddleOCR 提供了多語(yǔ)言預(yù)訓(xùn)練模型（英、德、法、韓、日），支持自定義訓(xùn)練和豐富的部署方式。

責(zé)任編輯：PSY

原文標(biāo)題：Github標(biāo)星4.6K+！這個(gè)OCR開(kāi)源項(xiàng)目，火了！

文章出處：【微信公眾號(hào)：人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

開(kāi)源

開(kāi)源

+關(guān)注

關(guān)注
3

文章
3402

瀏覽量
42711
OCR

OCR

+關(guān)注

關(guān)注
0

文章
146

瀏覽量
16427
GitHub

GitHub

+關(guān)注

關(guān)注
3

文章
473

瀏覽量
16564

原文標(biāo)題：Github標(biāo)星4.6K+！這個(gè)OCR開(kāi)源項(xiàng)目，火了！

文章出處：【微信號(hào)：TheBigData1024，微信公眾號(hào)：人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

評(píng)論

相關(guān)推薦

訊維KVM坐席管理協(xié)作系統(tǒng)：OCR功能及優(yōu)勢(shì)介紹

框選識(shí)別的場(chǎng)景中。訊維首次將OCR智能文字識(shí)別功能加入全新KVM坐席管理協(xié)作系統(tǒng)中，解決手動(dòng)記錄文字效率低下的問(wèn)題，提供坐席人員的工作效率。訊維分布式KVM坐席管理系統(tǒng)是一款集成了多種信息及圖形處理器技術(shù)的智能化設(shè)備，

發(fā)表于 01-22 10:02 ?99次閱讀

開(kāi)源基礎(chǔ)設(shè)施能力建設(shè)分論壇成功舉辦

在當(dāng)今科技飛速發(fā)展的時(shí)代，開(kāi)源已成為推動(dòng)全球創(chuàng)新與進(jìn)步的核心動(dòng)力。無(wú)論是開(kāi)發(fā)實(shí)踐還是數(shù)字化轉(zhuǎn)型，開(kāi)源以其特有的開(kāi)放性、共享性和協(xié)同性，助力各行業(yè)技術(shù)革新。在構(gòu)建開(kāi)源生態(tài)的過(guò)程中，

發(fā)表于 12-27 13:56 ?224次閱讀

如何在播放視頻過(guò)程中插入音頻

ZDP14x0是一款基于開(kāi)源GUI引擎的圖像顯示專用驅(qū)動(dòng)芯片，可以通過(guò)串口或者SPI與其他芯片通信，且能播放視頻。本文將介紹如何在播放視頻過(guò)程中插入音頻。

發(fā)表于 12-26 11:13 ?435次閱讀

如何在播放視頻<b class='flag-5'>過(guò)程</b>中插入音頻

使用ADS1211U的過(guò)程中，采樣值輸出一直為0XFFFFFF，為什么？

最近在使用ADS1211U的過(guò)程中遇到些問(wèn)題，一個(gè)問(wèn)題是采樣值輸出一直為0XFFFFFF，有時(shí)候跟換一塊芯片就會(huì)好，有時(shí)候是一直是0；還有就是在CPU程序仿真的過(guò)程中會(huì)與非仿真狀態(tài)下產(chǎn)生數(shù)據(jù)

發(fā)表于 12-25 06:22

開(kāi)源AI模型庫(kù)是干嘛的

開(kāi)源AI模型庫(kù)是指那些公開(kāi)源代碼、允許自由訪問(wèn)和使用的AI模型集合。這些模型通常經(jīng)過(guò)訓(xùn)練，能夠執(zhí)行特定的任務(wù)。以下，是對(duì)開(kāi)源AI模型庫(kù)的詳細(xì)介紹，由AI部落小編整理。

發(fā)表于 12-14 10:33 ?294次閱讀

ElfBoard開(kāi)源項(xiàng)目|車牌識(shí)別項(xiàng)目技術(shù)文檔

車牌識(shí)別項(xiàng)目基于百度智能云平臺(tái)，旨在利用其強(qiáng)大的OCR服務(wù)實(shí)現(xiàn)車牌號(hào)碼的自動(dòng)識(shí)別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量，能夠幫助開(kāi)發(fā)者快速實(shí)現(xiàn)車牌識(shí)別應(yīng)用。這個(gè)開(kāi)源項(xiàng)目使用攝像頭

發(fā)表于 12-06 10:30 ?315次閱讀

ElfBoard<b class='flag-5'>開(kāi)源</b>項(xiàng)目|車牌識(shí)別項(xiàng)目技術(shù)文檔

介紹6款開(kāi)源免費(fèi)的網(wǎng)絡(luò)監(jiān)控工具

網(wǎng)絡(luò)監(jiān)控是保障網(wǎng)絡(luò)系統(tǒng)和數(shù)據(jù)安全的重要手段，能夠幫助運(yùn)維人員及時(shí)發(fā)現(xiàn)并應(yīng)對(duì)各種問(wèn)題，及時(shí)發(fā)現(xiàn)并解決，從而確保網(wǎng)絡(luò)的順暢運(yùn)行。文本將簡(jiǎn)單介紹6款開(kāi)源免費(fèi)的網(wǎng)絡(luò)監(jiān)控工具，并準(zhǔn)備了對(duì)應(yīng)的資料文檔，建議運(yùn)

發(fā)表于 11-25 15:53 ?818次閱讀