吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

開(kāi)源OCR 過(guò)程介紹

人工智能與大數(shù)據(jù)技術(shù) ? 來(lái)源:人工智能與大數(shù)據(jù)技術(shù) ? 作者:人工智能與大數(shù)據(jù) ? 2020-10-30 10:54 ? 次閱讀

不久前,百度技術(shù)團(tuán)隊(duì)在不久前,百度技術(shù)團(tuán)隊(duì)在 GitHub 上正式開(kāi)源了一款 OCR 神器,在發(fā)布后不久便多次沖上 GitHub Trending 榜單,引起了技術(shù)圈內(nèi)開(kāi)發(fā)者的熱議,今天就跟大家好好介紹下這個(gè)項(xiàng)目。

眾所周知,OCR(Optical Character Recognition,光學(xué)字符識(shí)別) 技術(shù)已被廣泛應(yīng)用到我們生活中的方方面面,從印刷稿的文字識(shí)別、身份證電子信息錄入,到傳統(tǒng)郵件自動(dòng)分揀、汽車牌照識(shí)別等領(lǐng)域,都上正式開(kāi)源了一款 OCR 神器,在發(fā)布后不久便多次沖上 GitHub Trending 榜單,引起了技術(shù)圈內(nèi)開(kāi)發(fā)者的熱議,今天就跟大家好好介紹下這個(gè)項(xiàng)目。

眾所周知,OCR(Optical Character Recognition,光學(xué)字符識(shí)別) 技術(shù)已被廣泛應(yīng)用到我們生活中的方方面面,從印刷稿的文字識(shí)別、身份證電子化信息錄入,到傳統(tǒng)郵件自動(dòng)分揀、汽車牌照識(shí)別等領(lǐng)域,都少不了 OCR 的身影。

在平時(shí)工作的時(shí)候,我也經(jīng)常會(huì)使用一些 OCR 軟件來(lái)掃描圖片并提取文字,而要替代人工完成一系列的文本分析,圖像識(shí)別操作,則必將使用到 AI 技術(shù)。

百度在 GitHub 上開(kāi)源的 PaddleOCR 模型,大小僅有 8.6M,是目前圈內(nèi)為數(shù)不多,能支持中英文圖像、橫豎排排版識(shí)別的 AI 深度學(xué)習(xí)模型之一。

先看下 PaddleOCR 自今年年中開(kāi)源以來(lái),短短幾個(gè)月在 GitHub 上的表現(xiàn):

7 月,8.6M 超輕量模型發(fā)布,GitHub Trending 全球日榜榜單第一!

8 月,開(kāi)源 CVPR2020 頂會(huì) SOTA 算法,再上 GitHub 趨勢(shì)榜單!

9 月,GitHub Star 數(shù)量已超過(guò) 4.6K, 近期又帶來(lái)哪些重磅更新?

果然,看 9 月最新更新,PaddleOCR 再次誠(chéng)意滿滿為大家?guī)?lái)真干貨,直接看官方介紹:

01. 官方介紹

數(shù)量上,這次 PaddleOCR 一口氣發(fā)布了三個(gè)系列模型,滿足移動(dòng)端、服務(wù)器端各種場(chǎng)景需求。而且,多語(yǔ)言也妥妥安排上了,全部訓(xùn)練代碼和模型毫無(wú)保留開(kāi)源。其中 3.5M 超輕量文字識(shí)別模型,堪稱目前業(yè)界開(kāi)源的最輕量 OCR 模型了。質(zhì)量上,如此輕量的模型,效果有保障嗎?不看廣告,直接看療效。 先看幾個(gè)常見(jiàn)的通用場(chǎng)景識(shí)別效果:

3.5M 的模型能達(dá)到這個(gè)識(shí)別精度,絕對(duì)是良心之作了!傳送門 Github:https://github.com/PaddlePaddle/PaddleOCR論文下載鏈接:https://arxiv.org/abs/2009.09941

02. 快速體驗(yàn)

PaddleOCR 的 3.5M 超輕量 OCR 模型1).PC 端快速嘗試:(打開(kāi)網(wǎng)頁(yè),選一張圖片,即可實(shí)時(shí)看到結(jié)果) https://www.paddlepaddle.org.cn/hub/scene/ocr

2). 手機(jī)端 App 安裝體驗(yàn)PaddleOCR 在百度大腦 EasyEdge 上開(kāi)放了文字識(shí)別 APP demo。 示例效果如下(可以在 github 首頁(yè)找到下載二維碼)

多個(gè)開(kāi)源 repo 測(cè)試對(duì)比

簡(jiǎn)單對(duì)比一下目前主流 OCR 方向開(kāi)源 repo 的核心能力:

3). 從性能指標(biāo)來(lái)看:

針對(duì) OCR 實(shí)際應(yīng)用場(chǎng)景,包括合同,車牌,銘牌,火車票,化驗(yàn)單,表格,證書,街景文字,名片,數(shù)碼顯示屏等,收集的 300 張圖像,每張圖平均有 17 個(gè)文本框,PaddleOCR 的 F1-Score 超過(guò) 0.5,這個(gè)性能已經(jīng)很不錯(cuò)了。

4). 從功能完備來(lái)看:

預(yù)訓(xùn)練模型大小:easyOCR 目前暫無(wú)超輕量模型,chineseocr_lite 最新的模型是 4.7M 左右,而 PaddleOCR 提供的 3.5M 無(wú)疑是目前業(yè)界已知最輕量的。

PIP 安裝:目前僅 PaddleOCR 和 easyOCR 支持。

自定義訓(xùn)練:實(shí)際業(yè)務(wù)場(chǎng)景中,預(yù)訓(xùn)練模型往往不能滿足需求,對(duì)于自定義訓(xùn)練和模型 Finetuning,目前只有 PaddleOCR 支持。

部署方面:easyOCR 模型較大不適合端側(cè)部署,Chineseocr_lite 和 PaddleOCR 都具備端側(cè)部署能力。

開(kāi)發(fā)者可以根據(jù)自己的實(shí)際需求,選擇適合自己的開(kāi)源方案。 對(duì)于 PaddleOCR3.5MB 的超輕量模型,是如何做到的,repo 中也給出了解釋。

3.5M 超輕量模型應(yīng)用了一套超輕量 OCR 系統(tǒng) PP-OCR,主要由 DB 文本檢測(cè)、檢測(cè)框矯正和 CRNN 文本識(shí)別三部分組成。該系統(tǒng)從骨干網(wǎng)絡(luò)選擇和調(diào)整、預(yù)測(cè)頭部的設(shè)計(jì)、數(shù)據(jù)增強(qiáng)、學(xué)習(xí)率變換策略、正則化參數(shù)選擇、預(yù)訓(xùn)練模型使用以及模型自動(dòng)裁剪量化 8 個(gè)方面,采用 19 個(gè)有效策略,對(duì)各個(gè)模塊的模型進(jìn)行效果調(diào)優(yōu)和瘦身。 其中,飛槳模型壓縮庫(kù) PaddleSlim 為 PaddleOCR 超輕量化模型的實(shí)現(xiàn)提供了核心的技術(shù)支撐。從超輕量模型 8.1M 的壓縮到 3.5M,模型大小降低了 56.79%,其中檢測(cè)模型速度提升 21%,而且整體模型精度還有提升。

除了 3.5M 超輕量 OCR 模型,PaddleOCR 提供了多語(yǔ)言預(yù)訓(xùn)練模型(英、德、法、韓、日),支持自定義訓(xùn)練和豐富的部署方式。

責(zé)任編輯:PSY

原文標(biāo)題:Github標(biāo)星4.6K+!這個(gè)OCR開(kāi)源項(xiàng)目,火了!

文章出處:【微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 開(kāi)源
    +關(guān)注

    關(guān)注

    3

    文章

    3402

    瀏覽量

    42711
  • OCR
    OCR
    +關(guān)注

    關(guān)注

    0

    文章

    146

    瀏覽量

    16427
  • GitHub
    +關(guān)注

    關(guān)注

    3

    文章

    473

    瀏覽量

    16564

原文標(biāo)題:Github標(biāo)星4.6K+!這個(gè)OCR開(kāi)源項(xiàng)目,火了!

文章出處:【微信號(hào):TheBigData1024,微信公眾號(hào):人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    訊維KVM坐席管理協(xié)作系統(tǒng):OCR功能及優(yōu)勢(shì)介紹

    框選識(shí)別的場(chǎng)景中。訊維首次將OCR智能文字識(shí)別功能加入全新KVM坐席管理協(xié)作系統(tǒng)中,解決手動(dòng)記錄文字效率低下的問(wèn)題,提供坐席人員的工作效率。 訊維分布式KVM坐席管理系統(tǒng)是一款集成了多種信息及圖形處理器技術(shù)的智能化設(shè)備,
    的頭像 發(fā)表于 01-22 10:02 ?99次閱讀

    開(kāi)源基礎(chǔ)設(shè)施能力建設(shè)分論壇成功舉辦

    在當(dāng)今科技飛速發(fā)展的時(shí)代,開(kāi)源已成為推動(dòng)全球創(chuàng)新與進(jìn)步的核心動(dòng)力。無(wú)論是開(kāi)發(fā)實(shí)踐還是數(shù)字化轉(zhuǎn)型,開(kāi)源以其特有的開(kāi)放性、共享性和協(xié)同性,助力各行業(yè)技術(shù)革新。在構(gòu)建開(kāi)源生態(tài)的過(guò)程中,
    的頭像 發(fā)表于 12-27 13:56 ?224次閱讀

    如何在播放視頻過(guò)程中插入音頻

    ZDP14x0是一款基于開(kāi)源GUI引擎的圖像顯示專用驅(qū)動(dòng)芯片,可以通過(guò)串口或者SPI與其他芯片通信,且能播放視頻。本文將介紹如何在播放視頻過(guò)程中插入音頻。
    的頭像 發(fā)表于 12-26 11:13 ?435次閱讀
    如何在播放視頻<b class='flag-5'>過(guò)程</b>中插入音頻

    使用ADS1211U的過(guò)程中,采樣值輸出一直為0XFFFFFF,為什么?

    最近在使用ADS1211U的過(guò)程中遇到些問(wèn)題,一個(gè)問(wèn)題是采樣值輸出一直為0XFFFFFF,有時(shí)候跟換一塊芯片就會(huì)好,有時(shí)候是一直是0;還有就是在CPU程序仿真的過(guò)程中會(huì)與非仿真狀態(tài)下產(chǎn)生數(shù)據(jù)
    發(fā)表于 12-25 06:22

    開(kāi)源AI模型庫(kù)是干嘛的

    開(kāi)源AI模型庫(kù)是指那些公開(kāi)源代碼、允許自由訪問(wèn)和使用的AI模型集合。這些模型通常經(jīng)過(guò)訓(xùn)練,能夠執(zhí)行特定的任務(wù)。以下,是對(duì)開(kāi)源AI模型庫(kù)的詳細(xì)介紹,由AI部落小編整理。
    的頭像 發(fā)表于 12-14 10:33 ?294次閱讀

    ElfBoard開(kāi)源項(xiàng)目|車牌識(shí)別項(xiàng)目技術(shù)文檔

    車牌識(shí)別項(xiàng)目基于百度智能云平臺(tái),旨在利用其強(qiáng)大的OCR服務(wù)實(shí)現(xiàn)車牌號(hào)碼的自動(dòng)識(shí)別。選擇百度智能云的原因是其高效的API接口和穩(wěn)定的服務(wù)質(zhì)量,能夠幫助開(kāi)發(fā)者快速實(shí)現(xiàn)車牌識(shí)別應(yīng)用。這個(gè)開(kāi)源項(xiàng)目使用攝像頭
    的頭像 發(fā)表于 12-06 10:30 ?315次閱讀
    ElfBoard<b class='flag-5'>開(kāi)源</b>項(xiàng)目|車牌識(shí)別項(xiàng)目技術(shù)文檔

    介紹6款開(kāi)源免費(fèi)的網(wǎng)絡(luò)監(jiān)控工具

    網(wǎng)絡(luò)監(jiān)控是保障網(wǎng)絡(luò)系統(tǒng)和數(shù)據(jù)安全的重要手段,能夠幫助運(yùn)維人員及時(shí)發(fā)現(xiàn)并應(yīng)對(duì)各種問(wèn)題,及時(shí)發(fā)現(xiàn)并解決,從而確保網(wǎng)絡(luò)的順暢運(yùn)行。 文本將簡(jiǎn)單介紹6款開(kāi)源免費(fèi)的網(wǎng)絡(luò)監(jiān)控工具,并準(zhǔn)備了對(duì)應(yīng)的資料文檔,建議運(yùn)
    的頭像 發(fā)表于 11-25 15:53 ?818次閱讀
    <b class='flag-5'>介紹</b>6款<b class='flag-5'>開(kāi)源</b>免費(fèi)的網(wǎng)絡(luò)監(jiān)控工具

    開(kāi)源ISP(Infinite-ISP)介紹

    公開(kāi),都是給一堆函數(shù)自己調(diào)用調(diào)試。因?yàn)閺S商將 ISP 算法視為保持市場(chǎng)競(jìng)爭(zhēng)力的獨(dú)特秘訣。雖然之前介紹了很多開(kāi)源ISP項(xiàng)目(優(yōu)秀的 Verilog/FPGA開(kāi)源項(xiàng)目介紹(二十六)- IS
    的頭像 發(fā)表于 11-18 10:21 ?601次閱讀
    <b class='flag-5'>開(kāi)源</b>ISP(Infinite-ISP)<b class='flag-5'>介紹</b>

    明治案例 | 【OCR識(shí)別+條碼讀取】一步到位,印刷品質(zhì)的智能守護(hù)者

    在某大型印刷企業(yè)的生產(chǎn)線上,印刷機(jī)需要完成大量的條碼印刷任務(wù)。為了確保條碼的準(zhǔn)確性和可讀性,需要在設(shè)備上安裝傳感器進(jìn)行條碼印刷的讀碼和OCR識(shí)別檢測(cè)。1、傳感器需要準(zhǔn)確識(shí)別條碼中的信息,并將其與預(yù)設(shè)
    的頭像 發(fā)表于 10-22 08:02 ?381次閱讀
    明治案例 | 【<b class='flag-5'>OCR</b>識(shí)別+條碼讀取】一步到位,印刷品質(zhì)的智能守護(hù)者

    光學(xué)識(shí)別的過(guò)程包含哪些

    光學(xué)識(shí)別(Optical Character Recognition,OCR)是一種將圖像中的文字轉(zhuǎn)換為機(jī)器可讀文本的技術(shù)。這個(gè)過(guò)程涉及多個(gè)步驟,包括圖像預(yù)處理、文本檢測(cè)、字符分割、字符識(shí)別和后處理
    的頭像 發(fā)表于 09-10 15:36 ?480次閱讀

    ?介紹一款Java開(kāi)發(fā)的開(kāi)源MES系統(tǒng)

    ?介紹一款Java開(kāi)發(fā)的開(kāi)源MES系統(tǒng),萬(wàn)界星空科技開(kāi)源的MES系統(tǒng)。該系統(tǒng)基于Java開(kāi)發(fā),具有廣泛的適用性和高度的可定制性,能夠滿足不同行業(yè)、不同規(guī)模企業(yè)的智能制造需求。
    的頭像 發(fā)表于 09-05 17:39 ?761次閱讀
    ?<b class='flag-5'>介紹</b>一款Java開(kāi)發(fā)的<b class='flag-5'>開(kāi)源</b>MES系統(tǒng)

    明治案例 | PE編織袋【大視野】【OCR識(shí)別】

    OCR識(shí)別技術(shù)OCR識(shí)別技術(shù)在工業(yè)生產(chǎn)中扮演著至關(guān)重要的角色。它利用先進(jìn)的圖像處理技術(shù),自動(dòng)、高效地識(shí)別并轉(zhuǎn)換圖像中的文字信息為可編輯的文本數(shù)據(jù)。這一技術(shù)的應(yīng)用確保了生產(chǎn)數(shù)據(jù)的準(zhǔn)確性和實(shí)時(shí)性,為生
    的頭像 發(fā)表于 08-13 08:25 ?517次閱讀
    明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b>識(shí)別】

    智能手機(jī)充電頭OCR精準(zhǔn)識(shí)別

    文本是人類最重要的信息來(lái)源之一,自然場(chǎng)景中充滿了形形色色的文字符號(hào)。光學(xué)字符識(shí)別(OCR)相信大家都不陌生。而工業(yè)場(chǎng)景的圖像文字識(shí)別更加復(fù)雜,OCR出現(xiàn)在很多不同的場(chǎng)合,對(duì)某些特殊的表面、產(chǎn)品整體上
    的頭像 發(fā)表于 06-11 08:24 ?516次閱讀
    智能手機(jī)充電頭<b class='flag-5'>OCR</b>精準(zhǔn)識(shí)別

    Zebra Aurora深度學(xué)習(xí)OCR算法榮獲CAIMRS頒發(fā)的自動(dòng)化創(chuàng)新獎(jiǎng)

    在第二十二屆中國(guó)自動(dòng)化及數(shù)字化年度評(píng)選活動(dòng)中,Zebra Aurora深度學(xué)習(xí)OCR算法獲得了由中國(guó)自動(dòng)化及數(shù)字化產(chǎn)業(yè)年會(huì)(簡(jiǎn)稱CAIMRS)頒發(fā)的自動(dòng)化創(chuàng)新獎(jiǎng)。
    的頭像 發(fā)表于 03-20 16:35 ?511次閱讀

    如何判斷觸摸屏用有機(jī)硅OCR/LOCA性能的優(yōu)劣

    判斷OCR/LOCA性能的優(yōu)劣
    的頭像 發(fā)表于 02-29 10:48 ?669次閱讀
    威尼斯人娱乐代理注册| 网上百家乐能作弊吗| 百家乐官网如何取胜| 威尼斯人娱乐城品牌| 百家乐娱乐官方网| 太阳城百家乐官网试玩优惠| 菲律宾太阳城88| 百家乐注册优惠平台| 腾冲县| 百家乐论坛白菜| 海立方百家乐官网赢钱| 总统娱乐城返水| 郑州百家乐高手| 戒掉百家乐官网的玩法技巧和规则| E乐博百家乐官网现金网| 波克城市棋牌中心| 新百家乐.百万筹码| 无锡百家乐官网的玩法技巧和规则 | 百家乐官网网上赌博| 最新六合彩开奖结果| 顶尖百家乐对单| 现场百家乐官网的玩法技巧和规则| 百家乐官网代理商博彩e族| 百家乐官网赢钱密籍| 大发888下载 df888gfxzylc8| 百家乐大路图| 百家乐官网娱乐城| 网络百家乐官网真假| 百家乐官网路单免费下载| 武冈市| 大发888| 金赞百家乐的玩法技巧和规则| 南京百家乐在哪| 赌百家乐波音备用网| 真人版百家乐官网试玩| 百家乐官网双倍派彩的娱乐城| 优博百家乐官网现金网| 咸宁市| e世博线上娱乐| 大发888官方下载 银行| 百家乐真人现场|