吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

如何讓文本識別更加智能,數據堂獲取這些OCR轉寫數據

火花 ? 來源:大眾新聞 ? 作者:火花 ? 2020-09-17 11:34 ? 次閱讀

近年來,學生黨們擁有了一款新的學習神器——拍照搜題。當遇到不會做的題目時,只需要對著題目拍照,手機中就會出現這道題目的詳細解答思路和答案。“拍照搜題”背后的黑科技就是光學字符識別技術,即OCR。OCR是指電子設備,例如掃描儀或相機檢查紙上打印的字符,通過檢測暗、亮的模式確定其形狀,然后用字符識別的方法將形狀翻譯成計算機文字的過程。

OCR的應用領域十分廣泛。最早為我們熟知的“哪里不會點哪里”的點讀機就應用了OCR。點讀機的點讀筆中裝有一個掃描文字的攝像頭,當點讀筆接觸到書本后,便可將文字內容識別和提取。作為常用的一款辦公軟件,掃描全能王可以實現“圖片轉文字”的功能。軟件可以識別各種文件類型中的文字信息,這是非常典型的OCR技術的應用。

目前,文本識別分為以下幾類:

· 通用文字識別:一般是指如PDF等不規則文檔類的識別。

·卡證識別:包括身份證、銀行卡、營業執照、名片、護照、港澳通行證、戶口本、駕駛證、行駛證等等。

· 票據識別:包括增值稅發票、定額發票、火車票、出租車票、行程單、保單、銀行單據等等。

· 其他:如車牌、車輛合格證、印章檢測等等。

隨著分類的不斷拓展,OCR技術的應用場景也越來越廣泛,以下是幾個應用較為成熟的領域:

· 遠程身份認證:結合OCR和人臉識別技術,實現用戶證件信息的自動錄入,并完成用戶身份驗證。應用于金融保險、社保、O2O等行業,有效控制業務風險。

· 內容審核與監管:自動識別圖片、視頻中的文字內容,及時發現涉黃、涉暴、政治敏感、惡意廣告等不合規內容,規避業務風險,大幅節約人工審核成本。

· 紙質文檔票據電子化:通過OCR實現紙質文檔資料、票據、表格的自動識別和錄入,減少人工錄入成本,提高輸入效率。

針對上述的場景,基于深度學習的技術而言,訓練數據的數量很大程度上影響了技術效果。數據堂作為深耕于AI數據領域近10年的人工智能數據服務提供商,一直致力于為全球人工智能企業提供專業的數據服務。依托自身的數據優勢以及豐富的數據處理經驗,數據堂推出了系列OCR標注及轉寫數據,為相關技術應更廣泛的落地提供助力。

數據涵蓋8種語言、多種場景、不同拍攝角度、不同拍攝距離、不同光照條件。在標注方面,標注行級文本的四邊形框,行級文本轉寫。四邊形框頂點偏差不超過五個像素為正確檢測,檢測框精度不低于95%,文本轉寫精度不低于95%,該數據可用于多國語言OCR任務。

數據涵蓋12種語言(6種亞洲語、6種歐洲語),包括商店牌匾、站牌、海報、車票、路標、漫畫、井蓋畫、提示語、警示語、包裝說明、菜單、建筑物標志等多種自然場景。在標注方面,標注行級文本的四邊形框,行級文本轉寫,四邊形框頂點偏差不超過五個像素為正確檢測,檢測框精度不低于97%,文本轉寫精度不低于97%。

數據包括自然場景圖片2,056張,互聯網圖像1,103張,文本圖像347張。在標注方面,行級內容用行級四邊形框標注、行級內容轉寫;豎列內容用豎列四邊形框標注、豎列內容轉寫。數據可用于多場景下的印地語識別、印地語拍照翻譯等任務。

數據包括自然場景圖片258張,互聯網圖像2,553張,文本圖像2,184張。在標注方面,行級內容用行級四邊形框標注、行級內容轉寫;豎列內容用豎列四邊形框標注、豎列內容轉寫。數據可用于多種場景下的越南語識別、越南語拍照翻譯等任務。

相比物體檢測識別,OCR由于包含傾斜文本框、低分辨率文字和文本版面多樣化的情況,因此OCR數據標注具有特殊性,標注成本更高。數據堂的數加加Pro標注平臺支持私有化部署,能夠幫助企業快速、安全的對人工智能數據進行標注,為企業提供更專業、更安全的數據基礎設施。

fqj

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 智能識別
    +關注

    關注

    0

    文章

    202

    瀏覽量

    18167
  • OCR
    OCR
    +關注

    關注

    0

    文章

    146

    瀏覽量

    16427
收藏 人收藏

    評論

    相關推薦

    如何使用自然語言處理分析文本數據

    使用自然語言處理(NLP)分析文本數據是一個復雜但系統的過程,涉及多個步驟和技術。以下是一個基本的流程,幫助你理解如何使用NLP來分析文本數據: 1. 數據收集 收集文本數據 :從各種
    的頭像 發表于 12-05 15:27 ?431次閱讀

    訊維智能語音轉寫系統:開啟智能會議記錄新篇章!

    隨著人工智能技術的飛速發展,智能語音轉寫系統逐漸走進我們的日常生活和工作之中,成為提升工作效率、優化信息處理的重要工具。訊維智能語音轉寫系統
    的頭像 發表于 11-15 15:41 ?407次閱讀
    訊維<b class='flag-5'>智能</b>語音<b class='flag-5'>轉寫</b>系統:開啟<b class='flag-5'>智能</b>會議記錄新篇章!

    精準高效,訊維智能語音轉寫系統打造智慧會議新體驗!

    在快節奏的現代工作環境中,會議已成為企業溝通、決策和協作不可或缺的一部分。然而,傳統會議記錄方式往往存在效率低下、信息遺漏、人力成本高等問題。隨著人工智能技術的飛速發展,智能語音轉寫系統應運而生,其中訊維
    的頭像 發表于 11-15 15:27 ?416次閱讀
    精準高效,訊維<b class='flag-5'>智能</b>語音<b class='flag-5'>轉寫</b>系統打造智慧會議新體驗!

    訊維智能語音轉寫系統核心優勢大解析!

    憑借其高精度識別、實時轉寫智能糾錯以及多語種支持等核心優勢,正在深刻改變著會議記錄、教育培訓、采訪報道和法律取證等多個領域的工作方式,成為提升工作效率和優化信息處理的重要工具。下面我們來整理下訊維
    的頭像 發表于 11-15 15:24 ?426次閱讀
    訊維<b class='flag-5'>智能</b>語音<b class='flag-5'>轉寫</b>系統核心優勢大解析!

    明治案例 | 【OCR識別+條碼讀取】一步到位,印刷品質的智能守護者

    在某大型印刷企業的生產線上,印刷機需要完成大量的條碼印刷任務。為了確保條碼的準確性和可讀性,需要在設備上安裝傳感器進行條碼印刷的讀碼和OCR識別檢測。1、傳感器需要準確識別條碼中的信息,并將其與預設
    的頭像 發表于 10-22 08:02 ?381次閱讀
    明治案例 | 【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>+條碼讀取】一步到位,印刷品質的<b class='flag-5'>智能</b>守護者

    數據線芯片-數據智能控制芯片EN16F

    低功耗功能。 數據智能控制芯片的基礎功能包括數據傳輸管理、電源管理、設備識別和用戶接口控制。隨著技術的不斷進步,這些芯片已經實現了從基礎
    發表于 09-27 11:04

    光學字符識別是什么的一種技術

    光學字符識別(Optical Character Recognition,簡稱OCR)是一種將文本資料轉換為計算機可編輯和可搜索的數據格式的技術。這項技術廣泛應用于文檔掃描、
    的頭像 發表于 09-10 15:48 ?576次閱讀

    光學識別技術的工作原理是什么?

    光學識別技術(Optical Character Recognition,簡稱OCR)是一種將圖像中的文字信息轉換成可編輯和可搜索的文本數據的技術。它廣泛應用于文檔掃描、數據錄入、自動
    的頭像 發表于 09-10 15:46 ?829次閱讀

    光學識別字符是自動識別技術嗎

    輯和可搜索的數據OCR技術廣泛應用于數據錄入、文檔管理、自動化處理等領域。 1. OCR技術的歷史 OCR技術的發展可以追溯到20世紀50
    的頭像 發表于 09-10 15:43 ?549次閱讀

    光學識別的過程包含哪些

    光學識別(Optical Character Recognition,OCR)是一種將圖像中的文字轉換為機器可讀文本的技術。這個過程涉及多個步驟,包括圖像預處理、文本檢測、字符分割、字
    的頭像 發表于 09-10 15:36 ?480次閱讀

    光學識別輸入的基本原理是什么

    光學字符識別(Optical Character Recognition,OCR)是一種將不同格式的文檔(如掃描的紙張文檔、PDF文件或數字相機拍攝的圖片)轉換成可編輯和可搜索的數據的技術。O
    的頭像 發表于 09-10 15:34 ?744次閱讀

    明治案例 | PE編織袋【大視野】【OCR識別

    OCR識別技術OCR識別技術在工業生產中扮演著至關重要的角色。它利用先進的圖像處理技術,自動、高效地識別并轉換圖像中的文字信息為可編輯的
    的頭像 發表于 08-13 08:25 ?517次閱讀
    明治案例 | PE編織袋【大視野】【<b class='flag-5'>OCR</b><b class='flag-5'>識別</b>】

    訊維智能語音轉寫系統確保企業數據的安全性

    隨著人工智能技術的飛速發展,智能語音轉寫系統逐漸走進我們的日常生活和工作之中,成為提升工作效率、優化信息處理的重要工具。訊維智能語音轉寫系統
    的頭像 發表于 08-02 15:53 ?763次閱讀

    智能手機充電頭OCR精準識別

    文本是人類最重要的信息來源之一,自然場景中充滿了形形色色的文字符號。光學字符識別(OCR)相信大家都不陌生。而工業場景的圖像文字識別更加復雜
    的頭像 發表于 06-11 08:24 ?516次閱讀
    <b class='flag-5'>智能</b>手機充電頭<b class='flag-5'>OCR</b>精準<b class='flag-5'>識別</b>

    車內語音識別數據智能駕駛中的價值與應用

    化和個性化提供了有力支持。本文將詳細介紹車內語音識別數據智能駕駛中的價值、應用以及面臨的挑戰和未來的發展趨勢。 二、車內語音識別數據的價值 提高駕駛安全性:通過語音控制車輛功能,駕駛員可以
    的頭像 發表于 02-19 11:47 ?667次閱讀
    在线扎金花| 百家乐官网视频大厅| 商洛市| 百家乐官网评级网站| 百家乐官网对保| 百家乐压钱技巧| 大发888娱乐城娱乐城| 松潘县| 广州百家乐官网娱乐场开户注册 | 临漳县| 百家乐路子分析| 东京太阳城王子酒店| 百家乐官网如何看面| 转载24山五行相克| 大发888充值100元| 百家乐官网投注双赢技巧| 百家乐路单下注| 大发888如何下载| 赌场百家乐官网技巧| 百家乐官网常用公式| 风水24山图| 大发888更名网址62| 真人百家乐官网策略| 赌博百家乐赢钱方法| 真钱梭哈| 百家乐娱乐城玩法| 大赢家即时比分| 现场百家乐官网能赢吗| 德州百家乐扑克桌| 太阳城百家乐官网红利| 永利百家乐娱乐平台| 临沂市| 百家乐庄闲最佳打法| 开16个赌场敛财| 网络百家乐官网的玩法技巧和规则| 威尼斯人娱乐城003| 棋牌娱乐网,| 百家乐官网怎么发牌| 新大发888娱乐城| 百家乐官网的巧门| 大发888电话客服|