吴忠躺衫网络科技有限公司

電子發(fā)燒友App

硬聲App

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示
創(chuàng)作
電子發(fā)燒友網(wǎng)>電子資料下載>電子資料>Raspberry Pi 4上帶Respeaker的離線語音識別

Raspberry Pi 4上帶Respeaker的離線語音識別

2023-06-25 | zip | 0.00 MB | 次下載 | 免費

資料介紹

描述

2020 年 6 月更新:DeepSpeech 0.7.* .Screenshots 的更新命令,除了 Raspberry Pi 4 保持不變。直到最近的問題是缺乏用于該任務(wù)的簡單、快速和準(zhǔn)確的引擎。大約一年前,當(dāng)我研究這個主題時,當(dāng)你必須在樹莓派 3 上運行 ASR(不僅僅是熱詞檢測,還有大詞匯量轉(zhuǎn)錄)時,有幾個選擇是:

  • CMUS獅身人面像
  • 卡爾迪
  • 碧玉

鏈接:

Python 3 人工智能:離線 STT 和 TTS

適用于樹莓派的最佳語音識別軟件

還有其他幾個。它們都不容易設(shè)置,也不特別適合在資源受限的環(huán)境中運行因此,幾周前,我再次開始研究這個領(lǐng)域,并在一些搜索中偶然發(fā)現(xiàn)了 Mozilla 的 DeepSpeech 引擎。它已經(jīng)存在了一段時間,但直到最近(2019 年 12 月)他們才發(fā)布了 0.6.0 版本的 ASR 引擎,其中包含 .tflite 模型以及其他重大改進。它已將英文模型的大小從 188 MB 減少到 47 MB??。“帶有 TensorFlow Lite 的 DeepSpeech v0.6 在 Raspberry Pi 4 的單核上運行速度比實時速度更快。”Mozilla 的 Reuben Morais 在新聞公告中聲稱. 所以我決定親自驗證這一說法,在不同的硬件上運行一些基準(zhǔn)測試,并制作我自己的帶有熱詞檢測的音頻轉(zhuǎn)錄應(yīng)用程序。讓我們看看結(jié)果如何。

提示:我沒有失望。

pYYBAGNYg8uAQFGiAABiRLeJ2F4834.png
其實我和這個火狐一樣開心!
?

?

curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.tflite
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.pbmm
curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/deepspeech-0.7.1-models.scorer

下載示例音頻文件

curl -LO https://github.com/mozilla/STT/releases/download/v0.7.1/audio-0.7.1.tar.gz
tar xvf audio-0.7.1.tar.gz

樹莓派 4 運行:

deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav

如果成功,您應(yīng)該看到以下輸出

poYBAGNYg86AXVqPAAFlFGwSKSg234.png
?

不錯!1.975 秒的聲音文件為 1.529 秒。它比實時更快。

Nvidia Jetson Nano 運行:

deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
pYYBAGNYg9CARx7rAAEkrBG7oMk355.png
?

嗯..比樹莓派慢一點。這是意料之中的,因為 Nvidia Jetson CPU 不如 Raspberry Pi 4 強大。到目前為止,還沒有用于 arm64 架構(gòu)的預(yù)構(gòu)建二進制文件支持 GPU,因此我們無法利用 Nvidia Jetson Nano 的 GPU 進行推理加速。我認為這個任務(wù)不在 DeepSpeech 團隊的路線圖上,所以在不久的將來我會在這里自己做一些研究,并嘗試編譯該二進制文件,看看使用 GPU 可以實現(xiàn)哪些速度提升。但幾秒鐘的速度仍然相當(dāng)不錯,根據(jù)您的項目,您可能希望選擇在 CPU 上運行 DeepSpeech 并讓 GPU 用于其他深度學(xué)習(xí)任務(wù)。

視窗 10/Linux

deepspeech --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
poYBAGNYg9OAMA1YAAF0T4D7I3Y195.png
?
pYYBAGNYg9WAFRzbAADCVQPqe4A306.png
?

或者如果使用啟用 GPU 的版本:

deepspeech --model deepspeech-0.7.*-models.pbmm --scorer deepspeech-0.7.*-models.scorer --audio audio/2830-3980-0043.wav
poYBAGNYg9eAHfVgAAFKqG76eeE088.png
?

如您所見,.tflite 模型在現(xiàn)代 CPU 系統(tǒng)上實現(xiàn)了亞實時,這對于創(chuàng)建離線 ASR 應(yīng)用程序的人們來說是個好消息。

以下是對比結(jié)果表:

poYBAGNYg9qAVxthAACobcEVGA0362.jpg
?

好吧,我們對預(yù)先錄制的聲音樣本進行了基準(zhǔn)測試,但我們真的想做一些實時轉(zhuǎn)錄。讓我們這樣做吧!

從https://github.com/mozilla/DeepSpeech-examples下載 DeepSpeech 示例

導(dǎo)航到 mic_vad_streaming 并安裝依賴項

pip3 install -r requirements.txt
sudo apt install portaudio19-dev

將麥克風(fēng)連接到您的系統(tǒng)(我使用的是 Raspberry Pi 4 1 GB)。對于麥克風(fēng),盡管您可以使用任何麥克風(fēng),包括筆記本電腦的內(nèi)置麥克風(fēng),但聲音的質(zhì)量確實對結(jié)果有很大影響。對于這個演示,我使用的是 Seeed Studio 的ReSpeaker USB 麥克風(fēng)陣列它支持 5m 遠場拾音和 360° 拾音模式,并實現(xiàn)以下聲學(xué)算法:DOA(到達方向)、AEC(自動回聲消除)、AGC(自動增益控制)、NS (噪音抑制)。

poYBAGNYg9yAbm2ZAAAd6LjUfUY097.png
?
python3 ../DeepSpeech-examples/mic_vad_streaming/mic_vad_streaming.py --model deepspeech-0.7.*-models.tflite --scorer deepspeech-0.7.*-models.scorer

從包含模型的文件夾中執(zhí)行此命令。-v 參數(shù)允許您調(diào)整 VAD(語音活動檢測)的閾值。這是演示的結(jié)果。

?

好,太棒了!我們可以改進嗎?是的。我們真的不希望我們的設(shè)備一直在轉(zhuǎn)錄對話。談?wù)撾[私噩夢和浪費電力。

pYYBAGNYg96AAnHBAAAvjKETV7k319.png
它/他/她?正在聽……或許沒有。如果它不是開源的,你永遠不會知道。
?


下載該資料的人也在下載 下載該資料的人還在閱讀
更多 >

評論

查看更多

下載排行

本周

  1. 1A7159和A7139射頻芯片的資料免費下載
  2. 0.20 MB   |  55次下載  |  5 積分
  3. 2PIC12F629/675 數(shù)據(jù)手冊免費下載
  4. 2.38 MB   |  36次下載  |  5 積分
  5. 3PIC16F716 數(shù)據(jù)手冊免費下載
  6. 2.35 MB   |  18次下載  |  5 積分
  7. 4dsPIC33EDV64MC205電機控制開發(fā)板用戶指南
  8. 5.78MB   |  8次下載  |  免費
  9. 5STC15系列常用寄存器匯總免費下載
  10. 1.60 MB   |  7次下載  |  5 積分
  11. 6模擬電路仿真實現(xiàn)
  12. 2.94MB   |  4次下載  |  免費
  13. 7PCB圖繪制實例操作
  14. 2.92MB   |  2次下載  |  免費
  15. 8零死角玩轉(zhuǎn)STM32F103—指南者
  16. 26.78 MB   |  1次下載  |  1 積分

本月

  1. 1ADI高性能電源管理解決方案
  2. 2.43 MB   |  452次下載  |  免費
  3. 2免費開源CC3D飛控資料(電路圖&PCB源文件、BOM、
  4. 5.67 MB   |  141次下載  |  1 積分
  5. 3基于STM32單片機智能手環(huán)心率計步器體溫顯示設(shè)計
  6. 0.10 MB   |  137次下載  |  免費
  7. 4A7159和A7139射頻芯片的資料免費下載
  8. 0.20 MB   |  55次下載  |  5 積分
  9. 5PIC12F629/675 數(shù)據(jù)手冊免費下載
  10. 2.38 MB   |  36次下載  |  5 積分
  11. 6如何正確測試電源的紋波
  12. 0.36 MB   |  19次下載  |  免費
  13. 7PIC16F716 數(shù)據(jù)手冊免費下載
  14. 2.35 MB   |  18次下載  |  5 積分
  15. 8Q/SQR E8-4-2024乘用車電子電器零部件及子系統(tǒng)EMC試驗方法及要求
  16. 1.97 MB   |  8次下載  |  10 積分

總榜

  1. 1matlab軟件下載入口
  2. 未知  |  935121次下載  |  10 積分
  3. 2開源硬件-PMP21529.1-4 開關(guān)降壓/升壓雙向直流/直流轉(zhuǎn)換器 PCB layout 設(shè)計
  4. 1.48MB  |  420062次下載  |  10 積分
  5. 3Altium DXP2002下載入口
  6. 未知  |  233088次下載  |  10 積分
  7. 4電路仿真軟件multisim 10.0免費下載
  8. 340992  |  191367次下載  |  10 積分
  9. 5十天學(xué)會AVR單片機與C語言視頻教程 下載
  10. 158M  |  183335次下載  |  10 積分
  11. 6labview8.5下載
  12. 未知  |  81581次下載  |  10 積分
  13. 7Keil工具MDK-Arm免費下載
  14. 0.02 MB  |  73810次下載  |  10 積分
  15. 8LabVIEW 8.6下載
  16. 未知  |  65988次下載  |  10 積分
现金百家乐官网网上娱乐| 7m足球比分| 百家乐娱乐平台真钱游戏| 洛克百家乐官网的玩法技巧和规则| 百家乐官网开户送彩金28| 三门县| 1368棋牌游戏平台| 百家乐机器图片| 天天百家乐官网游戏| 德州扑克怎么玩| 大发8888娱乐城 真钱| 足球百家乐系统| 最佳场百家乐的玩法技巧和规则| 百家乐合法| 太阳城百家乐软件| 百家乐二号博彩正网| 真人百家乐技巧| 利都百家乐官网国际娱乐场开户注册 | 百家乐视频美女| 澳门赌百家乐官网的玩法技巧和规则| 百家乐官网技巧大全| 百家乐官网的方法和公式| 百家乐官网网站那个好| 百家乐官网投注双赢技巧| 百家乐官网庄家出千内幕| 百家乐官网娱乐城备用网址| 百家乐官网路单下注| 手游| 百家乐官网稳赢玩法| 百家乐官网投注最好方法| 百家乐官网局部| 精通百家乐官网的玩法技巧和规则| 任我赢百家乐官网软件中国有限公司| 百家乐官网生活馆| 百家乐官网试玩| 澳门百家乐有限公司| 百家乐旺门打法| 威尼斯人娱乐城真钱百家乐| 百家乐没边| 大发888开户博彩吧| 德州扑克规则视频|