吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

GPT-4o深夜炸場!AI實時視頻通話絲滑如人類,Plus功能免費可用

穎脈Imgtec ? 2024-05-15 08:27 ? 次閱讀

轉自:量子位 | 公眾號 QbitAI

不開玩笑,電影《她》真的來了。

OpenAI最新旗艦大模型GPT-4o,不僅免費可用,能力更是橫跨聽、看、說,絲滑流暢毫無延遲,就像在打一個視頻電話。

現場直播的效果更是炸裂:

它能感受到你的呼吸節奏,也能用比以前更豐富的語氣實時回復,甚至可以做到隨時打斷。


GPT-4o里的“o”是Omni的縮寫,也就是“全能”的意思,接受文本、音頻和圖像的任意組合作為輸入,并生成文本、音頻和圖像輸出。

它可以在短至232毫秒、平均320毫秒的時間內響應音頻輸入,與人類在對話中的反應速度一致。


這還是一份給所有人的大禮,GPT4-o與ChatGPT Plus會員版所有的能力,包括視覺、聯網、記憶、執行代碼、GPT Store……

將對所有用戶免費開放!

eb0e1682-1251-11ef-9118-92fbcf53809c.png

(新語音模式幾周內先對Plus用戶開放)在直播現場,CTO Murati穆姐說:這是把GPT-4級別的模型開放出去,其實她還謙虛了。

在場外,研究員William Fedus揭秘,GPT-4o就是之前在大模型競技場搞A/B測試的模型之一,im-also-a-good-gpt2-chatbot。

無論從網友上手體驗還是競技場排位來看,都是高于GPT-4-Turbo級別的模型了,ELO分數一騎絕塵。

eb122dc6-1251-11ef-9118-92fbcf53809c.png

而這樣的超強模型也將提供API,價格打5折,速度提高一倍,單位時間調用次數足足是原來的5倍!

追直播的網友已經在設想可能的應用,可以替代盲人看世界了。以及確實感覺比之前的語音模式體驗上強上不少。

eb5edc84-1251-11ef-9118-92fbcf53809c.png

鑒于之前不少人就已經和ChatGPT語音模式“談戀愛”了,有大膽想法的朋友,可以把你們的想法發在評論區了。


總裁Brockman在線演示

知道OpenAI發布會為什么定在谷歌I/O前一天了——打臉,狠狠打臉。

谷歌Gemini發布會需要靠剪輯視頻和切換提示詞達成的偽實時對話效果,OpenAI現場全都直播演示了。

比如讓ChatGPT在語言不通的兩個人之間充當翻譯機,聽到英語就翻譯成意大利語,聽到意大利語就翻譯成英語。


發布會直播之外,總裁哥Brockman還發布了額外的5分鐘詳細演示。而且是讓兩個ChatGPT互相對話,最后還唱起來了,戲劇感直接拉滿。這兩個ChatGPT,一個是舊版APP,只知道對話,另一個則是新版網頁,具備視覺等新能力。(我們不妨取Old和New的首字母,分別叫TA們小O和小N)eb8f021a-1251-11ef-9118-92fbcf53809c.pngBrockman首先向小O介紹了大致情況,告訴她要和一個擁有視覺能力的AI對話,她表示很酷并欣然接受。接著,Brockman讓她稍作休息,并向小N也介紹情況,還順帶展示了小N的視覺能力。只見打完招呼后,小N準確地說出了Brockman的衣著打扮和房間環境。而對于要和小O對話這件事,小N也感到很有趣。
接下來就是小O和小N相互對白的時間了,TA們依然是從Brockman的衣著開始聊起,小O不斷提出新的問題,小N都一一解答。接著,他們又談論了房間的風格、布置和光線,甚至小N還意識到了Brockman正站在上帝視角凝視著TA們。


如果你看了這段視頻就會發現,畫面中出現了一個女人在Brockman身后做了些惡搞的手勢。這可不是亂入,是Brockman和女人串通好,專門給小N設計的一道“考題”。

就在小O和小N聊的正開心的時候,Brockman選擇加入,直接問有沒有看到什么不正常的地方。結果是小N直接識破了Brockman的小伎倆,直接復述出了女人在他身后做小動作的場景,小O聽了之后直接感嘆原來在這里享受樂趣的不只有我們兩個。Brockman把這句話當成了夸贊,并對小O表示了感謝,還愉快地加入了TA們的對話。之后是最后也是最精彩的部分,在Brockman的指揮下,小O和小N根據剛才聊天的內容,直接開啟了對唱模式。只過了簡單幾輪,銜接地就十分密切,而且旋律悠揚,音色也是和真人毫無二致。
最后視頻以Brockman唱出的一句Thank you結束,在視頻外的推文中他還透露新的語音對話功能將在數周內向Plus用戶開放。

ebcac93a-1251-11ef-9118-92fbcf53809c.png


端到端訓練,一個神經網絡搞定語音文本圖像

正如奧特曼在發布會前所說,GPT-4o讓人感覺像魔法一樣,那么它是如何做到的呢?非常抱歉,這次非但沒有論文,連技術報告也不發了,只在官網Blog里有一段簡短的說明。在GPT-4o之前,ChatGPT語音模式由三個獨立模型組成,語音轉文本→GPT3.5/GPT-4→文本轉語音。我們也可以讓舊版ChatGPT語音模式自己講一下具體是怎么個流程。ebe410c0-1251-11ef-9118-92fbcf53809c.jpg這樣一來,整個系統的延遲足足有2.8秒(GPT-3.5)和5.4秒(GPT-4),而且丟失了大量的信息,它無法直接感受音調、多個說話者或背景噪音,也無法輸出笑聲、唱歌聲,或表達情感。ebfabea6-1251-11ef-9118-92fbcf53809c.jpgGPT-4o則是跨文本、視覺和音頻端到端訓練的新模型,這意味著所有輸入和輸出都由同一個神經網絡處理。在語音翻譯任務上,強于OpenAI專門的語音模型Whisper-V3以及谷歌和Meta的語音模型。ec8d0a68-1251-11ef-9118-92fbcf53809c.png在視覺理解上,也再次反超Gemini 1.0 Ultra與對家Claude Opuseca698d4-1251-11ef-9118-92fbcf53809c.png

雖然技術方面這次透露的消息就這么多了,不過也有學者評價。

一個成功的演示相當于1000篇論文。

ecaabb4e-1251-11ef-9118-92fbcf53809c.png


One More Thing

除了OpenAI帶來的精彩內容之外,也別忘了北京時間5月15日凌晨,谷歌將召開I/O大會。到時量子位將繼續第一時間帶來最新消息。另外根據網友推測,GPT-4o這么強,全都免費開放了,這是勸大家不續訂ChatGPT Plus了的意思嗎?那肯定不是啊~ecaef9f2-1251-11ef-9118-92fbcf53809c.png鑒于OpenAI春節期間在谷歌發布Gemini 1.5 Pro后半小時左右用Sora狙擊了一把,明天OpenAI還有新活也說不定呢?直播回放

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    87

    文章

    31517

    瀏覽量

    270333
  • 人工智能
    +關注

    關注

    1796

    文章

    47670

    瀏覽量

    240289
  • GPT
    GPT
    +關注

    關注

    0

    文章

    360

    瀏覽量

    15505
收藏 人收藏

    評論

    相關推薦

    OpenAI報告GPT-4o4o-mini模型性能下降,正緊急調查

    近日,全球領先的AI研究機構OpenAI發布了一份事故報告,引起了業界的廣泛關注。報告中指出,OpenAI目前正面臨GPT-4o4o-mini這兩款重要模型性能下降的問題。 據OpenAI方面透露
    的頭像 發表于 01-23 10:22 ?437次閱讀

    解鎖 GPT-4o!2024 ChatGPT Plus 代升級全攻略(附國內支付方法)

    ChatGPT Plus 每月 20 美元,OpenAI 承諾 Plus 用戶享有更快的響應速度、優先使用新功能及最新模型,包括強大的 GPT-4o。本文將分享 2024 年 Chat
    的頭像 發表于 10-29 18:17 ?1262次閱讀

    OpenAI解鎖GPT-4o定制功能,助力企業精準優化AI應用

    在8月21日的最新動態中,OpenAI 宣布了一項革命性的新功能,正式向企業用戶開放其頂尖AI模型GPT-4o的定制能力。這一舉措標志著OpenAI在激烈的企業級AI應用市場中邁出了重
    的頭像 發表于 08-21 16:06 ?515次閱讀

    OpenAI提前解鎖GPT-4o語音模式,引領對話新紀元

    OpenAI近日宣布了一項令人振奮的消息:即日起,部分ChatGPT Plus用戶將率先體驗到GPT-4o的語音模式,這一創新功能標志著自然語言處理與人工智能交互技術邁出了重要一步。GPT-4
    的頭像 發表于 08-01 18:24 ?1271次閱讀

    OpenAI 推出 GPT-4o mini 取代GPT 3.5 性能超越GPT 4 而且更快 API KEY更便宜

    OpenAI推出了GPT-4o mini模型,用來取代GPT-3.5.這是目前市場上最具成本效益的小模型。 ? 該模型在MMLU上得分為82%, 在LMSYS排行榜上的聊天偏好測試中表現優于
    的頭像 發表于 07-21 10:20 ?1172次閱讀
    OpenAI 推出 <b class='flag-5'>GPT-4o</b> mini 取代<b class='flag-5'>GPT</b> 3.5 性能超越<b class='flag-5'>GPT</b> <b class='flag-5'>4</b> 而且更快 API KEY更便宜

    國內直聯使用ChatGPT 4.0 API Key使用和多模態GPT4o API調用開發教程!

    1. 前言 ChatGPT-4o API 是 OpenAI 提供的強大工具,可用于自然語言處理和多模態任務。在國內直聯使用這些服務需要一些配置和技巧。本文將詳細介紹GPT-4o模型以及如何獲取
    的頭像 發表于 06-08 00:33 ?5552次閱讀
    國內直聯使用ChatGPT 4.0 API Key使用和多模態<b class='flag-5'>GPT4o</b> API調用開發教程!

    開發者如何調用OpenAI的GPT-4o API以及價格詳情指南

    ?目前,OpenAI新模型GPT-4oGPT-4 Turbo的價格如下: GPT-4o 對比 GPT-4 Turbo GPT-4o 擁有與
    的頭像 發表于 05-29 16:00 ?1.3w次閱讀
    開發者如何調用OpenAI的<b class='flag-5'>GPT-4o</b> API以及價格詳情指南

    OpenAI 深夜拋出王 “ChatGPT- 4o”, “她” 來了

    功能和實際應用。 GPT-4 turbo****的增強功能 ChatGPT-4o帶來了幾個值得注意的升級,增強了性能和可用性: · 更快的
    發表于 05-27 15:43

    Azure AI Studio現已支持提供GPT-4o API

    微軟公司在最近的Build 2024開發者大會上宣布了一個重要更新。據微軟CEO薩提亞·納德拉介紹,Azure AI Studio現已支持OpenAI開發的最新旗艦模型GPT-4o,并作為API提供。
    的頭像 發表于 05-22 11:45 ?845次閱讀

    GPT-4o更像“人”,AI“疾步”走向商業化應用

    )等。OpenAI的CEO奧特曼稱之為“人類級別的響應”。GPT-4o一出,各企業開始紛紛再度亮出“家伙什”了,微軟宣布投資40億歐元加碼AI領域、谷歌一夜發布十幾
    的頭像 發表于 05-22 08:04 ?497次閱讀
    <b class='flag-5'>GPT-4o</b>更像“人”,<b class='flag-5'>AI</b>“疾步”走向商業化應用

    OpenAI發布全新GPT-4o模型

    近日,OpenAI宣布推出全新的GPT-4o模型,標志著人工智能領域的一大技術飛躍。這款模型不僅具備強大的生成能力,還能精準理解用戶意圖,提供智能化的回答。
    的頭像 發表于 05-17 11:48 ?695次閱讀

    OpenAI正式推出GPT-4o模型,支持實時音頻、視覺和文本推理處理

    緊接著,OpenAI總裁暨聯合創始人Greg Brockman發布了詳細演示,展示了兩部搭載GPT-4o的設備如何實現語音或視頻交互。
    的頭像 發表于 05-15 10:26 ?585次閱讀

    OpenAI推出面向所有用戶的AI模型GPT-4o

    在周一的直播盛會上,OpenAI揭開了其最新的人工智能模型GPT-4o的神秘面紗。這款新模型旨在為其著名的聊天機器人ChatGPT提供更強大、更經濟的支持。GPT-4o是此前備受矚目的GPT-4模型的升級版,自推出以來已滿一年有
    的頭像 發表于 05-15 09:23 ?444次閱讀

    OpenAI全新GPT-4o能力!速度快/成本低,能讀懂人類情緒

    ”的意思。GPT-4o文本、推理、編碼能力達到GPT-4 Turbo水平,速度是上一代AI大模型GPT-4 Turbo的兩倍,但成本僅為GPT-4
    的頭像 發表于 05-15 00:15 ?7907次閱讀

    OpenAI發布GPT-4o模型,供全體用戶免費使用

    OpenAI首席技術官穆里·穆拉蒂(Muri Murati)指出,GPT-4o具備與GPT-4相同的智能水平,且在文本、圖像及語音處理方面有顯著進步。
    的頭像 發表于 05-14 11:17 ?573次閱讀
    百家乐的战术| 百家乐1个人| 百家乐官网走势图研究| 百家乐看大路| 豪门娱乐网| 大发888娱乐城官方网站| 百家乐透视牌靴哪里有| 百家乐玩法教材| 明溪百家乐官网的玩法技巧和规则| 摩纳哥百家乐官网娱乐城| 网上百家乐官网公式| 圣淘沙娱乐| 玉门市| bet365网站| 大发888老虎机下载免费| 电子百家乐作假| 百家乐庄闲庄庄闲| 澳门百家乐游戏官网| 深圳百家乐的玩法技巧和规则| 百家乐美国玩法| 百家乐网站那个诚信好| 大发888网站是多少| 大发888下载地址| 澳门玩大小| 叶城县| 太阳城百家乐官网赌博害人| 百家乐官网注册平台排名| 百家乐官网大眼仔路| 去澳门百家乐官网娱乐城| 金钱豹百家乐官网的玩法技巧和规则 | 百家乐怎样玩才会赢钱| 全讯网网址| 大发888娱乐场登陆| 兴文县| 百家乐官网博彩安全吗| 百家乐官网平注赢钱法| 粤港澳百家乐官网赌场娱乐网规则 | 莆田棋牌游戏| 网上最好赌博网站| 豪博百家乐官网娱乐城| 百家乐官网园是真的不|