吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

OpenAI重磅推出語言模型DALL·E和圖像識別系統CLIP

454398 ? 來源:控制工程網 ? 作者:控制工程網 ? 2021-01-15 11:27 ? 次閱讀

人工智能AI)研究組織OpenAI重磅推出了最新的語言模型DALL·E和圖像識別系統CLIP。

這兩個模型是OpenAI第三代語言生成器的一個分支。兩種神經網絡都旨在生成能夠理解圖像和相關文本的模型。OpenAI希望這些升級后的語言模型能夠以接近人類解釋世界的方式來解讀圖像。

2020年5月,OpenAI發布了迄今為止全球規模最大的預訓練語言模型GPT-3。GPT-3具有1750億參數,訓練所用的數據量達到45TB。對于所有任務,應用GPT-3無需進行任何梯度更新或微調,僅需要與模型文本交互為其指定任務和展示少量演示即可使其完成任務。

GPT-3在許多自然語言處理數據集上均具有出色的性能,包括翻譯、問答和文本填空任務,還包括一些需要即時推理或領域適應的任務等,已在很多實際任務上大幅接近人類水平。

新發布的語言模型DALL·E,是GPT-3的120億參數版本,可以按照自然語言文字描述直接生成對應圖片!

這個新系統的名稱DALL·E,來源于藝術家薩爾瓦多·達利(Salvador Dali)和皮克斯的機器人英雄瓦力(WALL-E)的結合。新系統展示了“為一系列廣泛的概念”創造圖像的能力,可從文字標題直接創建圖像以表達概念。通過從文本描述而不是標簽數據生成圖像,可以為模型提供了更多有關含義的上下文。

開發人員將DALL·E稱為“轉換語言模型”(transformer language model),能夠將文本和圖像作為單個數據流接收。這種訓練程序使得DALL·E不僅可以從零開始生成圖像,而且還可以重新生成現有圖像的任何矩形區域……。以一種與文本提示一致的方式。

這種語言模型能夠反映人類語言的微妙之處,包括 “將不同的想法結合起來合成物體的能力”。例如,在DALL·E模型中輸入“牛油果形狀的扶手椅”,它就可以生成這樣的圖片:

DALL·E還擴展了被稱為“零樣本推理”(zero-shotreasoning)的GPT-3功能,這是一種強大的常識性機器學習形式。DALL·E將這一功能擴展到了視覺領域,并且在以正確的方式提示時能夠執行多種圖像到圖像的翻譯任務。

圖像識別系統CLIP的通用性比當前針對單個任務的系統更好,可以用網上公開的文字圖像配對數據集來訓練。CLIP系統可用于對比語言-圖像預訓練,通過從網絡圖像中收集的自然語言監督學習視覺概念。OpenAI表示CLIP的工作方式是提供要識別的視覺類別的名稱。

當將其應用于圖像分類基準時,可以指示模型執行一系列基準,而無需針對每個測試進行優化。OpenAI表示:“通過不直接針對基準進行優化,我們證明它變得更具代表性。” CLIP方法可將“穩健性差距”縮小多達75%。

OpenAI 聯合創始人、首席科學家 Ilya Sutskever認為,人工智能的長期目標是構建多模態神經網絡,即AI能夠學習不同模態之間的概念(文本和視覺領域為主),從而更好地理解世界,而 DALL·E 和 CLIP 使我們更接近“多模態 AI 系統”這一目標。

未來,我們將擁有同時理解文本和圖像的模型。人工智能將能夠更好地理解語言,因為它可以看到單詞和句子的含義。
編輯:hfy

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 神經網絡
    +關注

    關注

    42

    文章

    4781

    瀏覽量

    101177
  • 圖像識別
    +關注

    關注

    9

    文章

    521

    瀏覽量

    38389
  • 人工智能
    +關注

    關注

    1796

    文章

    47683

    瀏覽量

    240311
  • Clip
    +關注

    關注

    0

    文章

    31

    瀏覽量

    6716
  • OpenAI
    +關注

    關注

    9

    文章

    1140

    瀏覽量

    6707
收藏 人收藏

    評論

    相關推薦

    AI圖像識別攝像機

    ?AI圖像識別攝像機是一種集成了先進算法和深度學習模型的智能監控設備。這些攝像機不僅能夠捕捉視頻畫面,還能實時分析和處理所拍攝的內容,從而實現對特定對象、場景或行
    的頭像 發表于 11-08 10:38 ?357次閱讀
    AI<b class='flag-5'>圖像識別</b>攝像機

    AI大模型圖像識別中的優勢

    AI大模型圖像識別中展現出了顯著的優勢,這些優勢主要源于其強大的計算能力、深度學習算法以及大規模的數據處理能力。以下是對AI大模型圖像識別中優勢的介紹: 一、高效性與準確性 處理速
    的頭像 發表于 10-23 15:01 ?1019次閱讀

    圖像檢測和圖像識別的原理、方法及應用場景

    圖像檢測和圖像識別是計算機視覺領域的兩個重要概念,它們在許多應用場景中發揮著關鍵作用。 1. 定義 1.1 圖像檢測 圖像檢測(Object Detection)是指在
    的頭像 發表于 07-16 11:19 ?4919次閱讀

    圖像識別算法都有哪些方法

    圖像識別算法是計算機視覺領域的核心任務之一,它涉及到從圖像中提取特征并進行分類、識別和分析的過程。隨著深度學習技術的不斷發展,圖像識別算法已經取得了顯著的進展。本文將介紹
    的頭像 發表于 07-16 11:14 ?6067次閱讀

    圖像識別算法的提升有哪些

    方法。 數據增強 數據增強是提高圖像識別算法性能的一種有效方法。通過對訓練數據進行變換和擴展,可以增加數據的多樣性,提高模型的泛化能力。常見的數據增強方法包括: 2.1 旋轉、縮放、平移和翻轉 通過對圖像進行旋轉、縮放
    的頭像 發表于 07-16 11:12 ?746次閱讀

    圖像識別算法的優缺點有哪些

    圖像識別算法是一種利用計算機視覺技術對圖像進行分析和理解的方法,它在許多領域都有廣泛的應用,如自動駕駛、醫療診斷、安全監控等。然而,圖像識別算法也存在一些優缺點。 一、圖像識別算法的優
    的頭像 發表于 07-16 11:09 ?1907次閱讀

    圖像識別算法的核心技術是什么

    圖像識別算法是計算機視覺領域的一個重要研究方向,其目標是使計算機能夠像人類一樣理解和識別圖像中的內容。圖像識別算法的核心技術包括以下幾個方面: 特征提取 特征提取是
    的頭像 發表于 07-16 11:02 ?744次閱讀

    圖像識別技術包括自然語言處理嗎

    計算機視覺技術對圖像進行處理、分析和理解,從而實現對圖像中的目標、場景、行為等信息的識別和理解。圖像識別技術包括圖像預處理、特征提取、分類器
    的頭像 發表于 07-16 10:54 ?946次閱讀

    圖像識別技術的原理是什么

    圖像識別技術是一種利用計算機視覺和機器學習技術對圖像進行分析和理解的技術。它可以幫助計算機識別和理解圖像中的對象、場景和活動。 圖像預處理
    的頭像 發表于 07-16 10:46 ?1417次閱讀

    圖像識別屬于人工智能嗎

    屬于。圖像識別是人工智能(Artificial Intelligence, AI)領域的一個重要分支。 一、圖像識別概述 1.1 定義 圖像識別是指利用計算機技術對圖像中的內容進行分析
    的頭像 發表于 07-16 10:44 ?1330次閱讀

    如何利用CNN實現圖像識別

    卷積神經網絡(CNN)是深度學習領域中一種特別適用于圖像識別任務的神經網絡結構。它通過模擬人類視覺系統的處理方式,利用卷積、池化等操作,自動提取圖像中的特征,進而實現高效的圖像識別。本
    的頭像 發表于 07-03 16:16 ?1523次閱讀

    卷積神經網絡在圖像識別中的應用

    卷積神經網絡(Convolutional Neural Networks, CNNs)是一種深度學習模型,廣泛應用于圖像識別、視頻分析、自然語言處理等領域。 1. 卷積神經網絡的基本原理 1.1
    的頭像 發表于 07-02 14:28 ?1297次閱讀

    愛芯元智推出邊端側智能SoCAX650N,讓視覺更智能

    當前大模型蓬勃發展,OpenAI的Sora、ChatGPT、CLIPDALL-E,Google的Gemini、ViT-22B,Meta的LLaMA3、DINO v2,
    的頭像 發表于 05-09 14:39 ?1834次閱讀
    愛芯元智<b class='flag-5'>推出</b>邊端側智能SoCAX650N,讓視覺更智能

    OpenAI推出專用的AI檢測工具

    OpenAI最近推出了一款全新的AI檢測工具,這款工具專門針對由DALL·E 3模型生成的圖片。令人印象深刻的是,該工具能夠精準
    的頭像 發表于 05-09 10:01 ?566次閱讀

    OpenAI發布圖像檢測分類器,可區分AI生成圖像與實拍照片

    OpenAI介紹,初步測試結果表明,該分類器在辨別非AI生成圖像DALL·E 3生成圖像時,成功率高達近98%,僅有不到0.5%的非AI
    的頭像 發表于 05-09 09:57 ?522次閱讀
    大发888娱乐城rfgjdf888bg| 喀喇沁旗| 百家乐官网大路小路三珠路| 金城百家乐买卖路| 威尼斯人娱乐城| 芝加哥百家乐官网的玩法技巧和规则| 豪享博百家乐的玩法技巧和规则| 本溪市| 成都南偏西24度风水| 大发888娱乐场下载zhidu| 大发888官方ylc8| 单机百家乐官网破解方法| 免费百家乐过滤| 澳门百家乐官网有赢钱的吗| 金博士百家乐娱乐城 | 百家乐官网b28博你| 百家乐规则以及玩法| 百家乐官网投注网址| 乐天堂百家乐赌场娱乐网规则| 百家乐官网注册送免费金| 百家乐象棋赌博| 温州市| 最好的百家乐博彩公司| 百家乐官网路纸表格| 百家乐玩法教学视频| 中金时时彩平台| 百家乐平台有什么优势| 8大胜| 百家乐里面的奥妙| 威信县| k7百家乐最小投注| 百家乐官网园会员注册| 巨星百家乐的玩法技巧和规则 | 24山在风水中的作用| 尊龙国际| 百家乐注册优惠平台| 百家乐官网娱乐城赌场| 百家乐太阳城开户| 百家乐官网娱乐城代理| 威尼斯人娱乐城信誉好吗| 吉利百家乐官网的玩法技巧和规则 |