吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

GPT-3通過了大部分課程的寫作測(cè)試

深度學(xué)習(xí)自然語言處理 ? 來源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2021-03-05 15:30 ? 次閱讀

GPT-3 寫的論文及格了嗎?教育資源網(wǎng)站 EduRef 對(duì)此進(jìn)行了一項(xiàng)測(cè)試,效果還行,及格水平。

2020 年 5 月,OpenAI 推出了具有 1750 億參數(shù)的史上最大 AI 模型 GPT-3,該模型不僅可以更好地答題、翻譯、寫文章,還帶有一些數(shù)學(xué)計(jì)算的能力。自推出以來,該模型就開始在不同的領(lǐng)域大顯身手,如基于問題的搜索引擎、與歷史人物對(duì)話、基于文本描述生成代碼以及繪圖和圖像補(bǔ)全等等。

但 GPT-3 的應(yīng)用之路遠(yuǎn)未結(jié)束…

近日,教育資源網(wǎng)站 EduRef 進(jìn)行了一項(xiàng)測(cè)試,他們找了一組教授創(chuàng)建了一個(gè)寫作提示,然后讓應(yīng)屆畢業(yè)生和本科生以及 GPT-3 同時(shí)根據(jù)該提示寫作,最后教授組對(duì)匿名提交的作文打分,并對(duì)作者進(jìn)行追蹤調(diào)查。那么,究竟結(jié)果如何呢?GPT-3 的分?jǐn)?shù)能夠超過人類作者嗎?未必!

GPT-3 通過了大部分課程的寫作測(cè)試

常言道:「評(píng)級(jí)為 C 就可以畢業(yè)(C’s get degrees)」。AI 遠(yuǎn)遠(yuǎn)達(dá)不到完美,GPT-3 的寫作水平大概相當(dāng)于自由寫作者(freelance writer)。

結(jié)果顯示,在 COVID-19 疫苗效力的研究方法論文寫作上,人類作者可以得到 B 或者 D,而 GPT-3 往往只能得到 C。在美國歷史類的測(cè)試中,人類作者可以在美國例外主義論文中得到 B 或者 C+,而 GPT-3 只能得到 B-。最后,在法學(xué)課上的政策函寫作中,GPT-3 得到了 B-,而 3 個(gè)學(xué)生中只有 1 個(gè)能夠得到高分。

下圖為人類作者與 GPT-3 在不同學(xué)科寫作中的得分情況:

由此可見,GPT-3 的寫作技能主要體現(xiàn)在技術(shù)類文檔中。在創(chuàng)意寫作課程中的地點(diǎn)記敘文(place narrative)寫作中,GPT-3 僅得到了 F,沒有通過測(cè)試。作為對(duì)比,自由寫作者得到了 A、B + 和 D+。盡管在創(chuàng)意寫作教授的眼中,GPT-3 失敗了,但自然語言生成(NLG)軟件依然可以用于編寫各類內(nèi)容,包括一部幾乎獲獎(jiǎng)的小說《The Day a Computer Writes a Novel》。先前的成功也預(yù)示著以后的失敗,GPT-3 或許只需要一些調(diào)整即可以成為一名合格的創(chuàng)意作家。總的來說,AI 幾乎通過了所有的課程寫作測(cè)試。

GPT-3 20 分鐘完成論文

雖然每個(gè)教授打分都不一樣,但該評(píng)分小組包括兩名博士和一名醫(yī)學(xué)碩士。他們總共有超過 55 年的高中和各種大學(xué)水平的教學(xué)經(jīng)驗(yàn)。寫作者包括應(yīng)屆畢業(yè)生和本科生,其中一些人在他們的研究領(lǐng)域?qū)懥颂崾尽F骄鶃碚f,他們需要 3 天時(shí)間完成任務(wù)。

對(duì)于絕大多數(shù)學(xué)生來說,3 天內(nèi)完成大學(xué)論文似乎是很難的事情,主要原因在于時(shí)間太短,但是 GPT-3 在 20 分鐘內(nèi)就完成了這個(gè)任務(wù)。GPT-3 利用深度學(xué)習(xí)產(chǎn)生類似人類的文本,每項(xiàng)任務(wù)花費(fèi) 3 到 20 分鐘完成,并且用最長的時(shí)間來編寫創(chuàng)造性的寫作敘述。為了避免人為干擾,GPT-3 只對(duì)輸出長度和重復(fù)文本進(jìn)行了輕微的編輯,其生成的內(nèi)容、真實(shí)信息和語法都沒有受到影響。

GPT-3 生成的美國歷史類作文示例如下:

GPT-3 可生成類似人類寫作的內(nèi)容

即使沒有人為干擾,GPT-3 的任務(wù)也或多或少地收到了與人類作者相同的反饋。49.2% 的評(píng)論涉及語法和句法,26.2% 的評(píng)論涉及重點(diǎn)和細(xì)節(jié),語氣與行文結(jié)構(gòu)等也被提及,但分別只有 12.3% 和 10.8%。這與人類作家收到的評(píng)論比例幾乎相同,近 50% 的評(píng)論與語法和句法有關(guān),25.4% 的評(píng)論與焦點(diǎn)和細(xì)節(jié)有關(guān)。超過 13% 的評(píng)論是關(guān)于人類專業(yè)知識(shí),而 10.4% 的評(píng)論是關(guān)于整體風(fēng)格等。

人類作者與 GPT-3 的寫作結(jié)果收到的評(píng)論反饋情況:

盡管收到了同樣風(fēng)格的評(píng)論,GPT-3 生成的內(nèi)容與人類作者并不那么相似。以排名靠前的兩個(gè)單詞組合為例,GPT-3 和人類作者只分享了排名靠前的組合:「of the」。「People who」、「it is」和「those who」常被 GPT-3 使用,而人類作者經(jīng)常使用的是「to the」、「in the」和「on the」。總體來說,這些單詞是在英語中經(jīng)常使用的,組合上的差異顯示出 AI 和人類在寫作結(jié)構(gòu)上的一些差異。

人類作者與 GPT-3 在寫作用詞上的差異分析:

考慮到 GPT-3 超高的論文得分,搭配統(tǒng)計(jì)數(shù)據(jù)的差異表明,人類作者比 AI 產(chǎn)生的獨(dú)特內(nèi)容明顯更多。

盡管 GPT-3 具有出色的產(chǎn)出,但其生成的論文在短期內(nèi)還無法獨(dú)立獲得大學(xué)學(xué)位。當(dāng)與人類作者競(jìng)爭(zhēng)時(shí),GPT-3 獲得了一些及格分?jǐn)?shù),但在創(chuàng)意寫作方面有所欠缺。盡管它在眾多領(lǐng)域的成功為 AI 的未來帶來了希望,但對(duì)大學(xué)教授來說,AI 依然存在不足。

責(zé)任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    31536

    瀏覽量

    270358
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3313

    瀏覽量

    49233

原文標(biāo)題:【GPT-3】除了缺少點(diǎn)創(chuàng)意,GPT-3寫出了及格的大學(xué)畢業(yè)論文,只需20分鐘

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    大部分的干擾問題都來自電源和地

    大部分的干擾問題都來自電源和地,分享一個(gè)很好的PDF文檔,文末附文檔獲取方式。 ?
    的頭像 發(fā)表于 01-15 17:37 ?237次閱讀
    <b class='flag-5'>大部分</b>的干擾問題都來自電源和地

    法官駁回大部分 GitHub Copilot 版權(quán)索賠要求

    在開發(fā)者對(duì) GitHub、微軟和 OpenAI 提起的版權(quán)訴訟中,法官駁回了大部分訴訟請(qǐng)求。
    的頭像 發(fā)表于 11-13 12:13 ?232次閱讀

    AGM32VF407的大部分IO可以隨意配置,這是這么做到的?

    AGM32VF407的大部分IO可以隨意配置,除了少數(shù)的專用引腳外,這是這么做到的?這里包括異構(gòu)的RISC-V內(nèi)核的外設(shè)哦。非常感興趣呢。
    發(fā)表于 10-31 19:07

    英偉達(dá)預(yù)測(cè)機(jī)器人領(lǐng)域或迎“GPT-3時(shí)刻”

    未來2-3年內(nèi),機(jī)器人基礎(chǔ)模型的研究將迎來重大突破,這一時(shí)刻被形象地比喻為機(jī)器人領(lǐng)域的“GPT-3時(shí)刻”。
    的頭像 發(fā)表于 09-20 17:05 ?856次閱讀

    Jim Fan展望:機(jī)器人領(lǐng)域即將迎來GPT-3式突破

    英偉達(dá)科學(xué)家9月19日,科技媒體The Decoder發(fā)布了一則引人關(guān)注的報(bào)道,英偉達(dá)高級(jí)科學(xué)家Jim Fan在近期預(yù)測(cè),機(jī)器人技術(shù)將在未來兩到三年內(nèi)迎來類似GPT-3在語言處理領(lǐng)域的革命性突破,他稱之為機(jī)器人領(lǐng)域的“GPT-3時(shí)刻”。
    的頭像 發(fā)表于 09-19 15:13 ?650次閱讀

    THS7001前級(jí)放大部分可以正常工作,后級(jí)PGA部分如何連接?

    我THS7001前級(jí)放大部分可以正常工作,但后級(jí)PGA部分不知道如何連接,那個(gè)CLAMP (H,L)不知道是什么意思,該如何連接? 我現(xiàn)在的連接方法原本是想按G2 G1 G0= 110 指令放大的。結(jié)果PGA輸出為0,求解!!謝謝!!!
    發(fā)表于 09-19 06:20

    傳感器的基本組成包括哪兩大部分

    傳感器是一種將物理量或化學(xué)量轉(zhuǎn)換為電信號(hào)的裝置,廣泛應(yīng)用于工業(yè)、農(nóng)業(yè)、醫(yī)療、環(huán)保等領(lǐng)域。傳感器的基本組成包括兩大部分:敏感元件和轉(zhuǎn)換元件。 一、敏感元件 敏感元件是傳感器的核心部分,它能夠感知被測(cè)量
    的頭像 發(fā)表于 08-19 09:47 ?1653次閱讀

    使用 GPT4V+AI Agent 做自動(dòng) UI 測(cè)試的探索

    的工具,但是這些工具的投入產(chǎn)出比一直被質(zhì)疑,自動(dòng)化率越多維護(hù)成本越高,大部分都做著就放棄了,還有一部分在做與不做間糾結(jié)。 本文結(jié)合一些開源的項(xiàng)目探索使用GPT 自動(dòng)做 UI 測(cè)試的可能
    的頭像 發(fā)表于 06-20 15:42 ?555次閱讀
    使用 <b class='flag-5'>GPT</b>4V+AI Agent 做自動(dòng) UI <b class='flag-5'>測(cè)試</b>的探索

    微軟將在法國投資40億歐元,大部分集中在AI領(lǐng)域

    微軟總裁布拉德·史密斯近日宣布了公司的重大投資計(jì)劃。微軟將在法國投資高達(dá)40億歐元,其中絕大部分資金將注入人工智能領(lǐng)域的發(fā)展。作為投資的一部分,微軟計(jì)劃在法國東北部的米盧斯市建設(shè)一座數(shù)據(jù)中心,以加強(qiáng)其在該地區(qū)的技術(shù)布局。
    的頭像 發(fā)表于 05-14 09:24 ?380次閱讀

    模擬電路仿真軟件包含大部分芯片嗎

    領(lǐng)域扮演著非常重要的角色。 從功能上來講,模擬電路仿真軟件應(yīng)該包含大部分芯片,也就是能夠仿真電路中常用的芯片。這些芯片包括微處理器、運(yùn)算放大器、模數(shù)轉(zhuǎn)換器、數(shù)模轉(zhuǎn)換器、時(shí)鐘電路、存儲(chǔ)器、可編程邏輯器件等等。
    的頭像 發(fā)表于 04-21 10:54 ?1240次閱讀

    小松電動(dòng)化工程機(jī)械系列7種機(jī)型全部通過了GX首次認(rèn)證

    日本國土交通省于2023年10月新設(shè)立了GX (Green Transformation,綠色轉(zhuǎn)型) 工程機(jī)械認(rèn)證制度,小松的電動(dòng)化工程機(jī)械系列的7種機(jī)型全部通過了該制度的首次認(rèn)證。
    的頭像 發(fā)表于 03-29 11:38 ?932次閱讀

    過壓斬波電路有哪三大部分組成

    過壓斬波電路是一種用于保護(hù)電子設(shè)備免受過電壓損害的電路。它主要由三大部分組成,包括過壓檢測(cè)電路、觸發(fā)控制電路和繼電器控制電路。 第一部分:過壓檢測(cè)電路 過壓檢測(cè)電路是過壓斬波電路的核心部分,它負(fù)責(zé)
    的頭像 發(fā)表于 03-21 17:24 ?793次閱讀

    能用stm32h7為主做絕大部分的功能實(shí)現(xiàn),用stm32f1為輔實(shí)現(xiàn)一個(gè)小功能嗎?

    請(qǐng)問能用stm32h7為主做絕大部分的功能實(shí)現(xiàn),用stm32f1為輔實(shí)現(xiàn)一個(gè)小功能嗎?
    發(fā)表于 03-20 07:09

    瞻芯電子開發(fā)的3款第二代650V SiC MOSFET通過了車規(guī)級(jí)可靠性認(rèn)證

    3月8日,瞻芯電子開發(fā)的3款第二代650V SiC MOSFET產(chǎn)品通過了嚴(yán)格的車規(guī)級(jí)可靠性認(rèn)證(AEC-Q101 Qualified)。
    的頭像 發(fā)表于 03-11 09:24 ?854次閱讀
    瞻芯電子開發(fā)的<b class='flag-5'>3</b>款第二代650V SiC MOSFET<b class='flag-5'>通過了</b>車規(guī)級(jí)可靠性認(rèn)證

    OpenAI推出ChatGPT新功能:朗讀,支持37種語言,兼容GPT-4和GPT-3

    據(jù)悉,“朗讀”功能支持37種語言,且能夠自主識(shí)別文本類型并對(duì)應(yīng)相應(yīng)的發(fā)音。值得關(guān)注的是,該功能對(duì)GPT-4以及GPT-3.5版本的ChatGPT均適用。此舉彰顯了OpenAI致力于“多模態(tài)交互”(multimodal capabilities)的方向
    的頭像 發(fā)表于 03-05 15:48 ?1008次閱讀
    大富翁娱乐城| 申博太阳城娱乐城| 百家乐官网游戏大厅下| 德州扑克概率表| 百家乐游戏论坛| 百家乐官网视频看不到| 缅甸百家乐赌| KK百家乐官网娱乐城 | 澳门百家乐娱乐平台| 买百家乐官网程序| 德州扑克的规则| 澳门百家乐群官网| 百家乐官网技论坛| 明升国际网| 保险百家乐怎么玩| 百家乐官网时时彩网站| 德州扑克书籍| 百家乐赌场玩法技巧| 真人百家乐官网对决| 在线百家乐投注| 网上百家乐公司| 百家乐官网群| 百家乐官网在线投注顺势法| 赌博百家乐赢不了| 百家乐官网赌博规律| 现金百家乐游戏| 百家乐网络赌场| 百家乐官网娱乐城体验金| 百家乐官网的路单怎样看| 六合彩官网| 百家乐备用网址| 百家乐类游戏平台| 百家乐官网智能软件| 顺平县| 大发888公司赌场| 百家乐赌场视屏| 百家乐官网平注法规则| 百家乐官网玩法开户彩公司| 蒙特卡罗网上娱乐| 水果机技巧规律| 沙龙百家乐娱乐城|