吴忠躺衫网络科技有限公司

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NLP、知識(shí)圖譜是人工智能下一個(gè)發(fā)展方向

WpOh_rgznai100 ? 來(lái)源:YXQ ? 2019-07-31 15:00 ? 次閱讀

最近,很多人邀請(qǐng)我回答下面的這些問(wèn)題:“人工智能能否取代人類(lèi)?”“十年內(nèi),人類(lèi)是否能制造出賈維斯那樣的AI?”“人工智能什么時(shí)候才會(huì)擁有自我意識(shí)?”

為什么大家對(duì)這類(lèi)問(wèn)題如此感興趣?這可能要追溯到2016年,AI真正進(jìn)入到大眾視野并引爆媒體的標(biāo)志性事件,也就是AlphaGo戰(zhàn)勝?lài)宓氖澜绻谲?李世石。在之后,我們看到一個(gè)又一個(gè)AI技術(shù)的突破,以及不斷被刷新的媒體頭條,好像AI取代人類(lèi)是完全可能而且理所應(yīng)當(dāng)?shù)氖虑椤?/p>

我們看到波士頓動(dòng)力的機(jī)器人行云流水般的后空翻,看到索菲亞在各大場(chǎng)合欺騙人類(lèi)感情,看到Dota2、星際爭(zhēng)霸等游戲被AI攻破,也看到IBM的辯論機(jī)器人和人類(lèi)旗鼓相當(dāng)?shù)慕讳h,在2019年7月份《Science》發(fā)表的研究成果中,一個(gè)名為Pluribus的算法僅僅通過(guò)自我博弈,就在多人無(wú)限注***中戰(zhàn)勝了人類(lèi)專(zhuān)業(yè)選手[1]。人工智能在這第三輪的熱潮中,通過(guò)大數(shù)據(jù)和深度學(xué)習(xí),創(chuàng)造了一項(xiàng)又一項(xiàng)歷史,也吊足了普羅大眾的胃口。

人工智能從1956年被提出至今,經(jīng)歷了三次大的熱潮。20世紀(jì)50年代中期到80年代初期的感知器,20世紀(jì)80年代初期至21 世紀(jì)初期的專(zhuān)家系統(tǒng),以及最近十年的深度學(xué)習(xí)技術(shù),分別是三次熱潮的代表性產(chǎn)物。

為了回答這些問(wèn)題,我拋出了一張2018年Gartner技術(shù)曲線,解釋目前人工智能的進(jìn)展。如圖1所示。

圖1 Gartner2018技術(shù)成熟度曲線

Gartner每年發(fā)布的技術(shù)趨勢(shì)曲線,聚焦未來(lái)5到10年間,可能產(chǎn)生巨大競(jìng)爭(zhēng)力的新興技術(shù)。在圖中我們可以看到,深度學(xué)習(xí)(Deep Learning)已經(jīng)走到高原期(Peak of Inflated Expectations),而知識(shí)圖譜(Knowledge Graph)還是在起步階段(Innovation Trigger),更不用說(shuō)腦機(jī)接口(Brain-Computer Interface)、通用人工智能(Artificial General Intelligence)這些技術(shù),在圖中的標(biāo)記還是黃色三角,也就是起碼10年會(huì)后才能到達(dá)高原期。

人工智能技術(shù)遠(yuǎn)未達(dá)到媒體所宣傳的神通廣大,無(wú)所不能。從圖1中的技術(shù)發(fā)展現(xiàn)狀也可一窺端倪。AlphaGo可以戰(zhàn)勝最好的人類(lèi)棋手,但卻不可能為你端一杯水。著名機(jī)器人學(xué)者Hans Moravec早前說(shuō)過(guò):機(jī)器人覺(jué)得容易的,對(duì)于人類(lèi)來(lái)講將是非常難的;反之亦然。

人可以輕松做到聽(tīng)說(shuō)讀寫(xiě),但對(duì)于復(fù)雜計(jì)算很吃力;而機(jī)器人很難輕松做到用手抓取物體、以及走上坡路,但可以輕而易舉地算出空間火箭的運(yùn)行軌道。人類(lèi)可以通過(guò)日積月累的學(xué)習(xí),輕松完成各種動(dòng)作,但對(duì)于機(jī)器人來(lái)講完成這些簡(jiǎn)單的動(dòng)作難如登天。專(zhuān)家們稱(chēng)此理論為“莫拉維克悖論”(Moravec'sParadox)。機(jī)器學(xué)習(xí)專(zhuān)家、著名的計(jì)算機(jī)科學(xué)和統(tǒng)計(jì)學(xué)家 Michael I. Jordan近日在《哈佛數(shù)據(jù)科學(xué)評(píng)論》上發(fā)表文章,也認(rèn)為現(xiàn)在被稱(chēng)為AI的許多領(lǐng)域,實(shí)際上是機(jī)器學(xué)習(xí),而真正的 AI 革命尚未到來(lái)。

在目前,即使是最先進(jìn)的AI智能體,在適應(yīng)環(huán)境變化的能力方面,也無(wú)法與動(dòng)物相提并論。近期,英國(guó)帝國(guó)理工學(xué)院和劍橋大學(xué)研究人員共同組織了一場(chǎng)特別的AI競(jìng)賽,希望把動(dòng)物能夠完成的“覓食任務(wù)”交給AI智能體來(lái)完成,讓AI和動(dòng)物世界來(lái)一場(chǎng)虛擬比賽。我們也期待著這項(xiàng)比賽的結(jié)果。

因此,人工智能,任重而道遠(yuǎn)。

二、從感知智能到認(rèn)知智能

業(yè)界一致認(rèn)為,AI的三要素是算法,算力和數(shù)據(jù)。近十年來(lái),人工智能的技術(shù)突破,很大程度上是得益于大數(shù)據(jù)以及大規(guī)模運(yùn)算能力的提升,真正讓深度學(xué)習(xí)這項(xiàng)“老”技術(shù)煥發(fā)了新生,突破了一項(xiàng)又一項(xiàng)感知能力。追溯到2006年,Geoffrey Hinton和他的學(xué)生在《Science》上提出基于深度信念網(wǎng)絡(luò)(Deep Belief Networks, DBN)可使用非監(jiān)督學(xué)習(xí)的訓(xùn)練算法;隨后2012年深度神經(jīng)網(wǎng)絡(luò)技術(shù)在ImageNet評(píng)測(cè)中取得了突破性進(jìn)展,人工智能進(jìn)入到新的熱潮,圍繞語(yǔ)音、圖像、機(jī)器人、自動(dòng)駕駛的技術(shù)大量涌現(xiàn),也出現(xiàn)了很多里程碑水平的技術(shù)。

2017年8月20日,微軟語(yǔ)音和對(duì)話研究團(tuán)隊(duì)負(fù)責(zé)人黃學(xué)東宣布微軟語(yǔ)音識(shí)別系統(tǒng)取得重大突破,錯(cuò)誤率由之前的5.9%降低到5.1%,可與專(zhuān)業(yè)速記員比肩[2];Google在2015年提出的深度學(xué)習(xí)算法,已經(jīng)在ImageNet2012分類(lèi)數(shù)據(jù)集中將錯(cuò)誤率降低到4.94%,首次超越了人眼識(shí)別的錯(cuò)誤率(約5.1%)[3];DeepMind公司在2017年6月發(fā)布了當(dāng)時(shí)世界上文本到語(yǔ)音環(huán)節(jié)最好的生成模型WaveNet語(yǔ)音合成系統(tǒng);由斯坦福大學(xué)發(fā)起的SQuAD(Stanford Question Answering Dataset)閱讀理解競(jìng)賽,截至2019年7月,使用BERT的集成系統(tǒng)暫列第一,其F1分值達(dá)到89.474,超越了人類(lèi)水平。

從計(jì)算,到感知,再到認(rèn)知,是大多數(shù)人都認(rèn)同的人工智能技術(shù)發(fā)展路徑。那么認(rèn)知智能的發(fā)展現(xiàn)狀如何?

首先,讓我們看一下什么是認(rèn)知智能。復(fù)旦大學(xué)肖仰華教授曾經(jīng)提到,所謂讓機(jī)器具備認(rèn)知智能是指讓機(jī)器能夠像人一樣思考,而這種思考能力具體體現(xiàn)在機(jī)器能夠理解數(shù)據(jù)、理解語(yǔ)言進(jìn)而理解現(xiàn)實(shí)世界的能力,體現(xiàn)在機(jī)器能夠解釋數(shù)據(jù)、解釋過(guò)程進(jìn)而解釋現(xiàn)象的能力,體現(xiàn)在推理、規(guī)劃等等一系列人類(lèi)所獨(dú)有的認(rèn)知能力上。

也就是說(shuō),認(rèn)知智能需要去解決推理、規(guī)劃、聯(lián)想、創(chuàng)作等復(fù)雜任務(wù)。我們可以大膽想象,如果機(jī)器人具備了認(rèn)知智能,那么我們周?chē)蜁?huì)出現(xiàn)很多電影里才能看到的智能機(jī)器,比如說(shuō)《銀翼殺手2049》里的喬伊,《她》中的薩曼莎,以及《超能查派》里的機(jī)器人查派,這些智能機(jī)器會(huì)有意識(shí),有情感,并且有自己的善惡觀。

人類(lèi)總是想當(dāng)造物主,讓機(jī)器擁有認(rèn)知智能,其實(shí)在一定程度上是希望模仿生命本身,尤其是人類(lèi)的各種能力。在維基百科給出的定義中,生命泛指一類(lèi)具有穩(wěn)定的物質(zhì)和能量代謝現(xiàn)象并且能回應(yīng)刺激、能進(jìn)行自我復(fù)制(繁殖)的半開(kāi)放物質(zhì)系統(tǒng)。

簡(jiǎn)單來(lái)說(shuō),也就是有生命機(jī)制的物體,是存在一定的自我生長(zhǎng)、繁衍、感覺(jué)、意識(shí)、意志、進(jìn)化、互動(dòng)等豐富可能的一類(lèi)現(xiàn)象。科學(xué)家從來(lái)沒(méi)有停止對(duì)生命的再造和探索,也就自然而然產(chǎn)生了“人工生命”(Artificial Life)的概念。人工生命可以分為兩個(gè)方面,一是人造生命,特指利用基因工程技術(shù)創(chuàng)造的人工改造生物。另一方面則是本文所要探討的虛擬生命(Virtual Life),特指利用人工智能創(chuàng)造的虛擬生命系統(tǒng)。(注:本文只討論軟件層面上的認(rèn)知智能,因此不涉及對(duì)控制論、機(jī)器人硬件的討論。)

三、創(chuàng)造具有認(rèn)知智能的虛擬生命

一個(gè)具備認(rèn)知智能的虛擬生命,不僅僅可以和人類(lèi)進(jìn)行多模態(tài)交互,還需要有具有生命感的表達(dá)能力。圖2給出了虛擬生命的基本能力范疇。對(duì)于看、聽(tīng)、說(shuō)、動(dòng)作而言,感知智能已經(jīng)可以達(dá)到非常好的效果。而對(duì)于推理、情感、聯(lián)想等能力,還需要更強(qiáng)的認(rèn)知能力的體現(xiàn)。

圖2 虛擬生命基本能力范疇

那么問(wèn)題來(lái)了,在現(xiàn)有技術(shù)條件下,是否能實(shí)現(xiàn)虛擬生命的認(rèn)知能力?這也就是文章開(kāi)頭提到的問(wèn)題的關(guān)注點(diǎn)。微軟亞洲研究院宋睿華老師(微軟小冰首席科學(xué)家)曾經(jīng)說(shuō)過(guò)一個(gè)故事,她在和母親聊天的時(shí)候,問(wèn)“如果機(jī)器人可以打敗人類(lèi)最頂尖的棋手,厲不厲害?”,母親回答說(shuō)“很厲害“。她再問(wèn)母親”如果我們做出一個(gè)機(jī)器人,可以和人聊天,厲不厲害?“,母親回答說(shuō)”不厲害“。宋老師就問(wèn)為什么,母親的回復(fù)是”因?yàn)椴皇敲總€(gè)人都會(huì)下棋,但每個(gè)人都會(huì)說(shuō)話啊“。這個(gè)故事其實(shí)告訴我們,讓機(jī)器人說(shuō)話,雖然技術(shù)上非常復(fù)雜,但離人類(lèi)的期望值還相差甚遠(yuǎn)。

即便是機(jī)器人可以聊天,那是不是就可以說(shuō)其擁有了認(rèn)知智能?答案仍然是否定的。會(huì)說(shuō)話的機(jī)器很多,不僅僅是聊天機(jī)器人,智能客服,甚至是推銷(xiāo)電話都可以做到以假亂真的程度。谷歌在2018年開(kāi)發(fā)者大會(huì)上演示了一個(gè)預(yù)約理發(fā)店的聊天機(jī)器人,語(yǔ)氣惟妙惟肖,表現(xiàn)相當(dāng)令人驚艷。相信很多讀者都接到過(guò)人工智能的推銷(xiāo)電話,不去仔細(xì)分辨的話,根本不知道電話那頭只是個(gè)AI程序。破解方法其實(shí)也很簡(jiǎn)單,問(wèn)機(jī)器人一句“今天天氣挺好的,你覺(jué)得呢”,相信很多推銷(xiāo)電話就無(wú)法回答了。

這是因?yàn)樵谔囟▓?chǎng)景下,對(duì)話可以跳轉(zhuǎn)的狀態(tài)一般都是有限的,可能產(chǎn)生的話題分支,比起圍棋的可能性要少很多,因此,即便是窮舉所有的可能性,也不是不可做到的事情。如果提前設(shè)置好對(duì)話策略,加上語(yǔ)音合成技術(shù),完全可以以假亂真,但一旦在開(kāi)放域進(jìn)行閑聊,對(duì)話的可能性幾乎是無(wú)限的,場(chǎng)景對(duì)話技術(shù)也就無(wú)能為力了。

所以,要想真正實(shí)現(xiàn)具備認(rèn)知智能的虛擬生命,還需要很多的技術(shù)突破,尤其是目前還不能夠?qū)θ祟?lèi)的思維能力做到真正的理解,所以機(jī)器人就好比綠野仙蹤中的鐵皮人,還缺乏帶有靈魂和感情的那顆心。因此,受限于目前的技術(shù)能力,虛擬生命不可能一蹴而就,而是要分步驟不斷的突破技術(shù)難題。圖3給出了虛擬生命不同發(fā)展階段。

圖3 虛擬生命發(fā)展階段

虛擬生命1.0,可以看做是聊天機(jī)器人的升級(jí)版本本階段最重要的特點(diǎn)是單點(diǎn)技術(shù)的整合,并能作為整體和人類(lèi)進(jìn)行交互。從功能上來(lái)看,仍然是被動(dòng)交互為主,但可以結(jié)合對(duì)用戶(hù)的認(rèn)知,進(jìn)行用戶(hù)畫(huà)像和主動(dòng)推薦

我們目前正在處于虛擬生命的1.0階段。在這個(gè)階段,多輪對(duì)話、開(kāi)放域?qū)υ挕⑸舷挛睦斫狻€(gè)性化問(wèn)答、一致性和安全回復(fù)等仍然是亟待解決的技術(shù)難題。同時(shí),虛擬生命也需要找到可落地的場(chǎng)景,做好特定領(lǐng)域的技術(shù)突破。

虛擬生命2.0,是目前正在努力前行的方向,在這個(gè)階段,多模態(tài)技術(shù)整合已完全成熟,虛擬生命形態(tài)更為多樣性,具備基于海量數(shù)據(jù)的聯(lián)合推理及聯(lián)想,對(duì)自我和用戶(hù)都有了全面的認(rèn)知,并可快速進(jìn)行人格定制。實(shí)現(xiàn)這個(gè)階段可能需要3-5年。

虛擬生命3.0, 初步達(dá)到強(qiáng)人工智能,具備超越人類(lèi)的綜合感知能力,并擁有全面的推理、聯(lián)想和認(rèn)知,具備自我意識(shí),并能達(dá)到人類(lèi)水平的自然交互。隨著技術(shù)的進(jìn)步,我們期待在未來(lái)十年至三十年實(shí)現(xiàn)虛擬生命的3.0。

本文后面的章節(jié),就從虛擬生命1.0,也就是聊天機(jī)器人的角度,來(lái)闡述目前自然語(yǔ)言處理和知識(shí)圖譜的技術(shù)落地,以及如何實(shí)現(xiàn)基本的機(jī)器人認(rèn)知能力。

這兩年,聊天機(jī)器人領(lǐng)域異常火熱,原因在于我們目前所處的時(shí)代需要一個(gè)語(yǔ)音交互入口。從上世紀(jì)80年代至今,我們已經(jīng)經(jīng)歷了四個(gè)技術(shù)時(shí)代,分別是PC時(shí)代,互聯(lián)網(wǎng)時(shí)代,移動(dòng)互聯(lián)網(wǎng)時(shí)代和現(xiàn)在的AI時(shí)代。每一個(gè)時(shí)代均涌現(xiàn)了大量的科技成果,也出現(xiàn)了劃時(shí)代的產(chǎn)品和偉大的公司。

其中,在PC時(shí)代,運(yùn)算力改變了人類(lèi)的生活,個(gè)人電腦和windows操作系統(tǒng),成就了微軟和IBM兩個(gè)軟件和硬件的巨頭。在互聯(lián)網(wǎng)時(shí)代,連接顛覆一切,人們可以通過(guò)網(wǎng)絡(luò)隨時(shí)隨地進(jìn)行信息交互,互聯(lián)網(wǎng)和搜索引擎造就了谷歌;在移動(dòng)互聯(lián)網(wǎng)時(shí)代,技術(shù)帶來(lái)了兩大變革,一是數(shù)據(jù)利用效率的提升,導(dǎo)致服務(wù)發(fā)生了變化,人們可以隨時(shí)隨地享受即時(shí)服務(wù),二是交互方式的改變,智能手機(jī)成為了主要的入口級(jí)設(shè)備,最具有代表性的公司就是蘋(píng)果。

當(dāng)人們跨越到AI時(shí)代,微軟又提出對(duì)話即平臺(tái)(Conversation As A Platform)的理念,認(rèn)為語(yǔ)音交互是這個(gè)時(shí)代的入口,隨著硬件和軟件的成熟,人們可以采用最自然的交互方式-語(yǔ)音,和機(jī)器進(jìn)行流暢對(duì)話,完成各種服務(wù)。也正是在這種背景之下,聊天機(jī)器人開(kāi)始作為入口級(jí)產(chǎn)品而大量涌現(xiàn)。而打造聊天機(jī)器人產(chǎn)品,不僅需要計(jì)算機(jī)視覺(jué)、聲學(xué)等技術(shù),更進(jìn)一步需要自然語(yǔ)言處理及知識(shí)圖譜技術(shù)。

四、自然語(yǔ)言處理

語(yǔ)言是主要以發(fā)聲為基礎(chǔ)來(lái)傳遞信息的符號(hào)系統(tǒng),是人類(lèi)重要的交際工具和存在方式之一。作用于人與人的關(guān)系時(shí),是表達(dá)相互反應(yīng)的中介;作用于人和客觀世界的關(guān)系時(shí),是認(rèn)識(shí)事物的工具;作用于文化時(shí),是文化信息的載體(來(lái)源:維基百科)。語(yǔ)言與邏輯相關(guān),而人類(lèi)的思維邏輯最為完善。

1957年喬姆斯基的第一部專(zhuān)著《句法結(jié)構(gòu)》出版,提出了基于普遍語(yǔ)法的理論核心,認(rèn)為人腦有一種先天的特定結(jié)構(gòu)或?qū)傩裕凑Z(yǔ)言習(xí)得機(jī)制,它是人類(lèi)學(xué)會(huì)使用語(yǔ)言的內(nèi)因。而埃弗雷特通過(guò)研究皮拉罕的部落之后,認(rèn)為是文化而不是遺傳決定了語(yǔ)言,并否認(rèn)了喬姆斯基普遍語(yǔ)法中的“遞歸性假設(shè)”。自然語(yǔ)言處理,研究能實(shí)現(xiàn)人與計(jì)算機(jī)之間用自然語(yǔ)言進(jìn)行有效通信的各種理論和方法,主要是計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)和數(shù)學(xué)的融合學(xué)科。

通過(guò)圖4可以看出,自底向上,自然語(yǔ)言處理需要通過(guò)對(duì)字、詞、短語(yǔ)、句子、段落、篇章的分析,使得計(jì)算機(jī)能夠理解文本的意義。

圖4 自然語(yǔ)言技術(shù)體系

而在每一個(gè)層級(jí)上都包含大量的技術(shù)模塊,比如說(shuō)在詞級(jí)別,需要做分詞、詞性標(biāo)注、命名實(shí)體識(shí)別等。

由于本文主要探討虛擬生命的相關(guān)技術(shù),因此,在一個(gè)虛擬生命1.0框架(或者說(shuō)聊天機(jī)器人)中,牽扯到的自然語(yǔ)言處理技術(shù)主要包括:自然語(yǔ)言理解,對(duì)話管理和自然語(yǔ)言生成。其中,自然語(yǔ)言理解是為了分析句子的各項(xiàng)含義,包括情感、意圖、句型、主題等;而對(duì)話管理則是用于管理上下文、更新對(duì)話狀態(tài)、進(jìn)行邏輯推理等;最后的自然語(yǔ)言生成,用于合成自然流暢的句子,并以合適的形式進(jìn)行反饋。無(wú)論是微軟小冰、Siri、亞馬遜的Echo,還是公子小白、度秘、小愛(ài)同學(xué),都是自然語(yǔ)言處理技術(shù)的典型的產(chǎn)品落地體現(xiàn)。

比如和機(jī)器人對(duì)話的過(guò)程中,對(duì)于音樂(lè)話題的理解,就需要用到命名實(shí)體識(shí)別、實(shí)體鏈接等技術(shù)。舉一個(gè)簡(jiǎn)單的例子,“我真的非常喜歡杰倫的雙截棍”,就需要判斷杰倫是一個(gè)人名,鏈接到知識(shí)庫(kù)中“周杰倫”這樣一個(gè)歌手實(shí)體,并且“雙截棍”是一個(gè)歌名而不是一種器械。同時(shí),還可以進(jìn)行情感判斷,是一個(gè)正面的“喜歡”的情感。

傳統(tǒng)的自然語(yǔ)言處理技術(shù),還是以統(tǒng)計(jì)學(xué)和機(jī)器學(xué)習(xí)為主,同時(shí)需要用到大量的規(guī)則。近十年來(lái),深度學(xué)習(xí)技術(shù)的興起,也帶來(lái)了自然語(yǔ)言處理技術(shù)的突破。這一切還需要從語(yǔ)言的表示開(kāi)始說(shuō)起。

眾所周知,計(jì)算機(jī)擅長(zhǎng)處理符號(hào),因此,自然語(yǔ)言需要被轉(zhuǎn)化為一個(gè)機(jī)器友好的形式,使得計(jì)算機(jī)能夠快速處理。一個(gè)很典型的表示方法是詞匯的獨(dú)熱(one-hot)表示,也就是相當(dāng)于每個(gè)詞在詞匯表里都有一個(gè)特定的位置。比如說(shuō)有一個(gè)10000個(gè)詞的詞匯表,而“國(guó)王”是詞匯表里的第500個(gè)詞,那么“國(guó)王”就可以表示為一個(gè)一維向量,只有第500個(gè)位置是1,其他9999個(gè)位置都是0。但這種表示方法的問(wèn)題很多,對(duì)語(yǔ)義相近但組成不同的詞或句子如“國(guó)王”和“女王”,利用獨(dú)熱表示的向量?jī)?nèi)積,無(wú)法準(zhǔn)確的判斷兩者之間的相似度。

2013年,Tomas Mikolov等人在谷歌開(kāi)發(fā)了一個(gè)基于神經(jīng)網(wǎng)絡(luò)的詞嵌入(word embedding)學(xué)習(xí)方法Word2Vec,不但大大縮短了詞匯的表示向量的長(zhǎng)度,而且能夠更好的體現(xiàn)語(yǔ)義信息。通過(guò)這種嵌入方法可以很好的解決“國(guó)王”-“男人”=“女王”-“女人”這類(lèi)問(wèn)題。感興趣的讀者可以參考互聯(lián)網(wǎng)上大量的關(guān)于詞嵌入的資料

計(jì)算機(jī)能夠快速處理自然語(yǔ)言之后,傳統(tǒng)的機(jī)器學(xué)習(xí)方法也進(jìn)一步被深度學(xué)習(xí)所顛覆。相關(guān)算法在近年來(lái)的迭代速度非常快。以語(yǔ)言模型(Language Model)預(yù)訓(xùn)練方法為例,代表性方法有Transformer,ELMo,Open AI GPT,BERT,GPT2以及最新的XLNet。其中,Transformer于2017年6月被提出。ELMo的發(fā)表時(shí)間是2018年2月,刷新了當(dāng)時(shí)所有的SOTA(State Of The Art)結(jié)果。

不到4個(gè)月,Open AI在6月,基于Transformer發(fā)布了GPT方法,刷新了9個(gè)SOTA結(jié)果。又過(guò)了4個(gè)月,橫空出世的BERT又刷新了11個(gè)SOTA結(jié)果。2019年2月,Open AI發(fā)布的GPT2,包含15億參數(shù),刷新了11項(xiàng)任務(wù)的SOTA結(jié)果。而2019年6月,CMU 與谷歌大腦提出了全新 XLNet,在 20 個(gè)任務(wù)上超過(guò)了 BERT 的表現(xiàn),并在 18 個(gè)任務(wù)上取得了當(dāng)前最佳效果。

除了算法和算力的進(jìn)步,還有一個(gè)重要的原因在于,以前的自然語(yǔ)言處理研究,更多的是監(jiān)督學(xué)習(xí),需要大量的標(biāo)注數(shù)據(jù),成本高且質(zhì)量難以控制,而以BERT為代表的深度學(xué)習(xí)方法,直接在無(wú)標(biāo)注的文本上做出預(yù)訓(xùn)練模型。在人類(lèi)歷史上,無(wú)監(jiān)督數(shù)據(jù)是海量的,也就代表著這些模型的提升空間還有很大。2019年7月11日,Google AI發(fā)表論文[5],就利用了驚人的250億平行句對(duì)的訓(xùn)練樣本。其應(yīng)用效果我們也拭目以待。

從自然語(yǔ)言處理的理論發(fā)展來(lái)看,前景一片光明,但相比之下,聊天機(jī)器人產(chǎn)品的效果,卻被無(wú)數(shù)用戶(hù)所詬病。答非所問(wèn)、響應(yīng)延遲、誤喚醒等問(wèn)題大大降低了用戶(hù)的滿(mǎn)意度。隨著2018年Facebook關(guān)閉其虛擬助手M,亞馬遜Echo也被爆出侵犯用戶(hù)隱私的問(wèn)題,再加上聊天機(jī)器人實(shí)際使用效果遠(yuǎn)低于大眾預(yù)期,整個(gè)行業(yè)也逐步走向低迷。

一個(gè)很關(guān)鍵的原因在于,媒體上對(duì)于聊天機(jī)器人的宣傳,都在嘗試模仿人類(lèi)的對(duì)話交互。而在目前的技術(shù)條件下是無(wú)法達(dá)到的。微軟亞洲研究院副院長(zhǎng)周明博士曾經(jīng)提到,語(yǔ)言智能可以看做是人工智能皇冠上的明珠。嘗試用技術(shù)模擬人類(lèi)的真實(shí)對(duì)話,在開(kāi)放領(lǐng)域就是個(gè)偽命題。因?yàn)樵谌祟?lèi)的對(duì)話過(guò)程中,一句話中所表達(dá)出的信息,不只是文字本身,還包括世界觀、情緒、環(huán)境、上下文、語(yǔ)音、表情、對(duì)話者之間的關(guān)系等。

比如說(shuō)“今天天氣不錯(cuò)”,在早晨擁擠的電梯中和同事說(shuō),在秋游的過(guò)程中和驢友說(shuō),走在大街上的男女朋友之間說(shuō),在傾盆大雨中對(duì)同伴說(shuō),很可能代表完全不同的意思。在人類(lèi)對(duì)話中需要考慮到的因素包括:說(shuō)話者和聽(tīng)者的靜態(tài)世界觀、動(dòng)態(tài)情緒、兩者的關(guān)系,以及上下文和所處環(huán)境等,如圖5所示。

圖5 人類(lèi)聊天中的要素

而且,以上這些都不是獨(dú)立因素,整合起來(lái),才能真正反映一句話或者一個(gè)詞所蘊(yùn)含的意思。這就是人類(lèi)語(yǔ)言的奇妙之處。同時(shí),人類(lèi)在交互過(guò)程中,并不是等對(duì)方說(shuō)完一句話才進(jìn)行信息處理,而是隨著說(shuō)出的每一個(gè)字,不斷的進(jìn)行腦補(bǔ),在對(duì)方說(shuō)完之前就很可能了解到其所有的信息。再進(jìn)一步,人類(lèi)有很強(qiáng)的糾錯(cuò)功能,在進(jìn)行多輪交互的時(shí)候,能夠根據(jù)對(duì)方的反饋,修正自己的理解,達(dá)到雙方的信息同步。

再進(jìn)一步,在體驗(yàn)?zāi)M假說(shuō)(Embodied Simulation Hypothesis)中[6],人類(lèi)在進(jìn)行語(yǔ)言理解的時(shí)候,會(huì)基于聽(tīng)覺(jué)、視覺(jué)以及運(yùn)動(dòng)等體驗(yàn)的模擬,來(lái)進(jìn)行“腦補(bǔ)”。比如說(shuō)當(dāng)聽(tīng)到“綿羊有沒(méi)有角”這個(gè)問(wèn)題,我們會(huì)在腦海里浮現(xiàn)出綿羊的形象,甚至聲音,再去判斷它頭上有沒(méi)有角。

因此,在開(kāi)放域的聊天機(jī)器人,寄希望于從一句話的文本理解其含義,這本身就是很不靠譜的一件事情。目前市場(chǎng)上大部分的聊天機(jī)器人,還僅是單通道的交互(語(yǔ)音或文本),離人類(lèi)多模態(tài)交互的能力還相差甚遠(yuǎn)。哪怕僅僅是語(yǔ)音識(shí)別,在不同的噪音條件下也會(huì)產(chǎn)生不同的錯(cuò)誤率,對(duì)于文本的理解就更加雪上加霜了。更別談推理能力,僅僅通過(guò)自然語(yǔ)言處理技術(shù)也是無(wú)法進(jìn)行解決的。

那么自然語(yǔ)言的生成模型是否可以解決問(wèn)題呢?通過(guò)端到端的深度學(xué)習(xí)方法,我們可以做到句子的生成。但實(shí)際上,這種方法所生成的語(yǔ)句,還未能達(dá)到實(shí)用級(jí)別,因此本文不做深入討論。

結(jié)合多模態(tài)識(shí)別和分析,是自然語(yǔ)言處理落地的新方向。舉例來(lái)說(shuō),要識(shí)別一句話“你太壞了”是撒嬌還是批評(píng),如果將聲音特征和表情特征結(jié)合進(jìn)來(lái),那么會(huì)很容易判斷。哈工大李海峰教授也曾給出過(guò)一個(gè)有趣的例子,對(duì)于“我沒(méi)有看見(jiàn)他拿了你的錢(qián)包“,重音位置不同,會(huì)導(dǎo)致不同的含義。當(dāng)重音在”我“的時(shí)候,可能表示說(shuō)話者沒(méi)看到,但有其他人看到。當(dāng)重音在”錢(qián)包“的時(shí)候,可能表示被拿走的不是錢(qián)包,而是別的東西。當(dāng)重音在”看見(jiàn)“的時(shí)候,可能表示說(shuō)話者并沒(méi)看到,但有可能聽(tīng)說(shuō)了這個(gè)事情。因此,結(jié)合多模態(tài)的自然語(yǔ)言處理,會(huì)大大提升多輪對(duì)話中機(jī)器人的表現(xiàn)。

五、知識(shí)圖譜

在上一節(jié)中,我們也提到,自然語(yǔ)言處理技術(shù)很難解決推理問(wèn)題。而推理是認(rèn)知智能的重要組成部分。比如說(shuō)對(duì)于問(wèn)題“姚明的老婆的女兒的國(guó)籍是什么?”,一個(gè)可行的解決方案,就是通過(guò)大規(guī)模百科知識(shí)圖譜來(lái)進(jìn)行推理查詢(xún)。

知識(shí)圖譜被認(rèn)為是從感知智能通往認(rèn)知智能的重要基石。一個(gè)很簡(jiǎn)單的原因就是,沒(méi)有知識(shí)的機(jī)器人不可能實(shí)現(xiàn)認(rèn)知智能。圖靈獎(jiǎng)獲得者,知識(shí)工程創(chuàng)始人Edward Feigenbaum曾經(jīng)提到:“Knowledge is the power in AI system”。張鈸院士也提到,“沒(méi)有知識(shí)的AI不是真正的AI”。

拿上一節(jié)提到的GPT-2算法來(lái)看,即使其文章續(xù)寫(xiě)能力讓人贊嘆,也只是再次證明了足夠大的神經(jīng)網(wǎng)絡(luò)配合足夠多的訓(xùn)練數(shù)據(jù),就能夠產(chǎn)生強(qiáng)大的記憶能力。但邏輯和推理能力,仍然是無(wú)法從記憶能力中自然而然的出現(xiàn)的。學(xué)界和企業(yè)界都寄希望于知識(shí)圖譜解決知識(shí)互連和推理的問(wèn)題。那么什么是知識(shí)圖譜?簡(jiǎn)單來(lái)說(shuō),就是把知識(shí)用圖的形式組織起來(lái)。可能這樣說(shuō)還不夠明白,我們舉例子分別說(shuō)下什么是知識(shí),什么是圖譜。

所謂知識(shí),是信息的抽象,舉一個(gè)簡(jiǎn)單的例子來(lái)說(shuō),226.1厘米,229厘米,都是客觀存在的孤立的數(shù)據(jù)。此時(shí),數(shù)據(jù)不具有任何的意義,僅表達(dá)一個(gè)事實(shí)存在。而“姚明臂展226.1厘米”, “姚明身高229厘米”,是事實(shí)型的陳述,屬于信息的范疇。對(duì)于知識(shí)而言,是在更高層面上的一種抽象和歸納,把姚明的身高、臂展,及姚明的其他屬性整合起來(lái),就得到了對(duì)于姚明的一個(gè)認(rèn)知,也可以進(jìn)一步了解姚明的身高是比普通人更高的。

維基百科給出的關(guān)于知識(shí)的定義是:知識(shí)是人類(lèi)在實(shí)踐中認(rèn)識(shí)客觀世界(包括人類(lèi)自身)的成果,它包括事實(shí)、信息的描述或在教育和實(shí)踐中獲得的技能。知識(shí)是人類(lèi)從各個(gè)途徑中獲得得經(jīng)過(guò)提升總結(jié)與凝練的系統(tǒng)的認(rèn)識(shí)。

圖譜的英文是graph,直譯過(guò)來(lái)就是“圖”的意思。在圖論(數(shù)學(xué)的一個(gè)研究分支)中,圖(graph)表示一些事物(objects)與另一些事物之間相互連接的結(jié)構(gòu)。一張圖通常由一些結(jié)點(diǎn)(vertices或nodes)和連接這些結(jié)點(diǎn)的邊(edge)組成。Sylvester在1878年首次提出了“圖”這一名詞[7]。如果我們把姚明相關(guān)的“知識(shí)”用“圖譜”構(gòu)建起來(lái),就是圖6所體現(xiàn)的內(nèi)容。

圖6 姚明的基本信息知識(shí)圖譜

知識(shí)圖譜是實(shí)現(xiàn)通用人工智能(Artificial General Intelligence)的重要基石。從感知到認(rèn)知的跨越過(guò)程中,構(gòu)建大規(guī)模高質(zhì)量知識(shí)圖譜是一個(gè)重要環(huán)節(jié),當(dāng)人工智能可以通過(guò)更結(jié)構(gòu)化的表示理解人類(lèi)知識(shí),并進(jìn)行互聯(lián),才有可能讓機(jī)器真正實(shí)現(xiàn)推理、聯(lián)想等認(rèn)知功能。而構(gòu)建知識(shí)圖譜是一個(gè)系統(tǒng)工程,其整體的技術(shù)棧如圖7所示:

圖7 知識(shí)圖譜體系架構(gòu)

針對(duì)不同場(chǎng)景,知識(shí)圖譜的構(gòu)建策略分為自頂向下和自底向上兩種方法。

自頂向下的策略為專(zhuān)家驅(qū)動(dòng),根據(jù)應(yīng)用場(chǎng)景和領(lǐng)域,利用經(jīng)驗(yàn)知識(shí)人工為知識(shí)圖譜定義數(shù)據(jù)模式,在定義本體的過(guò)程中,首先從最頂層的概念開(kāi)始,然后逐步進(jìn)行細(xì)化,形成結(jié)構(gòu)良好的分類(lèi)學(xué)層次結(jié)構(gòu);在定義好數(shù)據(jù)模式后,再將實(shí)體逐個(gè)對(duì)應(yīng)到概念中。

自底向上的策略為數(shù)據(jù)驅(qū)動(dòng),從數(shù)據(jù)源開(kāi)始,針對(duì)不同類(lèi)型的數(shù)據(jù),對(duì)其包含的實(shí)體和知識(shí)進(jìn)行歸納組織,形成底層的概念,然后逐步往上抽象,形成上層的概念,并對(duì)應(yīng)到具體的應(yīng)用場(chǎng)景中。

知識(shí)圖譜可以輔助各種智能場(chǎng)景下的應(yīng)用。谷歌在2012年最早提出“Knowledge Graph”的概念,并將知識(shí)圖譜用到搜索中,使得“搜索能直接通往答案”。知識(shí)圖譜還能輔助智能問(wèn)答、決策推理等應(yīng)用場(chǎng)景。圖8給出的是使用知識(shí)圖譜結(jié)合自然語(yǔ)言處理進(jìn)行問(wèn)答的案例。

圖8 知識(shí)圖譜輔助智能問(wèn)答

知識(shí)圖譜讓機(jī)器人擁有了知識(shí),也讓我們看到了實(shí)現(xiàn)認(rèn)知智能的希望。但在目前的技術(shù)條件下,還有很多問(wèn)題需要解決。

首先,知識(shí)的覆蓋面不全。目前的知識(shí)圖譜,僅僅涵蓋了人類(lèi)知識(shí)的極小的一部分。由于構(gòu)建較為復(fù)雜,人類(lèi)歷史上海量自然語(yǔ)言文本中的知識(shí),很大部分并沒(méi)有被結(jié)構(gòu)化到知識(shí)圖譜中。即便是有了半自動(dòng)的抽取方法,常識(shí)知識(shí)也很難從文本中得到。因此,常識(shí)推理也是目前知識(shí)圖譜領(lǐng)域很難解決的一個(gè)問(wèn)題。例如對(duì)于“雞蛋放到籃子里,是雞蛋大還是籃子大”,“人看見(jiàn)老虎要不要跑”這類(lèi)問(wèn)題,通過(guò)百科知識(shí)圖譜就很難解決。

其次,知識(shí)圖譜體系的標(biāo)準(zhǔn)化還不夠完善。知識(shí)圖譜體系稱(chēng)為“schema”。通俗來(lái)講,schema是骨架,而知識(shí)圖譜是血肉。有了schema,我們可以更好的做推理和聯(lián)想。例如,樹(shù)是一種植物,而柳樹(shù)是樹(shù)的一種實(shí)例化,可以推斷出“柳樹(shù)是植物”。一個(gè)簡(jiǎn)單的schema如圖9所示。不同領(lǐng)域schema的建立通常會(huì)有所區(qū)別,不同知識(shí)圖譜之間的schema也會(huì)有差異。

圖9 知識(shí)圖譜schema示例

2011年,Google、Microsoft和Yahoo!三大巨頭推出了一個(gè)schema的規(guī)范體系:Schema.org,這個(gè)規(guī)范體系是一個(gè)消費(fèi)驅(qū)動(dòng)的嘗試,其指導(dǎo)數(shù)據(jù)發(fā)布者和網(wǎng)站構(gòu)建者在網(wǎng)頁(yè)中嵌入并發(fā)布結(jié)構(gòu)化數(shù)據(jù),對(duì)應(yīng)的回報(bào)是在用戶(hù)在使用特定關(guān)鍵字搜索時(shí),可以免費(fèi)為這些網(wǎng)頁(yè)提升排名,從而起到搜索引擎優(yōu)化(SEO)的作用。

它的核心schema由專(zhuān)家自頂向下定義,截止目前,這個(gè)詞匯本體已經(jīng)包含600多個(gè)類(lèi)和900多個(gè)關(guān)系,覆蓋范圍包括:個(gè)人、組織機(jī)構(gòu)、地點(diǎn)、時(shí)間、醫(yī)療、商品等。通過(guò)SEO的明確價(jià)值導(dǎo)向,得到了廣泛應(yīng)用,目前全互聯(lián)網(wǎng)有超過(guò)30%的網(wǎng)頁(yè)增加了基于schema.org的數(shù)據(jù)體系的數(shù)據(jù)標(biāo)注。在國(guó)內(nèi),相對(duì)應(yīng)的是由OpenKG組織牽頭的CnSchema(cnschema.org)。在相同的規(guī)范體系下,不同知識(shí)圖譜之間可以做到更好的融合和知識(shí)遷移。

最后,構(gòu)建知識(shí)圖譜的成本仍然較高。Heiko Paulheim在其文章《How much is a Triple? Estimating the Cost of Knowledge Graph Creation》中,給出了幾個(gè)典型的知識(shí)圖譜的構(gòu)建成本。其中,上世紀(jì)80年代開(kāi)始的也是最早的知識(shí)圖譜項(xiàng)目CYC,平均構(gòu)建一條陳述句和斷言的成本是5.71美元,而隨著自然語(yǔ)言處理和機(jī)器學(xué)習(xí)技術(shù)的進(jìn)步,DBpedia構(gòu)建每一條的成本降低到了1.85美分。即便如此,在真正工程化落地的時(shí)候,牽扯到多源數(shù)據(jù)的清洗整合,一個(gè)知識(shí)圖譜項(xiàng)目的成本還是居高不下。

六、重新審視認(rèn)知科學(xué)

從感知智能通向認(rèn)知智能的道路中,自然語(yǔ)言處理與知識(shí)圖譜技術(shù)起到了重要作用。但不可忽視的是,認(rèn)知智能乃至通用人工智能的實(shí)現(xiàn),是需要多學(xué)科的共同進(jìn)步才能完成的。

其中,腦科學(xué)是一個(gè)非常重要的研究領(lǐng)域。迄今為止,我們?cè)趧?chuàng)造智能機(jī)器的過(guò)程中,很大程度上還是在仿造現(xiàn)有的生命體。因此,對(duì)人腦的研究也提升了我們對(duì)認(rèn)知智能的理解。人腦是由千億級(jí)神經(jīng)細(xì)胞,通過(guò)千萬(wàn)億級(jí)的突觸連接而形成的神經(jīng)網(wǎng)絡(luò),不同的區(qū)域負(fù)責(zé)不同的功能。發(fā)達(dá)的大腦皮層也正是人類(lèi)區(qū)別于動(dòng)物的主要特點(diǎn)。

目前主流的深度學(xué)習(xí)技術(shù),正是對(duì)人腦的一定程度的模仿。李航博士在其《智能與計(jì)算》一文中提到,雖然腦科學(xué)研究取得了一定的進(jìn)展,但離探明人腦的工作機(jī)理還相差甚遠(yuǎn)。就能耗而言,前文中所提到的打敗李世石的AlphaGo(擁有1202個(gè)CPU,176個(gè)GPU,按照每個(gè)CPU的功率為100W,每個(gè)GPU的功率為200W進(jìn)行推算得到此結(jié)果。),每小時(shí)的能量消耗接近15萬(wàn)千卡,而一個(gè)成年人每天的能量消耗也僅僅2500千卡。更何況人在下棋之外還可以做很多其他的事情。

另外還需提及的一個(gè)學(xué)科是認(rèn)知科學(xué),其誕生于上世紀(jì)50年代的“認(rèn)知革命”,包括哲學(xué)、認(rèn)知心理學(xué)、計(jì)算機(jī)科學(xué)、語(yǔ)言學(xué)、人類(lèi)學(xué)和神經(jīng)科學(xué)六個(gè)主要領(lǐng)域。其代表綱領(lǐng)為“認(rèn)知即計(jì)算“,通過(guò)心理符號(hào)表征和對(duì)表征結(jié)構(gòu)的操作程序來(lái)研究一般的思維和智能。

在今年五月底《Nature Human Behaviour》的論文《What happened to cognitive science?》中,美國(guó)加州大學(xué)圣地亞哥分校認(rèn)知科學(xué)系具身認(rèn)知實(shí)驗(yàn)室主任(Director of the Embodied Cognition Laboratory)Rafael Nú?ez等幾位專(zhuān)家,對(duì)半個(gè)世紀(jì)以來(lái)認(rèn)知科學(xué)的發(fā)展進(jìn)行了一個(gè)概括和討論。圖10給出了六個(gè)學(xué)科中在《認(rèn)知科學(xué)》上論文數(shù)量的對(duì)比。可以看出,認(rèn)知心理學(xué)占比超過(guò)了60%,計(jì)算機(jī)科學(xué)、神經(jīng)科學(xué)和語(yǔ)言學(xué)分別占比10%左右,而人類(lèi)學(xué)和哲學(xué)卻幾乎為零。因此,在認(rèn)知科學(xué)領(lǐng)域,并沒(méi)有形成一個(gè)完整統(tǒng)一的學(xué)科,而是認(rèn)知心理學(xué)的一枝獨(dú)秀。

但大量的里程碑式的成果仍然是多學(xué)科融合的產(chǎn)物。上世紀(jì)60年代興起的心智計(jì)算理論(Computational Theory of Mind),是由認(rèn)知科學(xué)家、腦科學(xué)家和哲學(xué)家共同提出和推進(jìn)的。其認(rèn)為“心智是計(jì)算系統(tǒng),思考是符號(hào)操作”。心智計(jì)算理論在近二十年受到了前文提到的“體驗(yàn)認(rèn)知理論”的挑戰(zhàn),而體驗(yàn)認(rèn)知理論,也融合了認(rèn)知科學(xué)、腦科學(xué)和哲學(xué)的研究成果。近十年來(lái),認(rèn)知神經(jīng)科學(xué)和腦科學(xué)結(jié)合,通過(guò)先進(jìn)的功能核磁共振技術(shù),也為大腦如何產(chǎn)生思想提供了新的實(shí)驗(yàn)發(fā)現(xiàn)。

圖10 《認(rèn)知科學(xué)》領(lǐng)域論文數(shù)量對(duì)比

多學(xué)科的融合和發(fā)展,讓認(rèn)知智能不斷進(jìn)步。在今年7月,我們看到了一項(xiàng)令人激動(dòng)的技術(shù)落地。美國(guó)神經(jīng)科技公司Neuralink的創(chuàng)始人埃隆·馬斯克(Elon Musk)16日表示,“腦機(jī)接口”(Brain-Computer Interface, BCI)研究取得新進(jìn)展。公司研發(fā)出一種比人類(lèi)頭發(fā)絲還細(xì)的“線”,可植入人類(lèi)大腦中,檢測(cè)神經(jīng)元活動(dòng)。目前,研究人員已在猴子身上進(jìn)行了實(shí)驗(yàn),可以從1500個(gè)電極讀取信息,讓猴子能用大腦控制電腦。

七、結(jié)語(yǔ)

認(rèn)知智能的突破,一定不是由單個(gè)技術(shù)所完成,而是需要結(jié)合多種不同的技術(shù)的發(fā)展。正如本文中所提到的,自然語(yǔ)言處理與知識(shí)圖譜結(jié)合可以實(shí)現(xiàn)一定程度的推理,而知識(shí)圖譜和深度學(xué)習(xí)結(jié)合可以實(shí)現(xiàn)一定程度的可解釋性,自然語(yǔ)言處理和深度學(xué)習(xí)結(jié)合,誕生了BERT等強(qiáng)大的語(yǔ)言模型。

在技術(shù)之外,在實(shí)現(xiàn)認(rèn)知智能的過(guò)程中,還需要考慮一些人文因素,例如如何讓機(jī)器人具備情感,如何賦予機(jī)器人生存的意義(或目標(biāo)),這些都是目前無(wú)法實(shí)現(xiàn)的事情。自然語(yǔ)言處理與知識(shí)圖譜技術(shù),開(kāi)啟了認(rèn)知智能的大門(mén),但還需要科學(xué)家和工程師們的共同努力,才能真正摘得人工智能皇冠上的明珠。

最后以孫中山先生的名言作為本文的結(jié)語(yǔ):“革命尚未成功,同志任需努力。”

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1796

    文章

    47683

    瀏覽量

    240311
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    489

    瀏覽量

    22110

原文標(biāo)題:認(rèn)知智能的突圍:NLP、知識(shí)圖譜是AI下一個(gè)“掘金地”?

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    MLOps平臺(tái)的發(fā)展方向

    MLOps平臺(tái)作為機(jī)器學(xué)習(xí)開(kāi)發(fā)運(yùn)維體化的重要工具,其發(fā)展方向將深刻影響人工智能技術(shù)的普及和應(yīng)用。下面,是對(duì)MLOps平臺(tái)發(fā)展方向的探討,由AI部落小編整理。
    的頭像 發(fā)表于 12-31 11:51 ?122次閱讀

    軟通動(dòng)力入選《人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)圖譜

    近日,由中國(guó)信息通信研究院、中國(guó)人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟牽頭,聯(lián)合中國(guó)電信集團(tuán)、沈陽(yáng)市數(shù)據(jù)局、保定高新區(qū)等70多家單位編制完成并發(fā)布了《人工智能數(shù)據(jù)標(biāo)注產(chǎn)業(yè)圖譜》。
    的頭像 發(fā)表于 12-03 10:18 ?214次閱讀

    嵌入式和人工智能究竟是什么關(guān)系?

    領(lǐng)域,如工業(yè)控制、智能家居、醫(yī)療設(shè)備等。 人工智能是計(jì)算機(jī)科學(xué)的個(gè)分支,它研究如何使計(jì)算機(jī)具備像人類(lèi)樣思考、學(xué)習(xí)、推理和決策的能力。
    發(fā)表于 11-14 16:39

    未來(lái)數(shù)字孿生的潛在發(fā)展方向

    數(shù)字孿生技術(shù)是近年來(lái)興起的種創(chuàng)新技術(shù),它通過(guò)創(chuàng)建個(gè)與現(xiàn)實(shí)世界中的實(shí)體相對(duì)應(yīng)的虛擬副本,實(shí)現(xiàn)了對(duì)實(shí)體的全面監(jiān)控、分析和預(yù)測(cè)。隨著物聯(lián)網(wǎng)、大數(shù)據(jù)、云計(jì)算和人工智能等技術(shù)的
    的頭像 發(fā)表于 10-25 14:58 ?790次閱讀

    智能駕駛的未來(lái)發(fā)展方向

    智能駕駛的未來(lái)發(fā)展方向涉及多個(gè)層面,包括技術(shù)創(chuàng)新、產(chǎn)業(yè)鏈發(fā)展、政策法規(guī)以及市場(chǎng)應(yīng)用等。以下是對(duì)智能駕駛未來(lái)發(fā)展方向的介紹:
    的頭像 發(fā)表于 10-24 09:09 ?560次閱讀

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第6章人AI與能源科學(xué)讀后感

    驅(qū)動(dòng)科學(xué)創(chuàng)新》的第6章為我提供了寶貴的知識(shí)和見(jiàn)解,讓我對(duì)人工智能在能源科學(xué)中的應(yīng)用有了更深入的認(rèn)識(shí)。通過(guò)閱讀這章,我更加堅(jiān)信人工智能在未來(lái)能源科學(xué)領(lǐng)域中的重要地位和作用。同時(shí),我也意
    發(fā)表于 10-14 09:27

    《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》第人工智能驅(qū)動(dòng)的科學(xué)創(chuàng)新學(xué)習(xí)心得

    發(fā)展機(jī)遇。同時(shí),這也要求科研人員、政策制定者和社會(huì)各界共同努力,構(gòu)建個(gè)健康、包容的AI科研生態(tài)系統(tǒng)。 總之,《AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新》的第
    發(fā)表于 10-14 09:12

    risc-v在人工智能圖像處理應(yīng)用前景分析

    滿(mǎn)足人工智能圖像處理中對(duì)于高性能、低功耗和特定功能的需求。 低功耗 : 在人工智能圖像處理中,低功耗是個(gè)重要的考量因素。RISC-V架構(gòu)的設(shè)計(jì)使其在處理任務(wù)時(shí)能夠保持較低的功耗水平
    發(fā)表于 09-28 11:00

    名單公布!【書(shū)籍評(píng)測(cè)活動(dòng)NO.44】AI for Science:人工智能驅(qū)動(dòng)科學(xué)創(chuàng)新

    芯片設(shè)計(jì)的自動(dòng)化水平、優(yōu)化半導(dǎo)體制造和封測(cè)的工藝和水平、尋找新代半導(dǎo)體材料等方面提供幫助。 第6章介紹了人工智能在化石能源科學(xué)研究、可再生能源科學(xué)研究、能源轉(zhuǎn)型三個(gè)方面的落地應(yīng)用。 第7章從環(huán)境監(jiān)測(cè)
    發(fā)表于 09-09 13:54

    三星電子將收購(gòu)英國(guó)知識(shí)圖譜技術(shù)初創(chuàng)企業(yè)

    人工智能技術(shù)日新月異的今天,三星電子公司再次展現(xiàn)了其前瞻性的戰(zhàn)略布局與技術(shù)創(chuàng)新實(shí)力。近日,三星正式宣布完成了對(duì)英國(guó)領(lǐng)先的人工智能(AI)與知識(shí)圖譜技術(shù)初創(chuàng)企業(yè)Oxford Semantic Technologies的收購(gòu),此舉
    的頭像 發(fā)表于 07-18 14:46 ?578次閱讀

    知識(shí)圖譜與大模型之間的關(guān)系

    人工智能的廣闊領(lǐng)域中,知識(shí)圖譜與大模型是兩個(gè)至關(guān)重要的概念,它們各自擁有獨(dú)特的優(yōu)勢(shì)和應(yīng)用場(chǎng)景,同時(shí)又相互補(bǔ)充,共同推動(dòng)著人工智能技術(shù)的發(fā)展
    的頭像 發(fā)表于 07-10 11:39 ?1217次閱讀

    NLP技術(shù)在人工智能領(lǐng)域的重要性

    在自然語(yǔ)言處理(Natural Language Processing, NLP)與人工智能(Artificial Intelligence, AI)的交織發(fā)展中,NLP技術(shù)作為連接人
    的頭像 發(fā)表于 07-04 16:03 ?687次閱讀

    嵌入式熱門(mén)發(fā)展方向有哪些?

    嵌入式熱門(mén)發(fā)展方向有哪些? 現(xiàn)在越來(lái)越多的計(jì)算機(jī)、電子、通信、自動(dòng)化等相關(guān)專(zhuān)業(yè)跨行學(xué)習(xí)嵌入式,嵌入式開(kāi)發(fā)作為未來(lái)職業(yè)發(fā)展方向,不論從薪資待遇還是發(fā)展前景來(lái)看,都非常不錯(cuò)。 在嵌入
    發(fā)表于 04-11 14:17

    嵌入式人工智能的就業(yè)方向有哪些?

    嵌入式人工智能的就業(yè)方向有哪些? 在新輪科技革命與產(chǎn)業(yè)變革的時(shí)代背景下,嵌入式人工智能成為國(guó)家新型基礎(chǔ)建設(shè)與傳統(tǒng)產(chǎn)業(yè)升級(jí)的核心驅(qū)動(dòng)力。同時(shí)在此背景驅(qū)動(dòng)下,眾多名企也紛紛在嵌入式
    發(fā)表于 02-26 10:17

    利用知識(shí)圖譜與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動(dòng)的RAG系統(tǒng)(下)

    對(duì)于語(yǔ)言模型(LLM)幻覺(jué),知識(shí)圖譜被證明優(yōu)于向量數(shù)據(jù)庫(kù)。知識(shí)圖譜提供更準(zhǔn)確、多樣化、有趣、邏輯和致的信息,減少了LLM中出現(xiàn)幻覺(jué)的可能性。
    的頭像 發(fā)表于 02-22 14:13 ?1314次閱讀
    利用<b class='flag-5'>知識(shí)圖譜</b>與Llama-Index技術(shù)構(gòu)建大模型驅(qū)動(dòng)的RAG系統(tǒng)(下)
    六合彩脑筋急转弯| 威尼斯人娱乐城好吗| 百家乐关键词| 传奇百家乐官网的玩法技巧和规则| 澳门百家乐官网国际娱乐城| 东乌珠穆沁旗| 博九网| bet365v网卡| 大发888检测技能| 全讯网论坛| 百家乐那里可以玩| 百家乐透视牌靴价格| 百家乐庄闲机率分析| 马德里百家乐官网的玩法技巧和规则 | 百家乐长t恤| 不夜城百家乐的玩法技巧和规则| 百家乐透视牌靴哪里有| 百家乐现金网平台排行榜| 网上百家乐真实度| 百家乐星级游戏| 百家乐官网怎样下注| 索雷尔百家乐官网的玩法技巧和规则| 百家乐官网与21点| 百家乐官网开户导航| 百家乐官网打闲赢机会多| 百家乐官网桌布橡胶| 百家乐官网送彩金网络| 太阳城百家乐官网娱乐官方网| 百家乐官网赌博游戏| 网上百家乐官网是假| 百家乐官网推筒子| 金龙博彩网| 中金时时彩平台| 道真| 金昌市| 百家乐官网国际娱乐| 百家乐官网娱乐城7| 伟博百家乐官网现金网| 娱乐城百家乐官网怎么样| 百家乐官网网络赌博地址| 大发888bocai官方下载|