9月15日消息,《連線》網(wǎng)站撰文指出,F(xiàn)acebook名為Rosetta的人工智能技術(shù)平??煞治鰯?shù)十億張包含文本的圖像,能夠分析表情包,但它能像人類那樣理解表情包的內(nèi)涵嗎?
以下是文章主要內(nèi)容:
每天都有數(shù)十億的文本帖子、照片和視頻被上傳到社交媒體上,這是人類審核員無法全面篩選的一個信息量級。因此,F(xiàn)acebook和YouTube等公司長期以來一直依賴人工智能來幫助解決垃圾郵件和色情內(nèi)容等問題。
不過,對于機器來說,審核像白人至上主義的表情包這樣的東西可能更具挑戰(zhàn)性,因為這項任務(wù)需要同時處理幾種不同的視覺元素。自動化系統(tǒng)需要檢測和“讀取”疊加在照片上的文字,并分析圖像本身。表情包也是一種復(fù)雜的文化產(chǎn)物,很難脫離語境去理解。盡管它們帶來了挑戰(zhàn),但一些社交平臺已經(jīng)在使用人工智能來分析表情包,其中包括社交網(wǎng)絡(luò)巨頭Facebook。Facebook本周分享了它如何使用一種名為Rosetta的工具來分析包含文本的照片和視頻的細(xì)節(jié)。
Facebook表示,它已經(jīng)在使用Rosetta來自動檢測違反其仇恨言論政策等規(guī)定的內(nèi)容。該公司本周還宣布,在該工具的幫助下,它正在擴大其第三方事實核查的努力,納入照片和視頻,而不僅僅是基于文本的文章。Rosetta將自動檢查包含文本的圖像和視頻是否曾被標(biāo)記為錯誤,從而幫助完成審查。
Rosetta通過將光學(xué)字符識別(OCR)技術(shù)與其他機器學(xué)習(xí)技術(shù)相結(jié)合來處理照片和視頻中的文本。首先,它使用OCR來識別文本在表情包或視頻中的位置。你可能以前用過類似OCR的東西;它可以讓你快速瀏覽紙質(zhì)表單,并將其轉(zhuǎn)換為可編輯的文檔。該自動化程序知道文本塊的位置,并能將它們與你應(yīng)該簽名的地方區(qū)分開來。
一旦Rosetta知道文本在哪里,F(xiàn)acebook就會使用一個神經(jīng)網(wǎng)絡(luò)來轉(zhuǎn)錄文本并理解其含義。然后,它可以將文本傳輸?shù)狡渌南到y(tǒng),比如一個檢查表情包是否與已經(jīng)被揭穿的病毒騙局有關(guān)的系統(tǒng)。
Rosetta的研究人員表示,該工具現(xiàn)在可以實時從公開上傳到Facebook的每張圖片中提取文本,并且可以“閱讀”多種語言的文本,包括英語、西班牙語、德語和阿拉伯語。(Facebook表示,Rosetta不會用于掃描用戶在時間軸上私密分享的圖像或私信。)
Rosetta可以分析包含多種文本形式的圖像,比如抗議標(biāo)識、餐廳菜單、店面等的照片。在Facebook工作的軟件工程師維斯瓦納斯·西瓦庫馬爾(Viswanath Sivakumar)在一封電子郵件中說,這個工具既能識別景觀中的文本(比如街道標(biāo)識),也能識別表情包——但后者更具挑戰(zhàn)性。他寫道,“在主動檢測仇恨言論和其他違反政策內(nèi)容的情況下,分析表情包式的圖像是一項更加復(fù)雜的人工智能挑戰(zhàn)?!?/p>
西瓦庫馬爾指出,與人類不同,人工智能通常需要看到成千上萬個例子才能學(xué)會完成復(fù)雜的任務(wù)。但是,即便是對于Facebook而言,表情包方面的例子也不是無窮無盡的,而且在不同的語言上收集足夠多的例子也很困難。尋找高質(zhì)量的訓(xùn)練數(shù)據(jù)是人工智能研究的一個持續(xù)性挑戰(zhàn)。數(shù)據(jù)通常需要花費大量的功夫來進行手工標(biāo)記,而且許多數(shù)據(jù)庫都受到版權(quán)法的保護。
為了訓(xùn)練Rosetta,F(xiàn)acebook的研究人員使用了在網(wǎng)站上公開發(fā)布的含有某種文本形式的圖片,以及它們的標(biāo)注和發(fā)布地點信息。他們還創(chuàng)建了一個程序來生成額外的示例,這種做法的靈感來自于牛津大學(xué)的一個研究團隊在2016年設(shè)計的一種方法。這意味著整個過程在某種程度上是自動化的:一個程序自動地產(chǎn)生表情包,然后另一個程序試圖分析它們。
不同的語言還給Facebook的人工智能團隊帶來了其它的挑戰(zhàn)。例如,研究人員必須找到一種變通方法來使得Rosetta能夠用于阿拉伯語等語言。阿拉伯語從右到左閱讀,與英語等其他語言相反。Rosetta倒著“閱讀”阿拉伯語,經(jīng)過處理后,F(xiàn)acebook將那些字符顛倒過來。研究人員在他們的博客中寫道:“這個技巧的效果出奇的好,讓我們有了一個統(tǒng)一的模型,它既適用于從左到右的語言,也適用于從右到左的語言。”
雖然自動化系統(tǒng)在內(nèi)容審核方面非常有用,但它們并不總是萬無一失的。例如,騰訊的微信絡(luò)使用兩個不同的算法來過濾圖像,多倫多大學(xué)公民實驗室的一個研究團隊成功地騙過了它們。第一個算法是基于OCR的程序,會過濾含有特定話題文本的照片,而另一個算法則會審查那些看起來與中國政府可能創(chuàng)建的黑名單相似的照片。
研究人員能夠通過改變圖像的屬性,比如顏色或方向,輕易地避開微信的過濾器。雖然Facebook的Rosetta更加先進,但可能也不是完美無缺;該系統(tǒng)可能會受困于難以閱讀的文本或扭曲的字體。所有的圖像識別算法也仍然可能會受到對抗性的例子的影響,那些經(jīng)過輕微改動的圖像在人類看來是一樣的,但會導(dǎo)致人工智能陷入混亂。
在對特定種類的內(nèi)容的審核方面,F(xiàn)acebook和Twitter、YouTube和Reddit等其他的平臺在多個國家都面臨著巨大的壓力。周三,歐盟提出了一項新的法規(guī),要求社交媒體公司在接到通知后一小時內(nèi)刪除***的帖子,否則將面臨罰款。Rosetta和其他類似的自動化工具已經(jīng)在幫助Facebook和其他平臺在德國等地遵守類似的法律。
它們在那方面也做得更好了:兩年前,F(xiàn)acebook首席執(zhí)行官馬克·扎克伯格(Mark Zuckerberg)曾說,F(xiàn)acebook的人工智能系統(tǒng)只能主動捕捉到該公司所刪除內(nèi)容的一半左右;人們必須先要標(biāo)記其余要刪除的內(nèi)容。現(xiàn)在,F(xiàn)acebook表示,它的人工智能工具可以檢測到幾乎100%的垃圾郵件、99.5%的恐怖內(nèi)容和86%的暴力圖片。YouTube等其他平臺在利用自動內(nèi)容檢測系統(tǒng)上也取得了同等程度的成功。
然而,這些喜人的數(shù)字并不意味著像Rosetta這樣的人工智能系統(tǒng)是完美的解決方案,尤其是當(dāng)涉及到更微妙的表達形式的時候。與餐館菜單不同的是,如果不知道表情包的發(fā)布背景,就很難理解它的含義。這就是為什么有很多網(wǎng)站在致力于解釋它們。表情包通常描述的是圈內(nèi)笑話,或者是針對特定的網(wǎng)絡(luò)亞文化。人工智能仍然不能像人類那樣理解表情包或視頻。就目前而言,F(xiàn)acebook仍需要依靠人工審核員來決定是否應(yīng)該刪除某個表情包。
-
AI
+關(guān)注
關(guān)注
87文章
31534瀏覽量
270342 -
Facebook
+關(guān)注
關(guān)注
3文章
1429瀏覽量
54999
原文標(biāo)題:Facebook的AI可分析表情包,但它能理解其中的內(nèi)涵嗎?
文章出處:【微信號:worldofai,微信公眾號:worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論