電子發(fā)燒友網(wǎng)報道(文/李彎彎)近日消息,據(jù)知情人士透露,蘋果始終在增加構(gòu)建人工智能所需計算的預(yù)算,并且已經(jīng)擴大到每天數(shù)百萬美元。該公司的一個目標是開放一些功能,允許iPhone用戶使用簡單的語音命令來自動執(zhí)行涉及多個步驟的任務(wù)。
舉例來說,這項技術(shù)可以讓用戶命令Siri語音助手用他們最近拍攝的五張照片創(chuàng)建GIF動圖,并將其發(fā)送給朋友。如今,iPhone用戶必須手動完成這個過程。
蘋果很早就組建AI團隊
相比于微軟、谷歌等全球知名科技公司而言,蘋果在人工智能技術(shù)上的發(fā)展看上去更慢些,包括近年來很火的生成式AI。不過據(jù)外媒報道,蘋果正在加大投資力度,現(xiàn)在每天在人工智能上投資數(shù)百萬美元,并且多個團隊正在同時開發(fā)多種人工智能模型。
其中開發(fā)對話式人工智能的團隊被稱為基礎(chǔ)模型(Foundational Models),該團隊有幾位曾在谷歌工作多年的工程師組成,目前擁有16名成員。事實上,早在四年前,蘋果人工智能主管約翰·詹南德里亞(John Giannandrea)就授權(quán)組建團隊,開發(fā)基于大語言模型(LLM)的對話式人工智能。約翰·詹南德里亞在2018年加入蘋果,并主持Siri的升級。
除此之外,蘋果還有另外至少兩個團隊在推進AI的研究。一個是視覺智能(Visual Intelligence)團隊,該團隊致力于開發(fā)能夠生成圖像、視頻或3D場景的軟件;另一個團隊正在研究多模式人工智能,這種模型可以識別和生成圖像、視頻或文本。該團隊的領(lǐng)導(dǎo)者之一是喬恩·什倫斯(Jon Shlens),他于2021年底加入蘋果,之前在谷歌人工智能團隊(DeepMind)工作。
同時,蘋果還在加大對AI大模型研發(fā)人員的招聘力度。有報道稱,蘋果已經(jīng)從Meta挖角了不少大模型相關(guān)研究人員,并還在全球積極招聘大語言模型方面的工程師。蘋果官網(wǎng)顯示,關(guān)于大語言模型相關(guān)的招聘廣告就超過了600個,主要集中于優(yōu)化AI軟件的多媒體功能,包括生成圖像或視頻內(nèi)容、視覺動作與交互等。
據(jù)了解,目前蘋果的基礎(chǔ)模型團隊已經(jīng)開發(fā)出幾個先進的模型,并正在內(nèi)部測試。其中最先進的語言模型,被稱為Ajax GPT,該模型已經(jīng)接受超過2000億個參數(shù)的訓(xùn)練,據(jù)稱其功能表現(xiàn)比OpenAI此前發(fā)布的GPT-3.5版本ChatGPT更強。
不同于谷歌、微軟等大模型應(yīng)用到企業(yè)等層面,蘋果致力于在移動端使用生成式AI。不過大語言模型參數(shù)量大,需要更多存儲空間和計算能力,將其在iPhone等移動設(shè)備上運行存在難度。然而這卻并不是不可能,業(yè)界已經(jīng)有企業(yè)通過量化等各種技術(shù),來縮小模型規(guī)模,以便其能夠在終端設(shè)備上使用。
從蘋果最近的招聘信息,可以看到蘋果也有這方面的研究,比如,它要求應(yīng)聘者能夠?qū)⒆钕冗M的基礎(chǔ)模型帶入我們口袋里的iPhone。有知情人士透露,蘋果基于大語言模型的聊天機器人,最終可能會與使用蘋果AppleCare的用戶互動,另一種用途則是加強Siri,使其能夠更輕松地執(zhí)行復(fù)雜任務(wù)。
通過大語言模型優(yōu)化Siri
近一年多時間,全球消費電子市場持續(xù)低迷,蘋果業(yè)績也受到影響,根據(jù)其2023財年第三財季財報,蘋果營收818億美元,同比下降1.4%,凈利潤199億美元,同比增長2.3%。這是蘋果營收連續(xù)第三個季度下滑,其主力產(chǎn)品iPhone、iPad、Mac都出現(xiàn)一定下滑。
雖然蘋果將會在本周發(fā)布最新的產(chǎn)品iPhone15,不過就目前的形勢來看,業(yè)界對其的預(yù)測也并不好,知名分析師郭明錤認為,iPhone 15系列的需求將低于今年的iPhone 14系列。
在這樣的背景下,蘋果似乎對人工智能大模型寄予厚望。近日,庫克稱,蘋果多年來一直在研究生成式人工智能和其他模型,未來幾個月,蘋果將進一步增加用于生成式AI的研發(fā)支出。
行業(yè)人士認為,對于蘋果而言,Siri是其新研發(fā)的GPT系統(tǒng)能夠最快落地的地方,也是能夠最快改善用戶體驗的地方。將Apple GPT與Siri結(jié)合升級,很可能是效率和用戶交互體驗上的一個突破,這將是蘋果在大模型競爭中的最大優(yōu)勢。
Siri是蘋果公司在iPhone、iPad、iPod Touch、HomePod、Apple Watch、Apple TV、AppleCarPlay等產(chǎn)品上應(yīng)用的一個語音助手,利用Siri用戶可以通過手機查找信息、撥打電話、發(fā)送信息、獲取路線、播放音樂、查找蘋果設(shè)備等。
Siri可以支持自然語言輸入,并且可以調(diào)用系統(tǒng)自帶的天氣預(yù)報、日程安排、搜索資料等應(yīng)用,還能夠不斷學(xué)習(xí)新的聲音和語調(diào),提供對話式的應(yīng)答。
過去這些年里,蘋果一直在積極優(yōu)化Siri。然而不少用戶對Siri目前的效果并不滿意,甚至有網(wǎng)友稱其為“人工智障”。消息稱,蘋果內(nèi)部正在積極提高Siri的智力,預(yù)估將會在iOS 18系統(tǒng)中和大家見面。蘋果正在積極擴展Siri的技能,可以基于用戶的自然語音命令,自動執(zhí)行各種復(fù)雜的多步驟任務(wù)。就如文章開頭提到的,Siri可以根據(jù)一條語音命令,連續(xù)拍攝 5 張照片,然后自動轉(zhuǎn)換成為 GIF 動圖,并發(fā)送給指定的好友。
不過網(wǎng)友對蘋果的這個優(yōu)化各有看法,有人認為,將大模型集成到Siri里面,可能是一個錯誤方向,他表示,更希望得到一個有強大語音識別功能的AI助手,而不是一個對他口述內(nèi)容進行智能解釋的東西。
也有網(wǎng)友認為,加入新模型的Siri的可用性將大大提高,蘋果將調(diào)整參數(shù)以確保人工智能驅(qū)動的Siri不會再那么啰嗦。或許再次升級Siri,它就不會只是傻傻地甩出一個網(wǎng)頁鏈接,而是真正地對用戶需求做出解答。
小結(jié)
相對于谷歌、微軟等全球知名科技公司來說,蘋果在人工智能技術(shù)的結(jié)果展示上,看上去較為緩慢,不過深究下可以發(fā)現(xiàn),其組建團隊開始研究方面其實并不晚。當前全球消費電子市場持續(xù)低迷,蘋果業(yè)績連續(xù)多季度受到影響,而將生成式AI與其原有的技術(shù),比如說Siri等結(jié)合,蘋果可能會帶來更大的創(chuàng)新進展,這無論是對于蘋果還是AI的創(chuàng)新應(yīng)用都有意義。
-
蘋果
+關(guān)注
關(guān)注
61文章
24476瀏覽量
200003 -
Siri
+關(guān)注
關(guān)注
4文章
206瀏覽量
37109 -
生成式AI
+關(guān)注
關(guān)注
0文章
514瀏覽量
547
發(fā)布評論請先 登錄
相關(guān)推薦
評論