ICC訊 大型科技公司正忙著升級自家的大型語言模型。據(jù)報道,OpenAI和Meta即將發(fā)布各自的新版人工智能(AI)模型,他們聲稱這些模型將能夠進行推理和規(guī)劃,這是在機器中實現(xiàn)超人認(rèn)知的關(guān)鍵步驟。
本周,OpenAI和Meta的高管表示,兩家公司正準(zhǔn)備推出其大型語言模型的下一個版本,這些模型為生成式人工智能應(yīng)用提供動力。
Meta表示,將在未來幾周內(nèi)開始推出Llama 3;而OpenAI則表示,它的下一個型號,預(yù)計將被稱為GPT-5,將“很快推出”。
推理功能
Meta人工智能研究副總裁Joelle Pineau表示,“我們正在努力弄清楚如何讓這些模型不僅能說話,而且能真正進行推理和規(guī)劃……擁有記憶?!?
OpenAI首席運營官Brad Lightcap在接受采訪時表示,下一代GPT將在解決推理等“難題”方面取得進展,“我們將開始看到人工智能能夠以更精密的方式處理更復(fù)雜的任務(wù),我認(rèn)為,我們才剛剛開始觸及這些模型推理能力的表層?!?
Lightcap補充道,如今的人工智能系統(tǒng)“非常擅長一次性的小任務(wù)”,但其能力仍然“相當(dāng)有限”。
為AGI鋪路
伴隨著科技公司間越來越“卷”技術(shù),進步的步伐正在加快,它們競相創(chuàng)造更復(fù)雜的生成式人工智能——這種模型可以創(chuàng)造出與人類無異的文字、圖像、代碼和視頻,其質(zhì)量也在不斷提高。今年,谷歌、Anthropic和Cohere等公司陸續(xù)發(fā)布了一波新的大語言模型。
推理和規(guī)劃功能便是通往“通用人工智能(AGI)”的必經(jīng)之路。AGI擁有人類水平的認(rèn)知,它允許聊天機器人和虛擬助手完成相關(guān)任務(wù)的序列,并預(yù)測其行為的后果。
Meta首席人工智能科學(xué)家Yann LeCun周二(4月9日)在倫敦的一次活動上表示,目前的人工智能系統(tǒng)“在沒有思考和計劃的情況下,是一個接一個地生成單詞”,他們很難處理復(fù)雜的問題或長時間記住信息,因此他們?nèi)匀粫胺赣薮赖腻e誤”。
他表示,增加推理能力意味著人工智能模型將“搜索可能的答案”、“計劃行動的順序”,并建立一個“關(guān)于其行動將產(chǎn)生何種影響的心理模型”。LeCun補充道,這正是目前模型的重要缺失部分,而這些能力將使機器達(dá)到下一個智能水平。
OpenAI的Lightcap則表示,OpenAI很快就會對下一個版本的GPT“有更多話要說”。
Lightcap稱,“我認(rèn)為隨著時間的推移,我們將看到這些模型走向更長、更復(fù)雜的任務(wù),這就要求他們提高推理能力?!?