探訪北京新質生產力·走出實驗室 |北京智源人工智能研究院院長王仲遠: 大模型遠沒有到泡沫臨界點
"叫我仲遠吧。"相比王院長,他更習慣這個稱呼。
2024年2月,北京智源人工智能研究院(以下簡稱"智源")宣佈王仲遠成爲第二任院長,他在2018年榮獲"《麻省理工科技評論》35歲以下科技創新35人";並有微軟、Facebook(現Meta)、美團、快手的工作經歷,科技圈很想聽聽這位"85後"院長心中人工智能的當下和未來。今年3月,中共中央政治局常委、國務院總理李強在北京調研時專門來到智源,在這詳細瞭解大模型前沿技術研發情況。
在接近一個小時的專訪中,王仲遠與北京商報記者就當下人工智能行業待破的瓶頸與泡沫、中美互聯網發展的差異、國內大模型價格戰走向、智源的定位及發展規劃等問題進行了深入交流。
【行業反思】
"9.11和9.8哪個大"難倒大模型不奇怪
Q:"9.11和9.8哪個大"的問題最近難倒了一衆大模型,您怎麼看這個結果?
A:我一點都不驚訝。從研究者的角度看,大模型的驚豔感來自於它解決了人工智能之前很難解決的理解、推理、常識性問題,但它沒有解決所有的問題,比如數學。我們發現看起來很容易的數學題,大模型反而做得不好。做不好比數字大小的題,並不妨礙大模型的持續進化以及產業落地。
Q:大模型火爆一年半,業界的判斷更加理性,您認爲人工智能是否達到了泡沫臨界點?
A:還遠沒有到所謂的泡沫臨界點,這是我非常堅信的觀點,大模型大的序幕纔剛剛拉開。iPhone從誕生到迭代至大家公認好用的iPhone4、iPhone4S,有4年時間,大模型從實驗室到產業界才一年半,但我贊同大模型的能力需要持續提升,也要針對不同的場景去打磨應用。
【價格戰】
百模大戰證明我們的市場化不錯
Q:百模大戰打到現在,您依然對價格戰持保留意見嗎?
A:大模型的迭代需要持續性投入,百模大戰顯然不利於基礎大模型發展,會造成資源分散。價格戰的利好在於可以篩掉一些不是真心投入大模型研發的企業,也有利於發現場景,並且針對場景打磨應用。不過,我希望價格戰不要導致企業不敢投入研發,就好比iPhone,如果對比的始終都是第一代產品,那離想要的目標會漸行漸遠,這是我不願意看到的。
Q:如果價格戰無法避免,您對大模型toB(企業)有什麼建議?
A:想要建立toB的生態需要企業願意爲軟件付費、爲大模型付費、爲知識付費,這是我特別想呼籲的。只有形成這樣的生態,才既有利於大模型的發展,也有利於使用大模型的企業發展。
價格戰只是推動大模型普惠的一種方式,更重要的是大模型的效果。我更期待大模型能在B端找到提升效率的場景,或企業發現大模型能更好解決問題的場景,這是大模型toB需要解決的。未來一兩年內可能就會看到一些成熟的B端大模型應用出來。
大模型toC(用戶)可能需要更多的耐心,因爲用戶對於體驗非常敏感,研發人員認爲大模型面對"9.11和9.8哪個大"問題不會比大小很正常,但用戶無法接受它不會這個問題。
Q:中國互聯網曾出現過百團大戰、千播大戰,這場百模大戰可能怎樣收尾?
A:在美國,每個行業或領域出現一兩個巨頭後,其他企業就會開始打差異化。國內不管是互聯網還是移動互聯網都經歷過充分競爭,我覺得這說明我們的市場化不錯。在這種情況下,最終能勝出的企業,競爭力和戰鬥力更強。
【智源】
要做高校做不了企業不願做的研發
Q:人工智能不等同大模型,智源在大模型上的力量匹配有怎樣的計劃?
A:人工智能發展至少有三大流派,符號主義、連接主義和行爲主義,分別對應着知識圖譜、神經網絡、智能體,大模型只是神經網絡中的一個分支。大模型之所以不同,是因爲它將海量數據通過神經網絡進行壓縮,讓我們看到了它在常識、推理方面的進步。大模型確實不等於人工智能,但是大模型是當下人工智能的重要推動力,智源的願景是成爲人工智能創新引領者。我們依然會在大模型方向投入很多資源,去持續地解決挑戰性問題,但也依然會佈局大模型以外的人工智能技術。
比如,不久前智源發佈了大模型全家桶,有語言大模型上的共性研究,也有多模態、生物計算、具身智能大模型三個方向上的前沿研究,智源還在做類腦、數字心臟等研究。
Q:2018年智源在科技部和北京市委市政府的指導和支持下成立,如今人工智能是發展新質生產力的重要引擎。智源在其中扮演什麼角色?
A:智源是一家獨立的非營利性研發機構,在中國科研體系中扮演着獨特的角色。高校模式已經運行了幾十年,較難有組織、有規模、跨團隊地做系統性研發。企業也會投入做研發,但面臨着激烈的業務競爭和生存壓力,更傾向於研發與業務強相關的。智源會做高校做不了、企業不願做的研發,做3至5年甚至更長時間才能看到成果的研究項目。
Q:智源是新型研發機構,保持對重大科學問題的敏銳眼光,未來3至5年有什麼規劃?
A:2024年北京智源大會上的研究進展和成果發佈就是我們的答案,我們對整個人工智能尤其在大模型技術發展趨勢上做了判斷:從語言大模型到統一的多模態大模型,再到具身智能和生物計算模型,最終到世界模型、AGI(通用人工智能),這是我們對整個人工智能技術路線發展的判斷,主要是攻克一些技術難題。
原生的多模態大模型,從一開始就把不同模態的信息,比如文字、圖像、視頻、語音放在一個模型裡訓練,這樣的多模態大模型能像人類大腦一樣理解和推理。
大模型跟硬件結合,也就是具身智能,這是未來一個非常重要的發展方向,它使人工智能不再存在於虛擬世界,能進入物理世界服務人類。
微觀角度就是生命科學,人工智能技術可以對生命分子進行理解、建模及推理,它對於AI製藥以及整個製藥產業有重大幫助。
智源希望人工智能能夠像人類一樣對這個世界建模,最終實現AGI。
Q:爲了趕上大模型浪潮,企業面臨壓力和挑戰,智源是否也有緊繃感?
A:當下整個人工智能行業確實面臨非常多的挑戰,同時又有激烈的競爭,大家永遠都在快速奔跑的路上,最終比的是誰跑得快,又不摔倒。
智源聚焦人工智能的原始創新,焦慮感主要來自於能不能在人工智能技術領域取得國家急需的技術突破。所以智源既要明確要做什麼,又要想清楚做這些能不能真的取得突破,並且最終有利於整個人工智能乃至更大的產業發展。
【人才培養】
青年人挑大樑,年輕成爲智源的標籤
Q:作爲"85後"院長,您非常年輕,也擁有豐富的互聯網大廠經驗,您怎麼看這一標籤?
A:過去十幾年,我個人的經歷可以分爲兩大段,一段是畢業之後加入微軟亞洲研究院,那是一段偏科研的經歷,後來從一個純科研機構進入企業,將人工智能技術落地到具體的業務裡。在互聯網行業我已經不算年輕人,而是一個老兵了。
在科研機構,很多人會認爲"85後"做院長比較年輕,我想這恰恰是智源的特質。智源提倡青年人挑大樑,不論資排輩,智源很多非常重要的科研項目,都是很年輕的科研人員來承擔的。比如,我們原生多模態大模型的負責人還不到30歲,生物計算大模型的負責人才30歲出頭,具身大模型負責人也是30歲左右,與其說年輕是我個人的標籤,我更願意把它作爲智源的標籤,我也非常歡迎所有年輕、有衝勁、有想法、有能力的青年科學家加入智源,一起做未來的研究,一起做核心技術的突破。
Q:任何研發都高度依賴人才,智源在人才引進上有什麼優勢?
A:人才始終是智源這樣的新型研發機構的核心要素。智源非常重視年輕人,只要有能力、有想法、有衝勁,就能拿到最頂尖的科研崗位和項目。智源很多的資源調配,都圍繞核心和優秀的人才展開。
北京商報記者 陶鳳 魏蔚