大模型,開戰
“整個晉西北都亂成一鍋粥了。”此時此刻,《亮劍》裡的這句話用來形容大模型領域的競爭,竟然顯得意外合適。
五月剛剛過半,全球數得上名號的大模型玩家——包括OpenAI、谷歌、騰訊、阿里、字節跳動等,突然一窩蜂地拋出大動作,有能力突然全面升級的,有大模型轉爲開源免費使用的,有價格劇烈下行掀起價格戰的,景象熱鬧非凡。一開始,大家也許只是想在OpenAI預定的發佈會時間湊個熱鬧,沒想到炸出了一堆“大招”。
在這場頗具火藥味兒的軍備競賽中,我們發現,大模型的賽場上,似乎已經只剩下中美兩個大國的巨頭還能留名。“爆炸式”競爭背後,是整個領域遲遲找不到合理商業模式的困境。或許,巨頭們要因此“瘋狂”起來了。
大模型突發“爆炸式”競爭
世上的事,最怕一個“巧”字。阿里肯定會有這種想法,因爲5月這輪技術大爆炸,居然是它開頭的。
5月9日,阿里雲正式發佈通義千問2.5,模型性能全面趕超GPT-4 Turbo。在通稿中,阿里直接用上了“地表最強中文大模型”的形容,中國大模型因此進入與國外一流大模型一較高低的競技場中央。而在開源領域,通義千問1100億參數開源模型在多個基準測評收穫最佳成績,超越Llama-3-70B,同樣成爲行業最強。
彼時,距離OpenAI發佈會還有一週時間,阿里估計自己也沒想到,七天後,全球大模型領域巨頭突然集體狂飆:
5月14日,李開復領導的零一萬物正式發佈千億參數規模的 Yi-Large閉源大模型,斯坦福評測機構 AlpacaEval 2.0的排行榜上,Yi-Large 模型的英語能力主要指標僅次於 GPT-4 Turbo,Win Rate 登頂世界第一。
無獨有偶,李開復也說,一年前的中國大模型相比美國太落後,現在已經趕上,且零一萬物的下一代大模型要衝擊GPT-5的水平。
緊接着,王炸登場。5月14日,OpenAI凌晨發佈最新旗艦大模型GPT-4o,它是聽說讀畫都全能,甚至可以根據正在對話的人的語氣和狀態,自主調節回覆邏輯,全模態真人交互跟“成精了”一樣。而更讓業界震驚的是,它居然免費,付費則可以獲得五倍的使用容量。OpenAI說,GPT-4o的“o”就是“omni”的意思,包羅萬象——野心可太大了。
轉眼天亮,中國玩家又跟上節奏了。騰訊於5月14日白天宣佈,和Sora同架構的混元文生圖大模型直接開源,免費商用。評測數據顯示,這可是目前效果最好的開源文生圖模型。騰訊這個動作,倒是很有其一貫的風範,你們都卷是吧,我直接把使用門檻取消,先搶用戶再說。
白日落幕,5月15日凌晨,谷歌召開2024 I / O 開發者大會。這是一場很急的大會,因爲谷歌一口氣扔出來十多款產品,堪稱AI“大亂燉”,目的就是狙擊OpenAI。其中,包括Gemini 1.5 Pro正式開放給訂閱了Geminni Advance的用戶,上下文窗口拓展到200萬token,推出開源模型Gemma2.0、文生圖像模型Imagen3、視頻生成模型Veo等。
5月15日下午,字節跳動上場了。在2024 春季火山引擎Force原動力大會上,字節發佈豆包大模型家族,同樣包括多模態大模型。豆包就是原來的雲雀大模型,據字節披露,目前豆包大模型日均處理1200億Tokens文本,生成3000萬張圖片,全平臺用戶超過2600萬,應用下載量也位居AIGC行業第一。
僅僅是總結這些巨頭的發佈動作,便已經讓人看花了眼。要知道,這裡面還不包括那些不發新品,但是開打價格戰的鐵血玩家們。從年初Kimi的爆火開始,大模型領域的熱度和討論度似乎又到了新的臺階,所有大廠都在此時用實際行動表態:過去一年,它們都在養精蓄銳。現在,巨頭要讓大模型領域燃起硝煙了。
混亂之中,寡頭格局已成型
其實,從這些動態中,我們也能讀到一點別的意味:中國和美國的大模型巨頭,基本上是在每天輪流唱大戲。白天中國公司放消息,晚上美國公司又頂上,這才連續震撼了行業。而這個過程呢,隨便哪個名字都是行業裡無人不知無人不曉的。其實,這就是兩個趨勢了。
第一個趨勢,是大模型行業的寡頭格局已經形成了。典型的特徵是,上述炸場動態基本都是巨頭大模型產品的重磅升級迭代或者商業上的重要變化,並沒有哪個新玩家蹭上這波熱度。
實際上,對一個剛剛火起來沒多久的行業來說,這麼快進入寡頭競爭有點讓人驚訝。但考慮到大模型發展本質上是算力、數據、算法三方面的大比武,只有巨頭和資源能力強的玩家能做,也並不奇怪。一開始,這個行業就只給很少的企業留了機會。像Kimi這樣有點技術的,也是靠着差異化的長文本打法纔有機會成長起來,結果也迅速讓阿里、百度等巨頭比下去了。
第二個趨勢,就是國家問題了。大模型的國際態勢已經很明顯了,和互聯網差不多,又是“美領跑,中緊跟,其他區域跟不上”的態勢。唯一一個可以算得上例外的,應該是歐洲獨角獸Mistral AI。但是,這家公司能有個競爭位置,依然是因爲OpenAI看好它。這個行業,確實沒有中美之外的其他可能性了。
所以,我們不如來想一想,假設現在的寡頭們都能繼續走下去,他們會怎麼塑造市場格局?贏者通吃還是多個贏家並存?這比較難判斷,但要說大模型能一直“無序”競爭,資源肯定是不足的,至少英偉達連顯卡都生產不過來。既然這樣,通過對大模型領域進行分層,我們可以略微推導一下這些公司的發展方向。
一方面,是行業大模型和基礎大模型的分層。這次一起拱火的巨頭們,都是基礎大模型的一把好手,所以我們不妨看看沒有蹭這次熱度的大模型玩家在做什麼——像科大訊飛、商湯等大模型玩家,其實已經在重點發展行業賽道。科大訊飛星火大模型,和商湯日日新大模型,都已經在汽車、教育、工業等賽道探索落地。而今天字節的發佈會上,字節也請來了捷途汽車相關部門負責人等,講述大模型的行業應用,併發布智能終端大模型聯盟,矩陣式進攻。
其實,這是一條不錯的路。“基礎大模型→行業大模型→終端應用”,是行業比較認可的發展路線。基礎大模型非常吃資源,也就是超級巨頭才卷得過。而行業更需要垂直領域的Know-How,懂行業、懂客戶,就能取得一定的成果。
另一方面,是開源大模型和閉源大模型的交鋒。OpenAI和谷歌爲代表的巨頭,採用閉源大模型,而阿里、騰訊、Meta、Mistral AI,都在開源上下功夫。要強調的是,這並不絕對,比如Meta和Mistral AI都是主要把精力放在開源上,而阿里騰訊都是兩者兼有,但對開源的態度很開放。OpenAI則是關起門來自己玩的純閉源選手。
至於爲什麼要開源,或者要兩手把握,原因就像前面說騰訊的時候提到的那樣,開源模型意味着垂直行業的公司想用,就不用從頭訓練大模型,其實間接減少了對閉源大模型的需求——作爲巨頭,我閉源幹不過你,直接讓用戶先用上便宜好用的大模型也可以,你的客戶少了,我反正更安全。
說到底,現在大模型並沒有一個真正意義上特別穩定的商業模式,賣會員、賣行業大模型,都只是階段性嘗試而已。整個階段,這些巨頭一方面在想搶客戶,另一方面其實需要防備客戶太傾向哪個大模型。於是,我們就在這場集體爆發裡,看到了這麼多的“拉扯”。
拼落地,商業模式仍缺思考
那麼,現在大模型行業對商業模式的思考和探索,具體到哪一步了?現在,它們有什麼明確的競爭焦點了嗎?這些問題,都是有答案的。
先來看最基礎的商業模式表現,雖說行業確實有點迷茫,但正面的進展是不少的。比如,字節跳動豆包平臺上已經有超過800萬個智能體被創建,2600萬的用戶量也在行業高度領先;零一萬物透露,其海外生產力應用總用戶接近千萬,今年C端單一產品收入已經達到1億元;通義通過阿里雲服務企業超過9萬、通過釘釘服務企業超過220萬,就連小愛同學也和阿里牽手;百度則表示,已經有近10萬家企業調用文心一言能力,百度文庫的AI能力,每天有250萬用戶都在用。
說起來,商業化無非就是兩派——GPT、Kimi、文心一言會員、豆包等平臺上的智能體,都是C端應用的代表;反之,阿里把通義大模型嵌入釘釘、科大訊飛和商湯給客戶定製的行業大模型,則是B端應用的代表。出現這種劃分,其實也就是公司基因的繼承,像阿里、騰訊、字節等公司本身就是雙端業務拓展,B端和C端自然都能做,而商湯這種一開始就做B端業務的公司,要用AI拿到新訂單也更容易。
所以,嚴格來說,大模型的商業化落地其實要思考“AI+”(以AI技術賦能行業的科技企業)還是“+AI”(採用AI技術的傳統企業)的問題。目前,無論是GPT這種“技術即產品”的方式,還是阿里、科大訊飛定製化和嵌入化的方式,目前都沒有突破傳統商業模式的範疇,估計不一定是大模型的終極形態。
更嚴峻的問題是,我們必須承認,當阿里、騰訊都在開源,當GPT的能力、谷歌Gemini的能力都有所重合,無論B端還是C端客戶,選擇單一大模型的動力其實有點弱了。因爲大模型的基礎能力都差不多,無非是這個月我第一,下個月你第一,很難分出差異來。這個時候,競爭的焦點其實不在能力上。
在哪呢?QuestMobile數據顯示,截至今年3月,基於大模型的AIGC行業用戶量爲7380萬,和移動互聯網幾十億用戶比起來真是“灑灑水”的程度。爲什麼大衆沒那麼樂意用呢?因爲開源模型要部署,而收費的模型真的不便宜。文心一言的用戶數已經突破2億,專業版連續包月也要49.9元一個月,你說其中能有多少付費會員?
如果用戶規模不夠,從實戰收回的反饋數據就不夠,大模型要向能用、好用的水平發展,就會更麻煩。所以,爲了讓大模型加速落地,價格戰已經打起來了。
行業其實有個平均水平,0.12元/千tokens。但是,這根本限制不了巨頭大降價的決心。
字節是個狠人,豆包模型在企業市場的定價低到了0.0008元/千tokens,比行業均價便宜99.3%。炸場的OpenAI價格也很炸裂,API價格打五折,速度還提高一倍,新推出的text-embedding-3-small模型,價格僅爲上一代的五分之一,每1000個tokens的價格從0.0001美元降低到0.00002美元。
另外還有一些默默用價格卷同行的玩家,比如智譜AI,入門級產品GLM-3 Turbo,一塊錢就能買100萬tokens。
爲什麼卷生卷死?還不是因爲單純的技術競爭,其實已經暫時無法出現質的變化,最大的代表就是,OpenAI的GPT-4o很驚豔?很可能是GPT-5有點難產,才只能用這種進步來搪塞一下市場。
而大模型壞就壞在,這個領域太新了,如果沒有新的技術把水攪渾,一旦用戶開始習慣了用某個大模型,市場格局就會很危險。所以,沒有人希望這個領域太冷清,越熱鬧、越瘋狂,才能保證自己不被洗出局。這個領域沒有“王”,不管中國公司還是美國公司,比的就是誰敢闖、誰更狂。