豆包還能“反超”嗎?
撰文 程書書
編輯 李信馬
題圖 豆包AI
DeepSeek的火爆有目共睹,自春節假期期間在社交媒體上引發廣泛討論,當下正以迅猛之勢向各個行業滲透。隨着“XXX接入DeepSeek”的消息如雪花般飛來,接入DeepSeek似乎成爲當下擁抱AI的“先進”標誌。
隨着騰訊、百度、阿里、字節等大模型第一梯隊的大廠們都相繼宣佈接入DeepSeek,“AI六小虎”中的階躍星辰和MiniMax等也都做出了同樣的選擇。
但有意思的是,騰訊、百度、阿里、字節等接入DeepSeek的程度不同。
對比來看,騰訊、百度接入DeepSeek最“深”。除了業務側產品(像騰訊的微信、騰訊文檔、QQ瀏覽器,百度的百度搜索、百度智能雲旗下應用產品等),自研的AI助手騰訊元寶、文小言(原文心一言)也都接入了DeepSeek-R1。
阿里則是業務側產品接入了DeepSeek,像釘釘支持用戶使用DeepSeek 系列模型創建釘釘AI助理、定製智能多維表格,阿里雲百鍊平臺上線全尺寸DeepSeek模型,以及1688宣佈將基於DeepSeek開發生意大模型,但給自研的大模型產品通義千問還是留有一部分獨立空間。
而字節對於DeepSeek的接入相對最“淺”,僅有火山引擎及其旗下產品和飛書官宣上線了DeepSeek系列模型。但一般來說,雲平臺通常會提供多種大模型供用戶選擇和使用,以滿足不同的應用需求。火山引擎旗下的大模型服務平臺火山方舟在此前,也上架了除自家豆包外的其他大模型,像智譜AI的GLM 模型、月之暗面的Moonshot等。至於飛書,準確來說,是飛書的多維表格中接入了 DeepSeek R1。
接入的最“淺”,是否意味着字節最爲“自信”?認爲其自研模型能達到或是趕超DeepSeek的水平?
2 月 13 日,字節舉辦了新一期的 All Hands 全員會上,關於DeepSeek的現象級熱度,字節 CEO 樑汝波反思的同時,強調了2025年的重點目標:追求 “智能” 上限,關注關鍵技術,字節的應對策略透露出戰略級的調整。
前幾天又有消息稱,前谷歌大牛吳永輝加入字節跳動擔任大模型團隊Seed基礎研究負責人,進一步釋放其堅持自研大模型的信號,未來,字節AI能否又後來居上呢?
01.
遲到的入場與資本驅動的反超
字節有這樣的發展思路其實並不令人意外。畢竟,其旗下的豆包大模型在過去一年裡已經上演了一場“後來者居上”的逆襲劇情。
時間回溯到2022年11月,ChatGPT發佈後在全球掀起了一場AI浪潮,國產大模型也隨之迎來了爆發期。2023年,衆多大廠和創新型企業紛紛亮出自研大模型產品,比如百度的文心、阿里的通義千問1.0、騰訊的混元、360的智腦、華爲的盤古、科大訊飛的星火、商湯的日日新、百川大模型,以及智譜AI的GLM等,一時間羣雄逐鹿,好不熱鬧。
然而,直到2023年1月,字節的大模型研發團隊才正式成立。
反應過來的字節,在7個月後,推出自研的“雲雀”大模型(後更名爲“豆包”),同時還推出了一款多模態大模型——BuboGPT。在之後的大模型“價格戰”中,更是打出響亮的一槍。
進入2024年,爲了在大模型追逐戰裡搶佔先機,字節一方面四處挖人:先後挖來了零一萬物原預訓練負責人黃文灝、Google 原 VideoPoet 項目負責人蔣路等。10 月份,還被曝出以八位數年薪的豪爽手筆挖走了阿里通義千問技術負責人周暢。
另一方面,字節傾注全系流量推廣豆包APP。2024年3月18日,抖音巨量廣告發布公告,限制AIGC軟件投流,從4月2日到年末,非字節系產品無人能使用抖音、頭條的巨大流量池。而根據AppGrowing的數據顯示,豆包智能助手在去年4月、5月的投放金額接近1800萬元,到6月上旬,這一數字飆升至1.24億元。在字節這種不計成本的投入下,成功讓豆包成了月活7000萬的國內頭部AI APP。
如果以往的經驗,這一賽道上,同行想要追趕上豆包恐怕是難上加難。
據浙商證券研報顯示,字節在 AI 領域的投入堪稱大手筆,2024 年的資本開支高達 800 億元,這一數字接近百度、阿里、騰訊三家總和(約 1000 億元),研發投入顯著領先於同行競爭對手。有媒體報道稱,字節計劃在2025年投入超1500億元用於資本支出。
另一方面,字節跳動早些年在移動互聯網時代積累下的成功 To C 經驗,如今也轉化爲了其獨特的差異化優勢。相較於競爭對手,字節擁有更爲豐沛海量的流量資源,能夠爲落地應用的快速起量提供強有力的支撐保障。
據不完全統計,字節在2024年發佈了接近20款AI應用,基本覆蓋了圖像、語音、音樂、視頻、3D等主流模態和場景。這種“飽和式”打法,讓字節成爲AI領域“軍火庫”最齊全的科技公司之一。
02.
DeepSeek重新定義遊戲規則
然而,DeepSeek的出現,卻改變了行業以往的規則。
首先,C端發生了肉眼可見的變化,隨着DeepSeek接連發布V3模型和R1模型後,豆包在過去一年建立的DAU優勢,瞬間被瓦解。據QuestMobile數據顯示,DeepSeek在1月28日的日活躍用戶數就首次超越豆包,2月1日突破3000萬大關。且快速增長的用戶日活還沒“花錢”。用影視圈的說法是,全是“自來水”。
讓DeepSeek從豆包、Kimi等AI智能助手App中脫穎而出的,除了其對指令的理解以及答案的更爲準確外,還有它出色的思維鏈(Long-CoT)能力。
不同於以往的AI大多隻給結果,DeepSeek模型能夠展示思考過程,包括問題複述、回顧反思、知識調用(結論的來源和引用的網站等關鍵信息)與公式化等環節等。透明的思考路徑既爲用戶提供了深入瞭解模型推理細節的機會,也能夠增強用戶對 AI 系統的信任。
而自1月份開始,阿里、科大訊飛、百川智能、月之暗面等AI企業,也開始密集爲旗下模型升級了深度思考能力。
當然,除了思維鏈模型,DeepSeek身上還有開源模式和低算力需求的優勢。前者降低了進軍AI領域的技術門檻,後者在保持高準確性的同時顯著降低了內存佔用和計算開銷。這也使得DeepSeek在to B端更有性價比。
DeepSeek技術上突破所帶來的優勢,打破了此前國內市場的競爭格局與規則,科技大廠們似乎又回到同一起跑線。
面對新的遊戲規則,相比百度、阿里、騰訊果斷接入DeepSeek的態度,字節的選擇確實更難。也選擇深度擁抱DeepSeek,那麼此前建立的優勢可能會功虧一簣;如若不,就意味着要和DeepSeek“硬剛”。
字節當下所展現出的態度,似乎更像是選擇 “硬碰硬” 式的應對。在其全員會的前兩天,豆包大模型團隊還提出了全新的稀疏模型架構UltraMem,推理速度較MoE架構提升2~6倍,推理成本最高可降低83%,看起來頗有劍指 DeepSeek 核心優勢的意圖。
長遠來看,字節未必沒有勝算,上文的競爭規律在新一輪的賽程中同樣適用。在技術側的迭代和升級速度上“持久戰”,以及做好大模型技術與各類應用、場景的深度融合工作。
字節過去一年在應用端已經打下一定基礎,在技術側方面,當下 “智能上限” 更高的 DeepSeek,同樣得直面技術迭代挑戰。
不過就當下情況來看,字節似乎處於比較被動的境地。通過接入DeepSeek,騰訊已經在C端用戶的爭奪上展現出了趕超勢頭。從2月22日開始,騰訊旗下的AI應用“騰訊元寶”,就超越了豆包,躍居中國區蘋果應用商店免費APP下載排行榜第二位,並一直維持至今。
阿里也在DeepSeek帶來的新局面下,開始加大AI技術方面的投入。阿里集團CEO吳泳銘在2月20日晚財報電話會上稱:“未來三年在雲和AI的基礎設施投入預計將超越過去十年的總和。”
擴大到全球範圍,在DeepSeek的刺激下,更多科技公司開始提速。如果不能儘快推出新的可以媲美DeepSeek的自研推理大模型,字節接下來或許將會更加的被動。
本文源自:DoNews