壓力給到了張一鳴
作者 | 劉寶丹
編輯 | 周智宇
2025年的春節,本應是字節跳動AI產品豆包的高光時刻。然而,隨着DeepSeek-R1的開源與用戶量爆發式增長,以及騰訊元寶“借力打力”,打亂了字節原本的步伐。
這輪AI浪潮裡,字節本就是個後來者。2023年,字節纔開始在內部會議上討論GPT,過去兩年加緊對AI進行了大量投入,包括大手筆的投流。
憑藉這種大力出奇跡的模式,字節豆包用戶量突破7500萬,去年底成功躋身第一梯隊。然而,頂流的位子還沒坐穩,字節就遇到了DeepSeek。
字節也開始反擊。華爾街見聞從知情人士處獲悉,豆包已小範圍測試深度思考模型的不同實驗版本,這較其原本規劃大幅提前。更多變化也在悄然發生,3月3日,字節技術團隊宣佈,中國首個AI原生集成開發環境(AI IDE)Trae 國內版正式上線,支持切換滿血版DeepSeek R1、V3模型。
問題在於,面對DeepSeek的“技術奇襲”,字節的工業化流量思維,能否讓它拿到 “新時代船票”,要打上個問號。
在上週民企座談會上,新質生產力企業Deepseek創始人樑文鋒、宇樹科技創始人王興興、馬雲、馬化騰等受邀參會,張一鳴卻未能入列,此中深意,意味深長。
從今日頭條、抖音到TikTok,字節憑藉推薦算法打造出三個爆款APP,並藉着直播電商的東風一舉成爲互聯網新王。然而,國內用戶增長見頂疊加全球化遭遇監管風險,字節業績增長被迫放緩,AI成爲解題關鍵。
被冠以“應用工廠”之稱的字節,能否打造出AI時代的超級應用,決定着公司未來能否繼續衛冕王位,而DeepSeek的出現意味着,這條路遠比字節想象的更難走。
豆包受阻
去年下半年,字節通過“流量灌溉+價格屠刀”的組合拳,將豆包推上了國內AI對話應用的榜首。QuestMobile數據顯示,截至2024年12月,AI原生APP月度活躍用戶已經突破1.2億,同比增長232%,豆包月活躍用戶規模爲7523萬,位居行業第一,正在加速追趕Open AI旗下的ChatGPT。
然而DeepSeek爆火,打斷了豆包的節奏。QuestMobile數據顯示,2月1日,DeepSeek APP端日活用戶就已經突破3000萬,它成爲史上最快突破3000萬用戶的應用。2月13日,騰訊元寶宣佈接入DeepSeek-R1滿血版,同時支持混元和DeepSeek兩大模型。2月22日,元寶超越豆包,升至中國區蘋果免費APP下載排行榜第二。
AI原生APP三強格局本是豆包、Kimi和文小言,如今主角已經變成DeepSeek、元寶和豆包,且豆包的增長勢頭不如前兩者迅猛。短短兩個多月,AI頭部應用就迎來大換血,可見競爭之激烈。
更重要的是,騰訊將微信生態與DeepSeek的技術優勢結合,構建了“社交+AI”的護城河,相比之下,字節的豆包仍侷限於獨立APP形態,缺乏生態協同的縱深。
字節也在謀劃反攻。近日,很多用戶在使用豆包APP時發現,生成的回覆中會顯示思維鏈(Chain-of-Thought)。接近字節人士表示,這是在小範圍測試深度思考模型。華爾街見聞從投資機構人士處獲悉,字節的推理模型預計3個月之後會推出。
該人士認爲,自從DeepSeek R1上線並開源,推理就已經成爲AI應用中的必備功能,豆包上線推理功能在意料之內。推理可以像人一樣分析問題,回答更有邏輯性。上述投資機構人士表示,通用基礎模型像知識庫,推理模型像學霸,前者記憶力超強,擅長生成流暢文本、回答常見問題,但複雜邏輯容易出錯,而學霸會先理解問題本質,再分步驟驗證邏輯鏈。
事實上,在此之前,國內大模型已有推理功能。月之暗面是國內發佈推理模型的獨角獸之一,2024年11月,Kimi 正式發佈新一代數學推理模型 k0-math,在多項基準能力測試中,該模型的數學能力可對標全球領先的 OpenAI o1 系列可公開使用的兩個模型:o1-mini和o1-preview。
Kimi創始人楊植麟此前曾對華爾街見聞表示,基於強化學習、合成數據和思維鏈的新技術,將提升AI在各個領域和場景的推理能力和智能水平上限,更強大的推理能力,將會幫助每個用戶解鎖更多有挑戰性的工作任務。
2月20日,阿里巴巴集團CEO吳泳銘在財報會上表示,阿里將於近期發佈基於千問Qwen2.5-MAX的深度推理模型。5天后,阿里Qwen團隊宣佈發佈新推理模型——深度思考 (QwQ) ,該模型是一個基於Qwen2.5-Max的推理模型,擅長數學理解、編程、AI 智能體等。推理模型已經成爲兵家必爭之地。
對豆包來說,快速補齊推理功能,更好吸引用戶的關注和使用,這是當務之急,只有如此纔有可能改變用戶快速向元寶和DeepSeek聚攏的趨勢。
華爾街見聞從字節內部人士處瞭解到,其實字節早就注意到了推理模型,只是當時沒有給予足夠的重視。
2月13日,在字節新一期All Hands全員會上,字節CEO樑汝波表示,去年9月Open AI發佈長鏈思考模型引起關注後,字節意識到技術重大變化,但沒有覺得要馬上覆現出來。他直言,如果字節一開始重大問題就爭先,有機會更早實現。
這已經不是字節第一次對AI反應滯後。一年前的全員會上,樑汝波就曾表示,公司對機會的敏感度不如創業公司。公司層面的半年度技術回顧,直到2023年纔開始討論GPT,而業內做得比較好的大模型創業公司都是在2018年至2021年創立的。
對於推理模型,直到今年1月,豆包大模型1.5Pro正式發佈,該模型在能力升級基礎上進一步提升多模態能力,它使用MoE架構,並通過訓練-推理一體化設計,探索模型性能和推理性能之間的極致平衡。
華爾街見聞獲悉,字節嘗試用大規模RL的方法不斷提升模型的推理能力,在完全不使用其他模型數據的條件下,通過RL算法的突破和工程優化,充分發揮TestTime Scaling的算力優勢,完成了RL Scaling,研發了Doubao深度思考模式。
據字節內部人士介紹,字節階段性成果Doubao-1.5-pro-AS1-Preview在AIME上已經超過O1-preview、O1等推理模型,隨着RL的持續,模型能力還將不斷提升。
可以確定,豆包全面上線推理功能只是時間問題,關鍵還在於能否打破現有推理能力的限制。
對豆包團隊來說,真正的難點不在於推出推理模型,而是比肩甚至推出能超越DeepSeek R1的推理模型。否則,在如今激烈的競爭中,豆包還會處於被動應戰的狀態。
軍備競賽
AI已成兵家必爭之地,尤其擁有資本和人力資源的大廠,更是持續下注。
2月24日,阿里巴巴集團CEO吳泳銘宣佈,未來三年,阿里將投入超過3800億元,用於建設雲和AI硬件基礎設施,總額超過去十年總和,創下中國民營企業在雲和AI硬件基礎設施建設領域有史以來最大規模投資紀錄。
在阿里之前,字節已經給出了明確的預期,同樣是大手筆投入。根據浙商證券報告,字節2024年資本開支達到800億元,2025年有望達到1600億元,其中約900億元將用於AI算力的採購,700億元用於IDC基建以及網絡設備如光模塊、交換機。
字節AI方向是基礎模型和應用兩手抓,公司試圖在科技創新與商業化落地的天平上尋找支點。
華爾街見聞獲悉,字節2025年的關鍵詞是“務實的浪漫”,要把想象變成現實,相較於科技公司的定位,字節強調要做創新科技公司。年初,字節豆包大模型團隊已在內部組建AGI長期研究團隊,代號“Seed Edge”,鼓勵項目成員探索更長週期、不確定的和大膽的AGI研究課題。
接近字節的知情人士透露,Seed Edge的目標是探索AGI的新方法,鼓勵跨模態、跨團隊合作,目前初步確定了五大研究方向,包括探索推理能力的邊界、探索感知能力的邊界、探索軟硬一體的下一代模型設計、探索下一代AI學習範式、探索下一個scaling方向。當然字節也在探索應用轉化,重點在聚焦新型交互入口開發,涉足AI眼鏡、智能耳機等硬件載體;同時,字節強調通過規模效應推動豆包等產品的用戶滲透。
據不完全統計,字節在應用端的佈局涵蓋了助手、虛擬社交、圖像等各類場景,應用產品超過20款。去年下半年以來,豆包用戶量迅速拉昇,並率先破億。即夢2024年5月上線,目前周活超過200萬。近日,即夢還挖來原零一萬物PopAI產品負責人,負責移動端業務,向剪映負責人張楠彙報。
值得一提的是,3月3日,中國首個AI原生集成開發環境(AI IDE)Trae 國內版正式上線,配置Doubao-1.5-pro,並支持切換滿血版DeepSeek R1、V3模型。Trae對代碼補全、代碼理解、Bug修復、基於自然語言生成代碼等開發過程全場景都有非常好的適應性。
如果沒有DeepSeek橫空出世,外界對AI應用的關注焦點本在字節系,然而現實已經發生了鉅變。DeepSeek把中國AI產業往前帶了一大步,也將這場AI競賽的難度上升了一個維度,給其他模型公司造成了競爭壓力,尤其是風頭正盛的字節。
算法爭議
對字節來說,All In AI既是對未來的佈局,也是來自現實的壓力。其曾經成功的商業模式,算法分發正在引起更多的爭議和不滿。
過去十餘年間,張一鳴打造的字節帝國憑藉“數據-算法-流量”的魔法,在移動互聯網時代完成逆襲。這套精密運轉的工業化流水線,藉由敏捷開發模式精準捕捉用戶需求,用數據驅動組織運行,以內部賽馬機制激發創新活力。
但字節所依賴的算法,製造了無數信息孤島和信息繭房,也在一場場輿論事件中成爲焦點。
去年11月20日,農夫山泉創始人鍾睒睒在出席活動時喊話張一鳴,表示對方把網絡變成一種技術算法,在玩弄民衆智商。他呼籲:“算法應該明白無誤地公佈於衆。”“對於流量及其謠言以金錢的獎勵和激勵,把網絡變成一種技術算法,變成一種玩弄民衆智商的遊戲,這是不可以的。”
11月24日,中央網絡安全和信息化委員會辦公室秘書局聯合工業和信息化部辦公廳等部門開展“清朗·網絡平臺算法典型問題治理”專項行動,重點整治同質化推送營造“信息繭房”、違規操縱干預榜單炒作熱點、盲目追求利益侵害新就業形態勞動者權益、利用算法實施大數據“殺熟”、算法向上向善服務缺失侵害用戶合法權益等重點問題。
字節也作出了迴應。12月2日,抖音集團副總裁李亮公開表示:“各大平臺都在使用算法,算法並沒有那麼複雜和神秘。但算法的科普做得不好,透明度不夠,同時對於謠言與網暴識別與打擊力度不夠,這個確實是我們平臺公司需要加強的。”
1月3日,抖音宣佈將建立安全與信任中心,切實推動算法和平臺治理透明化。這是字節第一次明確表態,要將算法的秘密進行公開。
抖音方面表示,將以安全與信任中心爲依託,重點介紹社會關切的議題,包括算法原理,審覈機制,打擊網暴、謠言等平臺治理工作。
近日,字節開始披露平臺治理進展,2024年,今日頭條攔截不實信息超500萬條,抖音生活服務處置違規短視頻超74萬條。
算法爭議背後,字節基於算法的短視頻業務近年來增速持續放緩。字節投資AI的底氣主要來自持續貢獻現金流的主業,主業承壓無疑加重了字節佈局AI的風險。
華爾街見聞從字節內部獲悉,2024年抖音電商的GMV約3.5萬億元,增速已經回到30%的量級。爲了提升電商競爭力,巨量引擎旗下的電商廣告平臺巨量千川近日將被整體併入抖音電商,成爲其二級部門,同時,分別服務於兩個部門的算法團隊也被合併。
扛起全球化大旗的TikTok在美國仍面臨監管壓力,未來發展面臨極大的不確定性。飛書、朝夕光年、大力教育等經過上一輪收縮後,目前都比較低調,字節甚至未在全員會上提及這些業務。
近年來,互聯網行業普遍進入降本增效階段,字節整體處於戰略聚焦狀態,對其他多元業務大舉收縮,這也是字節爲AI騰挪更多資源和空間的無奈之舉。
豪賭未來
字節的AI戰略非常堅定,這是張一鳴集全公司之力對未來的一場豪賭。
華爾街見聞獲悉,字節內部從資金到人力,都以AI爲第一優先級,張一鳴更是親自盯豆包產品,並會不時給出產品建議。
張一鳴去年以千萬年薪招攬阿里通義大模型原技術負責人周暢,引發字節和阿里兩家公司的紛爭。去年底,周暢因違反競業協議跳槽字節,已遭到阿里起訴索賠。今年初,字節又招攬來了谷歌DeepMind原研究副總裁吳永輝等在內的諸多人才。
去年底,豆包概念股爆火,中科藍訊、三維通信、掌閱科技等相關公司漲幅一度超過10%。爲此,字節跳動12月19日發佈風險提示稱,資本市場出現炒作“豆包概念股”現象,流傳着衆多誇大其詞甚至是虛構的內容,請投資者切勿輕信市場傳言。
估值方面,根據美國證券交易委員會(SEC)去年11月的文件,投資巨頭富達投資和普信集團分別將字節估值調至4100億美元和4500億美元,高於2022年7月的低點2750億美元。在業內看來,字節估值上升已經反映了投資者對AI業務的關注。
不過,拼命追趕AI浪潮的字節,也面臨財務壓力與時間窗口的緊迫性。在全員會上,字節CFO高準明確地說:“公司現在的成本和支出增速要大於收入和利潤增速。”
顯然,DeepSeek等競爭對手的快速崛起壓縮了字節的技術窗口期,迫使公司必須在有限時間內實現突破。字節的試錯空間正在收窄。
一位關注AI的投資機構人士對華爾街見聞表示,字節有短視頻在內的龐大應用生態,也有火山引擎在內的算力資源,但DeepSeek跑出來主要是因爲有足夠的創新定力,這是字節需要提升的部分。
早在2021年,字節人數就已突破10萬,公司最大的危機感是組織平庸化。今年全員會,字節的重點之一仍是組織管理,對抗大公司病,今年提法換成了 “不官僚、不內卷”,要減少不該有的流程,提高決策效率。
13年前,張一鳴創立了字節跳動,並在五年內接連推出今日頭條、抖音、TikTok這三個爆款應用,彼時字節是以創業公司的狀態運行,公司人數只有萬餘人。如今,字節已經是互聯網行業巨頭,無論是早期對AI前沿技術的判斷,還是對推理模型的反應,字節都慢了半拍。
去年底,崑崙萬維創始人周亞輝對字節覆盤時表示,字節23年AI戰略是不及格,但這完全不影響字節 24年AI戰略的滿分表現。在他看來,字節組織快速迭代能力極強。然而,AI技術迭代轉瞬即逝,DeepSeek轉眼就超過了豆包。
字節用了兩年時間才從百模大戰中勝出,成爲AI頂流,然而公司還沒有喘息多久,以DeepSeek爲代表的AI技術創新呼嘯而來。留給字節和張一鳴的時間,已然不多了。