DeepSeek讓騰訊阿里重新上桌了

“領導都認真了”

春節復工之後,在深圳一家傳統企業擔任行政崗位的棘棘,被通知她多了一項工作內容:“用DeepSeek完成部分工作、提升工作效率,部門領導要求每週梳理上報AI工具使用成果。”

這讓她感到驚訝,“我們是傳統行業,雖然之前有使用一些AI技術,但是僅限於研發同事,沒有涉及到我們行政部。”棘棘爲此犯起了嘀咕:“行政日常不過是收發快遞、貼發票、跑跑腿,有必要用AI嗎?”

但很快,她就意識到這一次公司領導層尤爲認真。據她透露,在短短几天之內,公司迅速組建出一個“AI戰略部”,還從外部請來講師培訓全體員工使用DeepSeek,並且要求所有部門按周提交成果。推行AI的力度也是前所未有——培訓會上有領導講到,從下個月開始,公司計劃逐步優化掉部分可用AI替代掉的崗位人員。

在北京一家互聯網公司總部工作的秋然,也感受到了DeepSeek捲起的熱潮。

她向鳳凰網科技回憶道,節後復工約一星期後,公司向全體成員發送了一條通知,大意爲:“請各位同學集思廣益,深入思考DeepSeek可能爲業務帶來哪些促進,或者可以落地在什麼場景中,並提交思考成果。”

技術支持部門的動作很快,藉助DeepSeek的開源思路便搭建了一些工具。秋然稱:“我們作爲互聯網公司,本身就有AI方面的能力儲備,而且業務形態已經很成熟了,所以之前老闆一直是非常謹慎的,不願意刻意向外求、爲了AI而AI。”

但DeepSeek打破了此前的所有猶疑,“聽部門領導說,老闆覺得如果此時不做動作,可能就要在這一波里被甩下了。”秋然透露。

老闆們的緊迫感不難理解,DeepSeek效果驚豔,這直接促進了各家的決策。棘棘告訴鳳凰網科技,員工私下裡悄悄交流,發現領導層都被DeepSeek的效果“震到了”,“之前ChatGPT、Claude發佈的時候,公司也有小範圍讓業務同事試用過,但都是各有各的‘智障’,過幾天就不提這事了。”

DeepSeek打破了這種對AI是“人工智障”的刻板印象,棘棘講道,據她從新成立的AI部門同事處瞭解,公司甚至還在考慮加大AI技術方面的投入。

如果說小公司的判斷還有失誤的可能性,那麼巨頭的動作,無疑就是這個行業的真正風向標。

2月20日晚,阿里發佈財報,阿里集團CEO吳泳銘在財報電話會上稱,“ AI時代對於基礎設施有明確而巨大的需求,將積極投資於AI基礎設施建設,未來三年在雲和AI的基礎設施投入預計將超越過去十年的總和。”

“阿里也正在AItoC業務層面大舉地招兵買馬”,一位與阿里有過接觸的候選人士對鳳凰網科技表示,“看得出來,非常積極”。

就在幾天之前,騰訊同樣宣佈組織架構調整,主要針對AI產品線,繼騰訊元寶從TEG(技術工程事業羣)轉入CSIG(騰訊雲與產業事業羣)之後,QQ瀏覽器、搜狗輸入法、ima等更多產品和應用也會匯入CSIG。

騰訊也是這一輪最先接入DeepSeek的巨頭,微信在接入DeepSeek-R1後迅速掀起市場波瀾。

AI的發令槍,已經響了。

狂歡與隱憂並存

儘管新涌入者很多,但身處其中的一些人並不感到意外,在蘇州一家智能製造企業擔任CTO的馮牧便是其中之一。

他告訴鳳凰網科技:“成本、技術、環境,各方面的因素共同造就了行業的狂歡。對很多我們這樣的企業而言,自己並沒有深厚的大模型研發能力,在產業革命的過程中是很被動的,而DeepSeek開源了這樣強大的模型,(爲我們)提供的是一劑良藥、一個蕩平從0到1技術壁壘的方法論。”

如他所言,上游技術創新所帶來的利好自然流淌到了下游環節。但與此同時,壓力也給到了與DeepSeek同處於基座大模型研發環節的友商。

同樣有着出色研究能力的企業,開始反思自己到底錯過了什麼。

DeepSeek V3與R1的最大功能亮點,是尤爲出衆的思維鏈(Long-CoT)能力。

月之暗面研究員Flood Sung透露,早在一年多以前,月之暗面聯合創始人周昕宇就已經驗證了長思維鏈的有效性,但公司先意識到了長文本(Long-Text)的重要性,以及考慮到成本問題,讓Kimi選擇了優先選擇攻關長文本功能。

在DeepSeek爆火前,這一路線也完全沒有問題。

2024年,月之暗面一度借長文本成爲國內最炙手可熱的大模型創企,但長文本的商業化場景始終不夠明朗,如今仍在探索過程中。

馮牧向鳳凰網科技解釋道:“你可以把長思維鏈理解爲對複雜問題的解決能力,當大模型擁有了推理思維,那麼在編程、數學計算等等領域的應用能力就會提升。這也是爲什麼DeepSeek要對標OpenAI的o1大模型,後者也是一個標榜思維能力的大模型。”

馮牧強調了o1與DeepSeek V3發佈的時間差:“o1正式版是2024年12月初發布的,V3是12月末發佈的,而這兩者的性能是可以掰手腕的。我們之前總說國內大模型和國外發展差了幾年,至少在這類模型方面,DeepSeek幫我們把差距抹平了一些。”

驚豔的效果,也讓DeepSeek迅速下沉,撬動了過去任何一家大模型公司都沒能撬動的用戶盤。

QuestMobile統計顯示,DeepSeek在1月28日的日活躍用戶數首次超越豆包,並於2月1日突破3000萬大關,成爲史上最快達成這一里程碑的應用。而隨着各大手機廠商、微信等企業官宣接入DeepSeek,流量瘋狂涌向後者的態勢還是有增無減。

這樣的背景之下,從互聯網時代沿襲而來的大力投放模式還有效嗎?鳳凰網科技詢問百度、騰訊、崑崙萬維等企業,接下來是否考慮大模型產品調整投放策略,截至發文暫無回覆。

但從數據中,或許可以看到市場的答案。

AppGrowing數據顯示,近日豆包App、Kimi等廣告投放量大幅減少,幾乎降低至近180天的最低水平。

圖|Kimi近180天廣告投放量級變化情況,圖源/AppGrowing

那些未被察覺的改變

數天之前,DeepSeek悄悄撤下了張貼在辦公樓下的LOGO。那是DeepSeek風暴席捲而來半個月後,作爲DeepSeek與英特爾、中金、德州儀器等公司共享的辦公所在地,北京的融科資訊中心意外成爲一個景點。

DeepSeek猶如一條鮎魚,攪動市場。就連在DeepSeek樓上辦公的百度風投,也無法躲避,被質疑距離如此之近卻錯過投資機會。引得百度風投CEO高雪不得不親自下場迴應,申明是對方無意外部融資。

儘管DeepSeek刻意低調,但今天開始,許多人的工作仍舊和DeepSeek密不可分了。

除了思維鏈模型,DeepSeek身上的獨特標籤還有開源模式和低算力需求。而這三點幾乎跳脫於國內市場主流玩家押注的所有玩法,甚至重新定義了遊戲規則。

原本固守閉源路線的百度,決定從4月1日零時起,允許所有PC端和APP端用戶免費使用模型服務,並且計劃從下一代模型起正式開源。

作爲長思維鏈代名詞的“深度思考”功能,也開始成爲了諸多大模型主打的核心標籤。無論是百度、阿里、字節,還是科大訊飛、百川智能、月之暗面等AI企業,從1月份開始密集爲旗下模型升級了深度思考能力。

該怎麼看待DeepSeek另闢蹊徑給出的答案?

“沒有人敢下定義說它就是對的,只能說的確是一種不可忽視的創新。”AI領域連續創業者、北京市朝陽區一家AI大模型訓練服務企業創始人這樣告訴鳳凰網科技。

“有關開源還是閉源的模式,我也想過很久,最後得到的答案是這是囚徒困境——如果閉源,作爲初創公司,有誰會來用你的東西?你憑什麼和大廠競爭?所以初創公司只能開源,但開發者們肯定是唯效果論,那在DeepSeek之前,全球最好的開源模型是海外的Llama,你該怎麼追上Meta?”他講道,“所以我最開始的預測是,國內的大廠快速軍備競賽,做出一些效果還不錯的模型,然後開源一部分,千行百業都集中用大廠的基座。”

這位創業者承認,自己並未預料到DeepSeek能在這場有關背景實力的競賽中脫穎而出。如今就職於西二旗一家大廠,曾有硅谷工作背景的算法工程師,也表達了類似的情緒。

這股席捲了市場的“DeepSeek效應”,還蔓延至產業鏈上游。

根據DeepSeek公開相關論文中的表述,訓練V3的僅僅使用了280萬GPU小時。而按照OpenAI創始成員之一Andrej Karpathy解讀,作爲對比,同等性能的模型訓練成本卻是DeepSeek的十倍多(Llama 3 405B使用了3080萬GPU小時)。

正因如此,DeepSeek-V3與R1模型被譽爲“有限算力下的美妙工程”,也引起了市場對持續已久的GPU淘金熱的反思。

DeepSeek發佈後,全球GPU龍頭英偉達股價一度大跌,其中單日跌幅最大達到了17%。不過截至成文,英偉達股價已基本回升至本輪下跌前水平。

儘管如此,當DeepSeek指出一條更經濟的道路,下場玩家們還要不要繼續沉湎於這場有關算力資源的“無限戰爭”?接下來或許有人會給出更保守的答案。

(文中馮牧爲化名)

本文源自:鳳凰網科技