AI週報| OpenAI最大“期貨”Sora開放使用;谷歌發佈量子芯片突破
OpenAI最大“期貨”Sora開放使用
當地時間12月9日,OpenAI宣佈正式向用戶開放AI視頻生成模型Sora,此時距離OpenAI首次公開展示Sora已過去大約10個月。據介紹,Sora將於當天晚些時候向美國及其他市場的ChatGPT付費用戶開放Sora Turbo版本,這是一個生成速度更快的版本。Sora展示的新功能包括用戶可使用Remix工具,替換、刪除或重新設計視頻中的元素。此外,用戶還可以找到最佳的幀並在此基礎上擴展成一個場景(Re-cut),還可以在時間軸上編輯視頻的獨特序列(Storyboard)、使用Loop工具剪輯並要求Sora生成無縫銜接的重複視頻、將兩個視頻合併爲一個無縫銜接的視頻(Blend)等。
點評:此次Sora提供的新功能更方便用戶創建視頻生成的工作流,讓Sora在用戶手中變得更加可控。值得注意的是,使用Sora並不便宜,目前只有ChatGPT Plus訂閱用戶和ChatGPT Pro訂閱用戶可以使用Sora,其中只有ChatGPT Pro訂閱用戶可以生成單個20秒的視頻,ChatGPT Pro訂閱費達到每月200美元。這麼高的訂閱費將很多ChatGPT用戶放在門外,具體Sora的效果如何,還有待更多用戶反饋。
谷歌發佈量子芯片突破
12月10日,谷歌在官網發佈了其量子計算最新進展,其最新研發的量子芯片Willow在不到5分鐘內就完成了一個基準測試任務,而即使是如今最快的超級計算機,也需要花費“10的25次方”年的時間才能完成這項計算,這個數字遠超宇宙年齡。谷歌表示,隨着團隊使用更多的量子位進行擴展,Willow可以成倍地減少錯誤,解決了該領域近 30 年來一直在研究的量子糾錯的關鍵挑戰,爲實用的大規模量子計算機鋪平了道路。
點評:谷歌最新的量子芯片是向大規模、糾錯量子計算機邁出的一大步,谷歌量子人工智能創始人兼負責人哈特穆特·內文介紹,它的糾錯能力和超越經典的計算能力使我們更接近一個可以提供商業應用的系統,從幫助發現新藥,到設計更高效的電動汽車電池,再到加速核聚變和新能源替代的進展。許多這些未來改變遊戲規則的應用程序在傳統計算機上是不可行的,它們正等着用量子計算來解鎖。
中央經濟工作會議提“人工智能+”
中央經濟工作會議於12月11日至12日在北京舉行,會議確定了2025年的九大重點任務,其中第二點提到要開展“人工智能+”行動,培育未來產業。會議還表示,要以科技創新引領新質生產力發展,加強基礎研究和關鍵核心技術攻關,超前佈局重大科技項目,積極運用數字技術、綠色技術改造提升傳統產業。
點評:近年來,人工智能行業發展受到各級政府的高度重視和國家產業政策的支持,國家陸續出臺了多項政策,鼓勵人工智能行業發展與創新,包括《關於支持建設新一代人工智能示範應用場景的通知》《關於加快場景創新以人工智能高水平應用促進經濟高質量發展的指導意見》等,在2024兩會政府工作報告中,更是首提“人工智能+”概念。行業分析,在未來,AI在工業和教育等行業應用的機會比較廣泛。
谷歌發佈Gemini 2.0系列模型
12 月 11 日晚,谷歌正式發佈其最新版大模型Gemini 2.0系列,谷歌表示這是他們迄今爲止最強大的人工智能模型,“專爲智能體時代設計”,並同時介紹了多個智能體應用(AI Agent),包括多模態對話助手Project Astra 、完成複雜任務的智能體 Project Mariner、能夠幫助開發者的編碼智能體Jules等。谷歌CEO桑達爾·皮查伊(Sundar Pichai)在X上着重提到了智能體Project Astra,認爲其“展示了通用 AI 助手的曙光”。皮查伊表示,“2025 年將是令人興奮的一年。”帖子下則有評論表示,2025 年會是屬於智能體的一年。
點評: 值得一提的是,臨近2024年底,AI智能體頻頻被行業人士提及。所謂智能體,簡單來說是能夠感知環境,具有獨立思考和行動能力的AI程序。傳統AI通常是指令驅動的,需要人類用戶輸入指令纔會執行相應的任務,AI智能體則有獨立解決任務的能力。“隨着越來越多的大廠佈局AI Agent產品和生態,預計2025年將會成爲AI Agent商用爆發的年度。”中信建投證券在月初表示。
全球首個AI程序員Devin全面開放,月費500美元
全球首個“AI程序員”Devin於12月11日全面開放,距離其初次亮相尚不到一年。其開發商Cognition Labs宣佈,個人開發者和工程團隊可以每月500美元獲得完整訪問權限,訂閱還包括Slack集成、IDE擴展以及專業的技術支持。對於大型企業,公司提供定製的企業版解決方案。
點評:AI代替部分程序員的速度又加快了。據悉,Devin能夠熟練運用多種編程語言、獨立完成網站和應用程序的構建與部署,甚至可以自主發現並修復代碼缺陷。官方表示,其已通過多家AI公司的實踐性工程師面試,併成功在Upwork等自由職業平臺上完成實際項目。
ChatGPT集成到蘋果iOS、iPadOS和macOS系統
當地時間12月11日,OpenAI宣佈,ChatGPT現已集成到蘋果iOS、iPadOS和macOS中,允許用戶直接在操作系統內訪問ChatGPT的功能。當用戶向Siri詢問複雜問題時會觸發ChatGPT,當Siri被問到蘋果軟件認爲更適合ChatGPT來回答的問題時,系統會請求用戶訪問OpenAI服務的權限。蘋果表示,這項集成使用了OpenAI的GPT-4o模型。蘋果已在相關功能中內置了隱私保護功能,OpenAI不會存儲用戶發出的請求。
點評:根據蘋果此前的計劃,Apple Intelligence今年10月正式上線,從美國英語開始推出,還有一個版本針對英國、澳大利亞、加拿大、愛爾蘭和新西蘭進行了本地化,蘋果會在明年4月增加更多語言。ChatGPT此次也加入了“蘋果全家桶”。這些AI功能加入後在海外是否會拉動購機潮還需要觀察。
亞馬遜成立AGI實驗室,瞄準數字世界“全能AI助手”
12月9日,亞馬遜宣佈在舊金山設立新的研發實驗室——Amazon AGI SF Lab,這是該公司在人工智能領域的又一重大戰略佈局。這家實驗室由Adept聯合創始人David Luan親自領導,其核心目標直指打造能在數字和物理世界中“採取行動”的AI智能體,並能處理跨越計算機、網絡瀏覽器和代碼解釋器的複雜工作流程。
點評:據悉,實驗室初期研究重點聚焦於幾個關鍵方向:使AI智能體能執行真實世界行動、從人類反饋中學習、自主糾正以及推斷人類意圖。目前,AI智能體正成爲科技行業的兵家必爭之地。據Emergen Research預測,這一細分市場規模有望在年底前達到310億美元。Capgemini的調查顯示,82%的企業計劃在三年內整合AI智能體技術,看中的正是其可能帶來的效率提升。
ChatGPT宕機數小時後恢復
北京時間12月12日,OpenAI表示,ChatGPT和Sora無法訪問後,公司正在努力修復中斷問題,已經確定了問題所在,在努力推出修復方案。幾個小時後,ChatGPT才恢復正常。此前OpenAI宣佈正式向用戶開放AI視頻生成模型Sora。隨後OpenAI CEO山姆·奧爾特曼(Sam Altman)表示,OpenAI嚴重低估了用戶對Sora的需求,要讓每個人都能訪問Sora還需要一段時間。
點評:此次宕機的具體原因還未公佈,不過,綜合Sora向用戶開放使用後該應用出現的延遲問題,宕機有可能是因爲太多用戶涌入OpenAI的服務器導致的。相比語言大模型,視頻大模型生成需要更多算力,人們通常需要等待更久才能獲得生成的視頻,需要大量算力可能也是Sora目前只向付費用戶開放使用的原因。
面壁智能獲得新一輪數億元融資
12月11日,面壁智能CEO李大海發出全員信,宣佈公司完成新一輪數億元融資,該輪融資由龍芯創投、鼎暉百孚、中關村科學城基金和賽富基金聯合領投,北京市人工智能產業投資基金與清科創投跟投。本輪融資後,面壁智能將進一步提速以端側AI爲代表的高效大模型商業化佈局。據悉,面壁智能發力端側模型,自研了面壁“小鋼炮”MiniCPM,MiniCPM系列模型自今年2月發佈以來,累計下載突破300萬。
點評:李大海認爲,行業在2024年下半年形成共識,要向更高知識密度的小模型和端側智能發展。在端側智能方面,面壁智能在主流消費電子硬件和新興硬件中融入端側AI,同時佈局端雲協同的未來範式,與華爲雲、百度智能雲等達成戰略合作。
博通全財年AI收入增長了220%
當地時間週四,博通公佈2024財年第四季度業績。第四財季營收140.5億美元,較去年同期增長51%,淨利潤爲43.2億美元,較上年同期增長23%。該季度包括人工智能芯片業務在內的半導體解決方案部門營收82.3億美元,同比增長了12%。博通表示,生成型人工智能基礎設施繁榮帶來公司業務需求飆升。該財年公司的人工智能收入增長了220%,達到122億美元。
點評:博通業績受到AI需求驅動。人工智能收入的增長部分來自以太網網絡部件,這些部件用於將數千個人工智能芯片連接在一起。此外,博通還透露,該公司正在與三家大型雲客戶開發定製人工智能芯片。不過,近日也有消息稱蘋果考慮在iPhone和旗下家居產品中用自研芯片替代博通的產品,這對博通而言並非好消息。