新東方“雖遲但到”,教育大模型時代來臨了?

21世紀經濟報道記者王峰 北京報道教育大模型時代徹底來臨了?

近日,新東方發佈新東方在線App鴻蒙原生版,同時上線加載大模型技術的考研智能學習系統“慧學系統”。至此,國內市值超百億的教育公司已悉數發佈大模型產品。市值最大、目前已超800億元的新東方是最後發佈的公司。

比新東方姍姍來遲更值得關注的是,其首發的大模型產品來自考研業務,而非行業應用更普遍的K12業務。新東方考研業務爲何成爲大模型應用的試水者?

對於行業來說,新東方的加入讓技術應用趨勢更加明顯。雖然教育大模型時代已然來臨,但仍處於起步階段,接下來如何發展還要邁過幾道坎。

上線自動批改和命題功能

新東方並不被認爲是一家技術引領型公司,如今擁抱大模型技術,其實已經落後於行業。

早在2023年7月,本站有道就發佈了國內首個教育大模型“子曰”。此後,作業幫、好未來、希沃、猿輔導都發布了自研大模型,有的還研發了不止一套模型。國內市值超百億的教育公司中,中公教育、豆神教育、華圖教育都發布了大模型產品。高途、粉筆、學大教育、松鼠Ai等市值不足百億的頭部公司都已應用了大模型。

新東方其實也已在業務中應用了大模型技術。在今年4月的阿里雲AI智領者峰會上,新東方大學事業部P端產品負責人張辰介紹,新東方應用大模型技術分析學員與老師的溝通內容,進而提出溝通改進建議,提升學員滿意度;應用大模型技術分析課程和學習資料,進而拆解、分析知識結構,提升學員上課效率。

總體上,這一階段的探索是將大模型技術用於公司內部生產流程,以提高效率。現在,慧學系統則提供了面向學員的新功能。

首先是自動批改。據介紹,慧學系統的AI批改功能支持考研全部科目的客觀題以及英語的主觀題,特別是作文批改。

寫作是學生提升成績的重要單項,批改作文也就成了考生在備考時的集中需求。老師批改作文的速度與質量直接影響學生的滿意度。

新東方大學生學習與發展中心在線國內事業部總經理洪喆介紹,過去,老師批改完一張模考試卷大約需要10分鐘,現在人機協作僅需約2分鐘就能完成。

其次是自動命題。考研的真題數量較少,但考生又需要大量練習和模擬考試。大模型技術可以根據學科核心知識點和考察難度自動生成模擬題。

以題庫較少的西醫綜合必考科目爲例,新東方第一批次就直接生成4000道題,匹配到整個科目6000個核心知識點。

這項技術的挑戰在於如何平衡自動命題的準確性和適用性,即不能爲了追求題目的準確性而生成大量的“水題”。

洪喆表示,這要求教師在系統中提前錄入經過標註和分層的知識點,從而讓系統在自動命題時能夠動態匹配不同方面、不同難度的知識點。

爲何首先落地考研業務

新東方爲何在考研業務中率先落地大模型產品?

首先,這與新東方的內部業務結構有關。新東方主要教育業務中,非學科類培訓業務學員人數衆多,截至今年8月31日的最新財季報名人數約48.4萬人。但非學科類培訓業務還處在發展早期,品類較多且差異較大,對於AI技術的規模化應用有一定障礙。出國考試準備業務也是一項重要業務,但託福、雅思等考試的練習、測試等資源已經較爲成熟和豐富。

考研業務同樣體量龐大,新東方大學生學習與發展中心考研項目總監李琳介紹,今年新東方考研業務學員人數超40萬人次,這幾乎接近2025年全國考研報名人數的十分之一。如此龐大的用戶規模,給大模型技術提供了應用場景。

其次,這與新東方考研用戶需求有關。李琳介紹,近年來新東方考研用戶多樣化特徵明顯,除了應屆高校畢業生之外,往屆畢業生、在職人羣顯著增加。“在職人羣已佔新東方考研業務用戶的20%。”李琳告訴21世紀經濟報道記者。用戶畫像能繼續細分,比如在職人羣中還可以細分出“寶媽”羣體、多次考研羣體等。

複雜的用戶羣體帶來了複雜的用戶需求,學員的學業基礎、學習習慣、日程安排差異很大,勢必需要藉助AI技術提供定製化、個性化服務。

第三,這與考研培訓行業的外部競爭有關。近年來,考研培訓市場格局發生激烈變動。李琳認爲,以前的考研培訓市場呈倒三角形,全國性的大型機構所佔市場份額較大,現在則呈現梯形,腰部機構增長勢頭良好。

所謂“腰部機構”,是指在考研細分領域表現出色的中小型機構。比如,有的機構聚焦於藝術類、MBA考研培訓,用戶人數不多,但年收入可達上億元。甚至有小型培訓機構專門針對報考某一所高校研究生的考生開展培訓。

這類機構在品牌影響力、抗風險能力等方面難以與大機構匹敵,但主打垂直領域的差異化優勢。大機構在垂直領域服務方面,也需要藉助AI技術提供定製化、個性化服務。

新東方選擇從考研這個細分業務開始應用大模型技術,其實是行業趨勢。可資比較的是公考培訓行業,粉筆、華圖教育、中公教育三大巨頭都發布了大模型產品,但應用場景各不相同。粉筆側重於題目答疑和輔導、華圖教育專注於面試環節輔導、中公教育則將大模型與數字人技術結合用於教學輔助。

一位教育行業人士告訴21世紀經濟報道記者,“對於大模型的教育應用,越垂直可能越專業,效率就越高。”

“模型即應用”是必然方向

對於教育行業來說,隨着頭部公司悉數落地大模型產品,教育大模型的發展路線愈益清晰。

近日,在2024人工智能大模型產業大會上,中國企業評價協會與中關村數智人工智能產業聯盟聯合發佈了《2024中國大模型企業TOP50發展報告》。其中,希沃大模型和學而思九章大模型兩個教育大模型進入TOP50。

該報告指出,大模型的技術水平正從千億參數向萬億參數邁進。目前,參數規模超過1000億的企業數量達到25家,超過萬億參數的企業有7家。

教育大模型的參數水平難以與已邁上萬億級別的通用大模型相比,這意味着“模型即應用”是教育大模型的必然方向。

“大多數教育公司不需要去開發基座模型,就好像教育公司沒必要去自研雲服務一樣,這種標準化的基座服務未來只需要向少數科技巨頭購買即可,教育公司要做的是在基座之上調適、應用自己的數據。”上述教育行業人士說。

對於教育公司來說,未來“模型即應用”的發展仍要邁過幾道坎。

首先是選擇生態。“英偉達在人工智能芯片市場的市場份額高達80%,重要原因在於英偉達開發了基於GPU的通用並行計算平臺和編程模型CUDA,從而構建起英偉達軟件生態的基座。”上述教育行業人士說。

值得注意的是,新東方考研大模型產品首先在鴻蒙系統中落地。原因是多方面的,包括新東方很早就開始在鴻蒙生態中投入研發,新東方旗下的智慧教育業務還基於開源鴻蒙開發了產品線,以及越來越多的新東方考研學員反饋已將手機遷移至鴻蒙系統等。

但目前,鴻蒙生態仍處於發展早期。新東方要想面向更大規模的用戶推廣大模型產品,還需要將產品覆蓋到體量更大的安卓等生態。

至於更直接相關的大模型生態,未來誰能勝出,成爲應用最廣泛的基座模型,還遠未見分曉。

其次是降低成本。“模型即應用”的商業模式已經在教育領域跑通,比如開展會員制訂閱服務等,但投入產出之間的平衡仍需摸索。

以考研爲例,這是一個每年只有約300億元規模的小市場。第三方調研顯示,願意承擔5000元以上客單價消費的用戶不足20%。疊加消費能力下降、考研報名人數減少等因素,教育公司在大模型產品研發、上線時,需要慎重考慮成本與收益。

上述教育行業人士認爲,這在今後的發展中會形成越來越強的張力。一方面,出於成本和實際應用效果考慮,低成本、應用成熟技術路線的大模型產品能夠實現降本增效,輔助教學;但另一方面,大模型技術被認爲能帶來顛覆現行教育模式的重要變革,在這個過程中,可能要不斷用新技術取代現行技術,這不僅需要超前投入,還有可能產生浪費,但卻是發展過程中必經的階段。