垂類場景交互體驗升級 AI如何迭代認知決策水平?

本報記者 蔣牧雲 何莎莎 烏鎮 北京報道

推動AI技術從“生根發芽”到“開花結果”,正在成爲行業機構的突破目標。

近期,多家科技廠商爭相從AI點咖啡切入,爲人們提供更加接近生活且更具實用性的服務。與此同時,AI的服務場景也在逐步擴大之中。近日,《中國經營報》記者從世界互聯網大會了解到,如今,人們更可以通過AI健康管家解讀體檢報告、通過AI文旅助手進行景區導航及景區附近餐廳導覽等。

不過,記者亦在採訪中瞭解到,當前AI垂類服務仍然在交互模式上有所欠缺。爲解決這一問題,螞蟻集團正通過知識學習、檢索增強生成(RAG)的結合,使AI大模型在儲備垂類場景知識的同時,更加靠近真實場景中的交互邏輯。

螞蟻集團董事長兼CEO井賢棟在會上表示,AI帶來的變革將體現在三個方面:AI會從根本上改變所有的行業,重塑產業形態和經濟圖景;AI會幫助人類擁有“超級能力”,解決過去無法解決的複雜問題;AI會推動機器人技術快速發展,成爲人類的助手。AI讓服務業即將迎來大規模個性化的時代。

具體而言,記者從大會現場瞭解到,基於螞蟻集團自主研發的“認知決策智能體技術創新與應用”,支付寶正在重點打造AI健康管家、AI生活管家“支小寶”、AI金融管家“螞小財”三款AI應用。這三款應用以醫療健康服務爲例,目前支付寶已經服務了全國超過6億的個人醫保支付,爲超過3600家醫院提供了數字化服務。通過和浙江衛健委聯合推出的“安診兒”,提供個性化的數字陪診服務,已經服務了超過1000家醫院、超過1000萬人次的患者,對老年患者以及異地就醫羣體尤其方便。

事實上,業內普遍的認知是,AI在垂類場景中存在領域認知能力弱、複雜推理能力差等能力短板。那麼認知決策智能體技術創新應該如何補足前述短板?

螞蟻集團圖學習與知識圖譜負責人張志強告訴記者,大語言模型普遍還是存在知識幻覺的問題,而金融、醫療或生活類應用場景更多是嚴謹行業。這類場景有較高的認識門檻,以及行業自身的嚴謹邏輯。因此,大模型在這類場景中的應用不僅需要學習知識,更要符合行業,並依據相應邏輯來進行交互。

張志強舉例道:“當我們使用大模型的時候,往往是我們向它提問,模型給我們一個答案。而當我們真正在就醫的時候,醫生實際上還會向我們提問,比如具體有哪些症狀,症狀的開始時間等,我們希望大模型在醫療場景中的應用能夠符合這一交互特性。爲此,我們開源了一個基於知識圖譜做的知識增強生成框架,通過檢索增強生成(RAG),補充一些語言模型不知道或不清楚的知識。與此同時,以醫療或金融、政務的行業內在邏輯來約束模型,使其按邏輯進行交互,最終形成模型的‘大腦’。”

螞蟻集團百靈大語言模型負責人周俊認爲,要在垂類的場景中使用大模型,還要求大模型能夠從螞蟻集團原有的上千種工具中,調用最貼近用戶需求的工具,即“手和腳”。這對於大模型而言同樣是一大難點,與人類的認知方式不同,各類工具或知識是以token的形式存在於模型的認知中。當可調用工具較多時,模型要在什麼時間,調用哪些具體工具,就更顯困難。

“因此,我們正在通過各式各樣的方法增強語言模型的函數調用能力,並在適當時也寄語模型可使用的工具,目前已經比原生模型的能力強大很多。”周俊表示。

周俊向記者表示:“以大模型點咖啡這一場景來說,看似簡單的步驟背後,其實需要調用上下游的多個協作系統,不僅涉及到咖啡店的產品信息、付費信息,也涉及到外送平臺的信息等。以生活服務、醫療與金融等場景爲切入口,我們也在通過持續優化與調試,不斷增強大模型的能力,在知識擴充的同時,也使交互更加符合行業的交互邏輯,從而增強用戶的體驗。”

(編輯:李暉 校對:顏京寧)