☰

垂類場景交互體驗升級 AI如何迭代認知決策水平？

本報記者蔣牧雲何莎莎烏鎮北京報道

推動AI技術從“生根發芽”到“開花結果”，正在成爲行業機構的突破目標。

近期，多家科技廠商爭相從AI點咖啡切入，爲人們提供更加接近生活且更具實用性的服務。與此同時，AI的服務場景也在逐步擴大之中。近日，《中國經營報》記者從世界互聯網大會了解到，如今，人們更可以通過AI健康管家解讀體檢報告、通過AI文旅助手進行景區導航及景區附近餐廳導覽等。

不過，記者亦在採訪中瞭解到，當前AI垂類服務仍然在交互模式上有所欠缺。爲解決這一問題，螞蟻集團正通過知識學習、檢索增強生成（RAG）的結合，使AI大模型在儲備垂類場景知識的同時，更加靠近真實場景中的交互邏輯。

螞蟻集團董事長兼CEO井賢棟在會上表示，AI帶來的變革將體現在三個方面：AI會從根本上改變所有的行業，重塑產業形態和經濟圖景；AI會幫助人類擁有“超級能力”，解決過去無法解決的複雜問題；AI會推動機器人技術快速發展，成爲人類的助手。AI讓服務業即將迎來大規模個性化的時代。

具體而言，記者從大會現場瞭解到，基於螞蟻集團自主研發的“認知決策智能體技術創新與應用”，支付寶正在重點打造AI健康管家、AI生活管家“支小寶”、AI金融管家“螞小財”三款AI應用。這三款應用以醫療健康服務爲例，目前支付寶已經服務了全國超過6億的個人醫保支付，爲超過3600家醫院提供了數字化服務。通過和浙江衛健委聯合推出的“安診兒”，提供個性化的數字陪診服務，已經服務了超過1000家醫院、超過1000萬人次的患者，對老年患者以及異地就醫羣體尤其方便。

事實上，業內普遍的認知是，AI在垂類場景中存在領域認知能力弱、複雜推理能力差等能力短板。那麼認知決策智能體技術創新應該如何補足前述短板？

螞蟻集團圖學習與知識圖譜負責人張志強告訴記者，大語言模型普遍還是存在知識幻覺的問題，而金融、醫療或生活類應用場景更多是嚴謹行業。這類場景有較高的認識門檻，以及行業自身的嚴謹邏輯。因此，大模型在這類場景中的應用不僅需要學習知識，更要符合行業，並依據相應邏輯來進行交互。

張志強舉例道：“當我們使用大模型的時候，往往是我們向它提問，模型給我們一個答案。而當我們真正在就醫的時候，醫生實際上還會向我們提問，比如具體有哪些症狀，症狀的開始時間等，我們希望大模型在醫療場景中的應用能夠符合這一交互特性。爲此，我們開源了一個基於知識圖譜做的知識增強生成框架，通過檢索增強生成（RAG），補充一些語言模型不知道或不清楚的知識。與此同時，以醫療或金融、政務的行業內在邏輯來約束模型，使其按邏輯進行交互，最終形成模型的‘大腦’。”

螞蟻集團百靈大語言模型負責人周俊認爲，要在垂類的場景中使用大模型，還要求大模型能夠從螞蟻集團原有的上千種工具中，調用最貼近用戶需求的工具，即“手和腳”。這對於大模型而言同樣是一大難點，與人類的認知方式不同，各類工具或知識是以token的形式存在於模型的認知中。當可調用工具較多時，模型要在什麼時間，調用哪些具體工具，就更顯困難。

“因此，我們正在通過各式各樣的方法增強語言模型的函數調用能力，並在適當時也寄語模型可使用的工具，目前已經比原生模型的能力強大很多。”周俊表示。

周俊向記者表示：“以大模型點咖啡這一場景來說，看似簡單的步驟背後，其實需要調用上下游的多個協作系統，不僅涉及到咖啡店的產品信息、付費信息，也涉及到外送平臺的信息等。以生活服務、醫療與金融等場景爲切入口，我們也在通過持續優化與調試，不斷增強大模型的能力，在知識擴充的同時，也使交互更加符合行業的交互邏輯，從而增強用戶的體驗。”

（編輯：李暉校對：顏京寧）

垂類場景交互體驗升級 AI如何迭代認知決策水平？

相關資訊