用算法解析方言 滬語大模型迭代升級
來源:中國新聞網
中新社上海3月10日電 (記者 許婧)記者10日從“當上海話遇到大模型——助力上海城市數字化轉型研討會”上獲悉,名爲“小滬”的滬語大模型已迭代升級爲“小滬2.0版”。
去年11月,上海大學滬語大模型“小滬”正式發佈。升級的“小滬2.0版”已具備女聲、男聲的語言能力,也具備了從普通話、上海話或英語文本轉上海話語音的能力,而上海話的識別、朗讀、生成也正在進行優化,有望在近期獲得更優的效果。
上海大學海派文化研究中心主任陳東介紹說,除實現聽、說、讀、寫各項能力,未來它可能還會有詩歌創作能力和滬語教學能力,能夠實現上海話多模態轉換、適應各大上海話應用場景,賦能上海城市數字化轉型。
“儂好”“老靈”“不響”……近年來,滬語電影《愛情神話》、電視劇《繁花》、話劇《長恨歌》等,讓上海話的傳承和發展引發熱議。與會專家認爲,在今天,上海話的傳承保護尤爲重要,新上海人聽不懂上海話,許多青年人、孩子也只能聽而不能說上海話,講不來上海話對於很多喜愛海派文化的人來說頗爲遺憾。
在數字化時代,上海正通過多種方式讓上海話在現代社會中煥發出新的活力,一些語音識別軟件和智能設備開始支持上海話輸入。
“我們的大語言模型‘小滬’也在這個賽道上貢獻了自己的力量。”陳東說,上海話搭建了新的傳承橋樑,當算法解析方言的語音規律時,不僅是在構建一種語言數據庫,更是對海派文化基因的數字化保存。(完)