谷歌學術能挺過人工智能革命嗎?
這個最大的學術搜索引擎正在慶祝其20歲生日,但AI驅動的競爭對手提供了優勢。
多年來,谷歌學術在科學文獻搜索領域佔據主導地位。
谷歌學術——最大、最全面的學術搜索引擎——本週迎來了20週年。一些研究人員表示,在過去的二十年裡,這個工具已成爲科學領域中最重要的工具之一。但是近年來,使用人工智能(AI)來改善搜索體驗的競爭對手已經出現,還有一些允許用戶下載數據的其他平臺也出現了。
華盛頓大學西雅圖分校的計算社會科學家傑文·韋斯特表示,谷歌學術——屬於加利福尼亞州山景城的互聯網巨頭谷歌所有——對科學的影響是顯著的,他每天都會使用這個數據庫。“如果說有一刻谷歌學術可能被推翻作爲主要的搜索引擎,那可能是現在,因爲這些新工具和其他地方正在發生的創新。”韋斯特說。
西班牙格拉納達大學的文獻計量學研究員阿爾貝託·馬丁·馬丁表示,谷歌學術的許多優勢——“免費訪問、信息的廣度和複雜的搜索選項”——“現在正被其他平臺共享”。
像ChatGPT這樣的AI驅動聊天機器人和其他使用大型語言模型的工具已經成爲一些科學家在搜索、審查和總結文獻時的首選應用。一些研究人員已經將谷歌學術換成了它們。新加坡管理大學的學術圖書管理員亞倫·泰說:“直到最近,谷歌學術一直是我的默認搜索工具。”它仍然是他的首選,但“最近,我開始使用其他的AI工具”。
然而,考慮到谷歌學術的規模以及它在科學界的根深蒂固,“要取代它需要付出很多努力”,韋斯特補充說。
谷歌學術的聯合創始人阿努拉格·阿查里亞表示,他歡迎所有使學術信息更易於發現、理解和建立在其上的努力。“我們所有人能做的越多,對科學的推進就越有利。”
最大且最廣泛
谷歌學術於2004年進入文獻搜索領域並改變了一切。當時,研究人員使用圖書館查找信息或通過付費在線服務如科學引文數據庫Web of Science搜索學術論文。與谷歌學術同月推出的另一個付費服務是Elsevier的Scopus,這是一個龐大的科學參考文獻和摘要數據庫。
谷歌學術爬取網絡以尋找任何類型的學術作品,如書籍章節、報告、預印本和網頁文檔——包括非英語語言的內容。目標是“使全世界的研究人員更有效,幫助每個人都能夠站在科學的共同前沿”,阿查里亞說。
谷歌學術與出版商的協議使其擁有無與倫比的訪問權限,可以獲取付費牆後全文文章——而不僅僅是標題和摘要,這是大多數搜索引擎提供的。它根據與搜索查詢的相關性對論文進行排名——通常將引用最多的文章放在頂部——並提出進一步的查詢建議。它的覆蓋深度促進了高度特定的搜索。
谷歌拒絕分享該服務的用法數據,但根據網站流量計量器Similarweb的數據,谷歌學術每月收到超過1億次訪問。
馬丁·馬丁表示,這個數據庫也非常擅長指導人們找到文章的免費版本。這促進了開放獲取運動,西班牙國家研究委員會高級社會研究院的文獻計量學家何塞·路易斯·奧爾特加說。
但在其他方面,谷歌學術是不透明的。主要關注點之一是對其所搜索的內容缺乏瞭解,包括哪些期刊,以及它用於推薦文章的算法。它還限制批量下載其搜索結果,這些結果可用於文獻計量分析等。“我們對科學中一個最有價值的工具沒有太多瞭解,”韋斯特說。
阿查里亞說,谷歌學術主要是一個搜索工具,其主要目標是幫助學者找到最有用的研究。
更新的引擎
在過去幾年中,出現了提供這種文獻計量數據的競爭對手,儘管沒有一家能擊敗谷歌學術的規模和對付費牆後全文文章的訪問權。一個值得注意的例子是2022年推出的索引OpenAlex。前一年,微軟學術圖表因爬取網絡上的學術信息而被停止運營,並且其整個數據集被釋放。OpenAlex基於此以及其他公開來源的學術數據構建。用戶可以按作者、機構和引用搜索其編目內容,也可以免費下載其全部記錄。“他們正在做我們希望谷歌學術做的事情,”馬丁-馬丁說。
另一個受歡迎的研究工具,語義學者,於2015年推出,使用AI創建論文的可讀摘要並識別其最相關的引用。另一個工具,共識,於2022年推出,依賴於語義學者的數據庫來找到由研究支持的問題的答案(韋斯特是共識的顧問)。泰最喜歡的一個是Undermind,它使用更先進的基於代理的搜索,其中一個自主實體像人類一樣掃描科學文獻,根據它發現的內容調整搜索。與谷歌學術相比,它需要幾分鐘而不是幾秒鐘來輸出結果,但泰說等待是值得的。“我發現返回的結果質量比谷歌學術更好。”
阿查里亞表示,谷歌學術也使用AI對文章進行排名、提出進一步的搜索查詢和推薦相關文章。本月早些時候,該公司在其PDF閱讀器中引入了AI生成的文章大綱。阿查里亞還表示,搜索工具嘗試理解查詢背後的意圖和上下文。這種語義搜索方法基於語言模型,他說已經使用了大約兩年。
谷歌學術尚未做的一件事是包含AI生成的概述或對搜索查詢的回答,類似於現在典型的谷歌搜索頂部所找到的那些。阿查里亞說,以一種簡潔幷包含重要上下文的方式從多篇論文中概括結論是具有挑戰性的。“我們還沒有看到解決這一挑戰的有效解決方案。”他說。
本文來自孫學軍科學網博客。鏈接地址:https://blog.sciencenet.cn/blog-41174-1460843.html