2024-10-02|閱讀時間 ‧ 約 0 分鐘

AI隱身在幕後的Semantic Scholar

簡介

這年頭,人工智慧(AI)無所不在,不管怎樣都要扯上一點AI。但先要有個概念,AI並不只是大型語言模型(Large Language Models, LLMs)而已。

Semantic Scholar是一個免費、AI驅動的文件檢索與發現工具,希望能提供全球研究社群的開放資源。它索引了來自多家出版社、資料提供者、網路爬梳的超過二億篇學術論文。細看合作的資料單位,有知名的ACM、Cambridge、IEEE、IOP、SAGE、SPIE、WILEY等商業或非商業出版社;也有網路上註明的綠色道路(Green Road)開放取用(Open Access)平台,如arXiv、medRXiv、PubMed,或是像Frontiers這類的開放取用出版社。

Semantic Scholar首頁

Semantic Scholar的合作單位

Semantic Scholar是艾倫人工智慧研究所(Ai2)的研發團隊在2015年所推出,Semantic Scholar運用了先進的自然語言技術,提供了諸如學術論文摘要、文內引用的脈絡資訊,使用者也可以建立自己的文獻庫並接收個人化的文獻推薦。

特色

Semantic Scholar有個Google-Like的檢索介面,檢索結果預設以相關性排序。使用者可以利用學術領域(Fields of Study)、日期範圍(Date Range)、全文(Has PDF)、作者(Author)、期刊與研討會(Journals & Conference,其實包含了資料來源)進行檢索結果的過濾。

Semantic Scholar檢索結果

為了方便使用者辨識自己需要的文獻,Semantic Scholar提供了TLDR人工智慧文章摘要。所謂的TLDR就是Too Long Didn't Read,例如下圖的第一篇文章就有TLDR,跟在後面的就是AI摘要,摘要最後有個Expand,按下去可以展開這篇文章的作者摘要。第一篇文章下有個657,這是表示這篇文章被其他657篇文章所引用,PDF表示這篇文章有可下載的全文(有可能是開放取用文章),後面會跟著出版單位、存檔(Save)/已在文獻庫(In Library)、引用該篇文章(Cite)等選項。如果一篇文章有引用你文獻庫裡面的文章,就會顯示Cite a paper in your library。

TLDR、被引用、與個人文獻庫的關係

Semantic Scholar有個高影響力引用文章的功能,它會出現在兩種情形:

檢索結果中顯示Highly Influenced

  1. 檢索結果中某篇文章顯示Hightly Influenced,如上圖,這表示這篇文章真的很重要,有高影響力。Semantic Scholar官網有大概寫高影響力的判斷標準,這裡就不多說了。
  2. 當你點入單篇文章檢視摘要等資訊時,會有一個小方框顯示這篇文章在所有引用它的文章裡扮演的角色,例如下圖可以看出"What is Ai Literacy?..."被657篇文章所引用,它在其中的69篇引用文獻中扮演了高影響力引用的角色,其他的還有做為研究背景的引用、作為研究方法的引用、在結果中引用等角色(如果把這些文章加起來,不一定會等於657)。

文章被引用角色

就如同所有檢索與發現系統一樣,產生某篇文章的引文格式是一定要的,不管是要用BibTex,或是MLA、APA、Chicago。

最後要提的是個人文獻庫(Library)和新知通訊(Alerts)的功能:

  1. 個人文獻庫:顧名思義,個人文獻庫就是讓你將感興趣的文章儲存起來的功能,使用者可以根據主題等方式來建立文獻夾(Folder),也可以與合作研究者共享文獻夾。此外,還可運用Semantic Scholar的AI-Powered Research Feed進行個人化推薦文獻的推播,Semantic Scholar會根據存放在同一文獻夾中文獻的相似性(這就是為什麼我建議根據主題來建立文獻夾)來推薦文獻。喔~你也可以特別指出不相像的文獻,那Semantic Scholar就會少推薦一點這些不相像的文獻。
  2. 新知通訊分為三種:(1) Paper Alerts -- 當某特定文章有新的引用時會通知;(2) Author Alerts -- 當某特定作者的文章有新的引用時會通知;(3) Research Feed Alerts -- 就是前面說的個人文獻庫的個人化推薦文獻。



分享至
成為作者繼續創作的動力吧!
© 2024 vocus All rights reserved.