這年頭,人工智慧(AI)無所不在,不管怎樣都要扯上一點AI。但先要有個概念,AI並不只是大型語言模型(Large Language Models, LLMs)而已。
Semantic Scholar是一個免費、AI驅動的文件檢索與發現工具,希望能提供全球研究社群的開放資源。它索引了來自多家出版社、資料提供者、網路爬梳的超過二億篇學術論文。細看合作的資料單位,有知名的ACM、Cambridge、IEEE、IOP、SAGE、SPIE、WILEY等商業或非商業出版社;也有網路上註明的綠色道路(Green Road)開放取用(Open Access)平台,如arXiv、medRXiv、PubMed,或是像Frontiers這類的開放取用出版社。
Semantic Scholar是艾倫人工智慧研究所(Ai2)的研發團隊在2015年所推出,Semantic Scholar運用了先進的自然語言技術,提供了諸如學術論文摘要、文內引用的脈絡資訊,使用者也可以建立自己的文獻庫並接收個人化的文獻推薦。
Semantic Scholar有個Google-Like的檢索介面,檢索結果預設以相關性排序。使用者可以利用學術領域(Fields of Study)、日期範圍(Date Range)、全文(Has PDF)、作者(Author)、期刊與研討會(Journals & Conference,其實包含了資料來源)進行檢索結果的過濾。
為了方便使用者辨識自己需要的文獻,Semantic Scholar提供了TLDR人工智慧文章摘要。所謂的TLDR就是Too Long Didn't Read,例如下圖的第一篇文章就有TLDR,跟在後面的就是AI摘要,摘要最後有個Expand,按下去可以展開這篇文章的作者摘要。第一篇文章下有個657,這是表示這篇文章被其他657篇文章所引用,PDF表示這篇文章有可下載的全文(有可能是開放取用文章),後面會跟著出版單位、存檔(Save)/已在文獻庫(In Library)、引用該篇文章(Cite)等選項。如果一篇文章有引用你文獻庫裡面的文章,就會顯示Cite a paper in your library。
Semantic Scholar有個高影響力引用文章的功能,它會出現在兩種情形:
就如同所有檢索與發現系統一樣,產生某篇文章的引文格式是一定要的,不管是要用BibTex,或是MLA、APA、Chicago。
最後要提的是個人文獻庫(Library)和新知通訊(Alerts)的功能: