2億篇論文免費(fèi)看!「微軟學(xué)術(shù)」停用,OpenAlex要接班
新智元報(bào)道
編輯:David 時(shí)光
【新智元導(dǎo)讀】為了接替已下線的「微軟學(xué)術(shù)搜索」,大型免費(fèi)學(xué)術(shù)索引 OpenAlex 已于今年年初正式上線,它涵蓋 2 億篇科學(xué)文獻(xiàn),易學(xué)易用,完全免費(fèi),網(wǎng)站將于 2 月上線。
最近,大型免費(fèi)學(xué)術(shù)資源索引 OpenAlex 宣布上線,該索引包含超過 2 億份科學(xué)文獻(xiàn)。
這個(gè)資源索引服務(wù)名為 OpenAlex,源自古代埃及亞歷山大圖書館館名。
創(chuàng)始人表示,該索引對(duì)出版物來源、作者信息和研究主題進(jìn)行編目,旨在繪制這些數(shù)據(jù)點(diǎn)之間的聯(lián)系,以創(chuàng)建一個(gè)全面的、相互關(guān)聯(lián)的全球研究系統(tǒng)數(shù)據(jù)庫(kù)。
去年 5 月,微軟宣布將于當(dāng)年年底關(guān)閉學(xué)術(shù)搜索知識(shí)圖譜(MAG) ,讓一些學(xué)者和其他使用其數(shù)據(jù)進(jìn)行研究和開發(fā)的人感到擔(dān)憂。
為應(yīng)對(duì) MAG 的下線,位于加拿大溫哥華的非營(yíng)利性學(xué)術(shù)服務(wù)公司 OurResearch 利用倫敦慈善機(jī)構(gòu) Arcadia Fund 提供的 450 萬美元的一部分,創(chuàng)建了這項(xiàng)「?jìng)ゴ蠊こ獭埂?/p>
今年 1 月 3 日推出的這個(gè)免費(fèi)學(xué)術(shù)索引數(shù)據(jù)庫(kù),功能上與微軟的 Academic Graph (MAG) 類似,MAG 是 Scopus、Dimensions 和 Web of Science 等學(xué)術(shù)訂閱平臺(tái)的免費(fèi)替代品,已于 2021 年底停止運(yùn)營(yíng)。
據(jù)悉,該索引當(dāng)前通過可執(zhí)行復(fù)雜搜索的應(yīng)用程序編程接口或 API 訪問。
微軟「學(xué)術(shù)圖譜」接班人
無論是研究人員,還是開發(fā)者,都需要大量查閱論文、專著等學(xué)術(shù)成果。近年來,越來越多的人開始繞過學(xué)術(shù)出版商的「付費(fèi)墻」,通過多種手段免費(fèi)獲取學(xué)術(shù)資源。
作為微軟 MAG 的替代品,此前 OpenAlex 一直在從 MAG 獲得論文、作者和其他數(shù)據(jù)實(shí)體。在 MAG 正式停止運(yùn)營(yíng)后,OpenAlex 開始自己從互聯(lián)網(wǎng)收集更多新內(nèi)容。
目前 OpenAlex 已經(jīng)發(fā)布新的 REST API 。與之前下載安裝的方式相比,可以更快、更簡(jiǎn)單地訪問 OpenAlex 數(shù)據(jù)庫(kù),無需賬戶和令牌,完全免費(fèi)。
目前,通過 API 可以獲取單一實(shí)體、實(shí)體列表和實(shí)體組。
OpenAlex 數(shù)據(jù)集描述了 5 類學(xué)術(shù)實(shí)體以及這些實(shí)際之間的聯(lián)系。每類實(shí)體分別對(duì)應(yīng)其目標(biāo):
成果:包括論文、書籍、數(shù)據(jù)集等,會(huì)引用其他成果
作者:做出成果的人
出處:刊載成果的期刊或資源庫(kù)
機(jī)構(gòu):(通過作者)與成果相關(guān)的大學(xué)或其他組織
概念:以話題方式對(duì)成果進(jìn)行標(biāo)簽
OpenAlex 表示,探索 OpenAlex 數(shù)據(jù)集的最簡(jiǎn)單方法是通過 Web 界面,無需編寫代碼即可探索 OpenAlex。不過目前網(wǎng)站開發(fā)尚未完成,預(yù)計(jì)在今年 2 月上線。
盡管 MAG 已停用,但作為其繼任者和替代,OpenAlex 將繼續(xù)維護(hù) MAG 格式至今年 7 月 2 日,從 2022 年 7 月起,OpenAlex 將不再支持 MAG 格式。
由于目前尚處于早期開發(fā)階段,各項(xiàng)功能尚待進(jìn)一步完善,OpenAlex 將每日單個(gè)用戶調(diào)用數(shù)量限制在 10 萬次以下。
OpenAlex 三大優(yōu)勢(shì)
在綜合比較各種數(shù)據(jù)庫(kù)之后,小編發(fā)現(xiàn),OpenAlex 具有明顯的三大優(yōu)勢(shì),這將帶給用戶美好的體驗(yàn)。
海量數(shù)據(jù),覆蓋面超 MAG
OurResearch 的聯(lián)合創(chuàng)始人賈森·普里姆(Jason Priem)表示,「OpenAlex 的創(chuàng)立是為了實(shí)現(xiàn)與其他幾個(gè)數(shù)據(jù)庫(kù)互聯(lián)互通,使其覆蓋更加廣泛全面?!?/p>
與某個(gè)單一數(shù)據(jù)庫(kù)相比,OpenAlex 擁有更加開放的獲取覆蓋面,它擁有來自 Wikidata 標(biāo)識(shí)符、MAG 、ORCID、Crossref、ROR、Unpaywall 等數(shù)據(jù)資源。
普里姆表示,「我們不僅可以給用戶提供文章的免費(fèi)版本,還可以告訴你該文章的授權(quán)和不同版本?!?/p>
簡(jiǎn)單易用,20 分鐘就會(huì)
「OpenAlex 是在用一種聰明的方式,將大量的數(shù)據(jù)庫(kù)整合在一起?!箽W弗頓公司(Overton)的創(chuàng)始人尤安·阿迪(Euan Adie)說。
歐弗頓是家總部位于倫敦的公司,主要用于跟蹤政策文件的引用。過去,歐弗頓公司從不同的來源獲取數(shù)據(jù),包括 MAG、ORCID、Crossref,也直接向個(gè)人獲取。
現(xiàn)在,歐弗頓只使用 OpenAlex,寄希望于檢索過程更加便捷,簡(jiǎn)單設(shè)置讓人容易學(xué)會(huì)。
「我只需要 20 分鐘就會(huì)使用 OpenAlex,而對(duì)比 MAG 卻要3-4 天。」阿迪說。
「我花了大約 2 小時(shí)就學(xué)會(huì)了 OpenAlex,而開始用 MAG 卻要一周。」另一位使用者 Roar Bakken Stovner 說。
Stovner 認(rèn)為,對(duì)于更精通計(jì)算機(jī)的人來說,MAG 可能不算難,而對(duì)于那些想要自己嘗試開發(fā)小項(xiàng)目的人來說,OpenAlex 將更容易開始。
不用登錄,完全免費(fèi)
OpenAlex 的底層代碼在 CC0 版權(quán)許可下可以免費(fèi)獲得,任何人都可以在其上進(jìn)行開發(fā)。
因此,賈森·普里姆(Jason Priem)表示,OpenAlex 每?jī)芍芨乱淮?,?MAG 更向前邁進(jìn)了一步。
假如,哪一天 OpenAlex 停止運(yùn)行,那么,任何人都可以從接著 Priem 停下的進(jìn)度繼續(xù)開發(fā),而不必從頭開始搭建數(shù)據(jù)庫(kù)。
此前,MAG 的用戶必須登錄系統(tǒng),并支付少量費(fèi)用,才可以下載。而 OpenAlex 可以免費(fèi)使用。
普里姆表示,這要感謝 Amazon Web Services 的贊助,不需要注冊(cè)或登錄,這使得使用過程更加友好。
不過,OpenAlex 可能會(huì)考慮為那些想要超快訪問的用戶,推出付費(fèi)高級(jí)版本。
但,免費(fèi)的版本總是可用的。
參考資料:
https://www.nature.com/articles/d41586-022-00138-y
https://www.nature.com/articles/d41586-022-00103-9
https://docs.openalex.org/