學術影響力是衡量學術實體的重要的評價指標。如何合理、公平地評估學術影響力,準確預測學術影響力并進行精準推薦,正面臨著隱式關系、動態(tài)學術網(wǎng)絡嵌入以及學術影響力膨脹等方面的諸多挑戰(zhàn),已引起國內(nèi)外科研工作者的廣泛關注。本書介紹了作者在學術影響力評估、預測與推薦方面的研究成果,展示了數(shù)據(jù)驅(qū)動的學術影響力評估、預測與推薦研究的技術趨勢。 本書內(nèi)容對于學術大數(shù)據(jù)研究具有一定的參考意義,既適合專業(yè)人士了解學術影響力評估、預測與推薦的前沿熱點,也可以作為對學術大數(shù)據(jù)研究感興趣的本科生和研究生的學習讀物。
關注熱點,展示數(shù)據(jù)驅(qū)動的學術影響力評估、預測與推薦研究的技術趨勢。
學術影響力評估、預測與推薦在國家科研基金分配、人才引進及科研獎勵等方面扮演著重要角色,因此,學術影響力評估、預測與推薦研究已經(jīng)受到國內(nèi)外科研工作者的廣泛關注。本書共包括四章。
第1章主要綜述學術影響力評估的方法。在學術影響力量化研究中,有兩個大的轉(zhuǎn)變:一個是從非結(jié)構方法向結(jié)構化方法過渡;另一個是從單一學科的學術影響力評價到跨學科的學術影響力評價的轉(zhuǎn)變。盡管有大量的研究展示量化學術影響力評估的方法,但是學術影響力評估研究中還存在許多挑戰(zhàn)性的問題,如合作影響力的模式、統(tǒng)一的評價標準、隱式成功因素挖掘、動態(tài)學術網(wǎng)絡嵌入以及學術影響力膨脹。
第2章主要針對現(xiàn)有的基于網(wǎng)絡結(jié)構化的論文影響力評估方法以及機構影響力評估方法中存在的弊端,即沒有在異構的學術網(wǎng)絡中共同量化機構和論文的影響力,提出了基于機構-引用網(wǎng)絡的PageRank評估方法;跈C構與論文之間的關系,構造了一個異構的學術網(wǎng)絡機構-引用網(wǎng)絡;跈C構-引用網(wǎng)絡,利用PageRank算法,計算機構和論文影響力評分;诖,比較IPRank算法和對比算法。本章在一個真實的數(shù)據(jù)集上進行了相關的實驗,并證明了本文提出基于機構-引用網(wǎng)絡的PageRank算法優(yōu)于現(xiàn)有的評估方法。基于機構-引用網(wǎng)絡的PageRank算法能夠更好地識別諾貝爾獎的論文和獲得諾貝爾獎的機構。
第3章針對KDD CUP 2016競賽預測機構影響力這一目標,提出了三個基于機器學習的多特征的預測模型,如馬爾科夫模型、神經(jīng)網(wǎng)絡模型和基于支持向量機和神經(jīng)網(wǎng)絡的模型。在三類模型中,主要使用的特征包括機構歷史的評分、時間信息和空間信息。實驗結(jié)果表明SVM NN類模型的預測性能總體上好于馬爾科夫模型和神經(jīng)網(wǎng)絡模型。在實驗中,我們發(fā)現(xiàn)有兩個有趣的現(xiàn)象:(1)給定相同的預測方法,不同的會議數(shù)據(jù),可能得到不同的預測效果。這表明,模型的預測力與實驗數(shù)據(jù)緊密相關。(2)在一定程度上,時間加權和國家加權能夠提升模型的預測力,但是,提升的幅度和實驗數(shù)據(jù)緊密相關。這表明,不同算法的預測力與實驗數(shù)據(jù)是相關的。
第4章主要介紹了學術論文推薦系統(tǒng)的方法包括基于內(nèi)容過濾的推薦、基于協(xié)同過濾的推薦、基于圖的推薦以及基于混合方法的推薦等。此外,本章詳細介紹了論文推薦系統(tǒng)的評價指標包括準確性(Precision)、召回率(Recall)、F值(F-measure)、歸一化折損累計增益(NDCG)、均值平均精度(MAP)、平均倒數(shù)排名(MRR)、均方根誤差(RMSE)、平均誤差(MAE)、用戶覆蓋率(UCOV)。后,我們討論了學術論文推薦系統(tǒng)中幾個挑戰(zhàn)性的問題:冷啟動、稀疏性、可擴展性、隱私性、偶然性以及統(tǒng)一的數(shù)據(jù)標準。
本書的出版,得益于2018年遼寧省科技廳重點計劃指導項目以及2019年遼寧省教育廳高等學校創(chuàng)新人才支持計劃的資助。本書主要面向從事學術大數(shù)據(jù)研究的科研人員以及相關研究領域的廣大師生。由于學術影響力評估、預測及推薦的相關研究發(fā)展迅速以及作者能力有限,書中若有不妥之處,敬請廣大讀者與同行專家提出寶貴的意見。在此,感謝鞍山師范學院校領導和科技處領導,給予我大力支持和經(jīng)費保障,特別向為本專著的出版做出貢獻的同志表示衷心的感謝!前言學術影響力評估、預測與推薦
白曉梅2021年1月
白曉梅,博士,鞍山師范學院計算中心副教授,鞍山師范學院大數(shù)據(jù)研究所所長,鞍山市杰出科技工作者,遼寧省創(chuàng)新人才。畢業(yè)于大連理工大學軟件工程專業(yè),研究興趣包括數(shù)據(jù)科學、知識管理和網(wǎng)絡科學。在Journal of Informetrics、IEEE ACCESS、Scientometrics等國際重要期刊和WWW、AAAI等國際會議上發(fā)表英文論文30余篇, 20余篇論文為SCI檢索源。主持遼寧省重點研發(fā)計劃指導計劃項目1項、遼寧省自然科學基金項目1項,參加國家自然科學資金以及省市級項目10余項,獲得遼寧省自然科學成果三等獎,遼寧省教育軟件大賽二等獎;申請國家發(fā)明專利4項。
第1章學術影響力評估概述
第2章基于異構網(wǎng)絡的機構與論文影響力評估
第3章機構影響力預測模型
第4章學術論文推薦:綜述