內容簡介
《科學計量大數據及其應用》把握當今信息時代數字化、互聯網、大數據三大技術特徵,著眼於當代科學活動及科學文本的大數據引領科學計量學深刻變革的理念,從理論基礎和應用兩個方麵介紹科學計量大數據的新進展。
理論基礎部分,從科學計量的大數據基礎的角度,論述瞭數字齣版、互聯網與科學計量數據,麵嚮科學-計量的數據體係,科學論文的使用數據和論文使用數據的開放獲取優勢;應用部分,分彆探討瞭科學傢的工作時間錶,科學論文在社交網絡中的傳播機製,實時追索論文使用數據呈現的研究熱點與研究前沿,以及基於使用、引用等多重指標的單篇論文評價、體係。
《科學計量大數據及其應用》可供科學計量學、圖書館學、情報學領域的工作者和研究者,以及從事科技評價、科技管理的工作者閱讀參考。
作者簡介
王賢文,大連理工大學副教授、博士生導師,主要從事科學計量、科技政策與管理研究,擔任英文國際期刊Frontiers in Research Metrics and Analytics副主編,以及JAS/ST、Scientometrics、Research Evaluation等SSCI期刊的評審專傢。主持課題10餘項,其中國傢自然,社會科學基金項目3項。在國內外期刊發錶學術論文70餘篇,其中SSCI論文18篇,CSSCI論文49篇。研究成果曾多次引起Nature關注,被Nature、光明B報、法蘭剋福匯報、德國廣播電颱、澳大利亞廣播公司、中國科學報等全球數十傢主流媒體專文報道,在國內外産生較大影響。
內頁插圖
目錄
序 大數據時代的科學計量學新方嚮
前言
第1章 數字齣版、互聯網與科學計量大數據
1.1 科學論文齣版:從紙質齣版到數字齣版
1.2 應運而生的科學計量大數據
1.3 曆史上IT技術引領科學計量學的大變革
1.4 新的變革正在科學計量學領域悄然發生
1.5 本章小結
第2章 科學論文的科學計量分析:數據、方法與用途的整閤框架
2.1 科學計量學的研究數據體係:四大數據對象
2.2 四大數據對象的比較
2.3 科學計量學研究方法與各數據對象的針對性使用
2.4 本章小結
第3章 科學論文的使用數據
3.1 數字齣版、互聯網與科學論文使用數據的形成
3.2 使用數據的相關研究
3.3 使用數據的産生機製
3.4 使用數據的獲取來源
3.5 本章小結
第4章 科學論文使用數據的開放獲取優勢
4.1 開放獲取運動的洪流
4.2 關於開放獲取優勢的爭論
4.3 研究設計
4.4 基於相關生分析的多重指標抽取
4.5 開放獲取論文的優勢對比分析
4.6 分學科領域的開放獲取優勢對比分析
4.7 本章小結
第5章 探索科學傢的工作時間錶
5.1 基於科學傢下載論文的大規模時間數據分析
5.2 各國科學傢工作時間錶的共性與地區差異
5.3 美國、德國、中國大陸的深入比較分析
5.4 本章小結
第6章 科學論文在社交網絡中的傳播機製研究
6.1 網絡時代科學論文的傳播
6.2 科學論文在社交網絡中的傳播機理
6.3 案例分析
6.4 本章小結
第7章 研究熱點與研究前沿的實時挖掘
7.1 科研新趨勢的探測
7.2 基於論文的使用數據實時捕捉科學傢的研究想法
7.3 理論與方法體係
7.4 基於DIKW體係的計算神經學領域的研究趨勢挖掘
7.5 本章小結
第8章 連續、動態和復閤的單篇論文評價體係構建研究
8.1 科學論文的學術影響力與社會影響力綜閤評價
8.2 單篇論文評價的時機已經成熟
8.3 構建單篇論文評價體係的必要性
8.4 單篇論文評價體係的構建與實證研究
8.5 本章小結
參考文獻
附錄 來自全世界的關注
附錄1 Nature——實驗室生活:平衡的藝術
附錄2 法蘭剋福匯報——自由時問?科學傢有空閑時間嗎?
附錄3 中國科學報——-個考察科研人員生存狀態的獨特視角發現
彩圖
前言/序言
大數據時代的科學計量學新方嚮
科學傢的一天,似乎與常人不同,但既非不食人間煙火,也無什麼驚人之舉。後者,迄今科學史上僅有一例,1869年3月1日這一天,俄羅斯化學傢門捷列夫(1834-1907)發現瞭化學元素周期律,史稱“偉大發現的一天”。業經手稿、檔案的嚴密考證,確認瞭門捷列夫一天內編製齣完整的元素周期錶,同時又查明之前他在寫作《化學原理》的過程中對元素分類進行瞭堅持不懈的探索和嘗試①。平時積纍,成就一天。正如科學計量學之父普賴斯(Derek John de Solla Price,1922-1983)的一句名言所說:“科學如今清楚地錶明,巨大進步集成於各種方式的小步之中。”②當然,一項巨大進步未必集中在一天。
普賴斯的這句名言再次為最近的一項研究結果所印證。該項研究通過實時追蹤世界各地科學傢藉助互聯網每天從數字文檔數據庫中下載科學論文的大數據分析,獲得每天0~24小時論文下載量波動的周期麯綫,證實瞭科學傢群體的每一天確非平常,平時熬夜、周末加班係工作常態。這項研究以“探索科學傢的工作時間錶”為題在國際期刊《信息計量學學報》(Journal of Informetrics)公開發錶後,引起強烈反響,國內外媒體紛紛加以轉發、報道或評論。
現在,作者王賢文博士在《科學計量大數據及其應用》這部專著中,披露瞭那篇論文的機緣、由來與傳播盛況。這項有趣的研究,不獨直觀地展現齣科學傢夜以繼日探賾索隱的不倦努力,並暗示科研成果源於“積小步,成大步”所鑄就,而且初露當今數字化、互聯網、大數據時代的科學計量學新方嚮。
正是取代紙質齣版物的數字文檔,纔使得科學論文可以被不斷下載而不會像紙質論文那樣被不斷消耗,我們也纔有瞭計量和分析的新對象;正是有瞭遍及全球的互聯網,纔使得宏大的數字文檔數據庫吸引遍布世界各地的科學傢前來搜索、瀏覽和下載所需的論著,我們也纔有瞭監測和追蹤科學傢網上活動的有效手段。顯而易見,僅僅監測和記錄論文下載的少量數據,不足以顯現科學傢下載論文的世界空間分布特徵與時間分布周期規律,因此這是一項需要大數據且能夠産生大數據的計量研究。
在這本著作中,作者敏銳地把握住當今信息時代數字化、互聯網、大數據三大技術特徵,著眼於當代科學活動及科學文本的大數據引領科學計量學深刻變革的理念,將全書分為兩大部分。第一部分為科學計量的大數據基礎,分四章先後論述瞭數字齣版、互聯網與科學計量大數據,麵嚮科學計量的數據體係,科學論文的使用數據和論文使用數據的開放獲取優勢;第二部分為論文大數據在科學計量中的應用,分四章分彆探討科學傢的工作時間錶,科學論文在社交網絡中的傳播機製,實時追索論文使用數據呈現的研究熱點與研究前沿,以及基於使用、引用等多重指標的單篇論文評價體係。
現代社會中的數據驅動決策與創新:基於信息科學與管理科學的跨學科前沿探索 圖書名稱:《現代社會中的數據驅動決策與創新:基於信息科學與管理科學的跨學科前沿探索》 內容簡介 在信息爆炸的時代背景下,如何有效地從海量、異構的數據中提取洞察力,並將其轉化為實際的決策支持和創新動力,已成為驅動現代社會進步的核心議題。本書旨在深入剖析信息科學與管理科學交叉融閤的前沿領域,聚焦於數據驅動的決策製定過程、復雜係統分析以及新興技術在組織管理中的應用,為研究人員、政策製定者和企業管理者提供一套係統而深刻的理論框架與實踐指南。 本書並非簡單地羅列技術工具,而是立足於信息哲學基礎,探討數據、信息、知識到智慧(DIKW)的轉化路徑。我們著重探討瞭在快速變化的商業環境和公共政策領域中,如何構建穩健的數據治理體係,確保數據質量、閤規性與倫理使用。 第一部分:信息時代的理論基石與方法論革新 本部分奠定瞭全書的理論基礎。我們首先迴顧瞭信息論在現代管理學中的演進,討論瞭認知負荷理論在信息係統設計中的應用,並引入瞭復雜性科學的視角來理解組織信息流的動態特性。 數據、知識與智能的哲學辨析: 深入探討瞭數據的本體論地位,區分瞭“大數據”的描述性特質與“高價值信息”的預測性潛力。重點分析瞭知識發現(KDD)過程中的關鍵挑戰,尤其是在處理非結構化文本和時間序列數據時,如何避免“數據沼澤”陷阱。 跨學科分析框架的構建: 提齣瞭一個整閤瞭係統動力學、決策樹分析和貝葉斯推理的混閤模型框架,用於模擬和預測社會經濟係統的長期行為。此框架特彆強調瞭對不確定性的量化處理,這在麵臨突發事件(如供應鏈中斷或市場劇烈波動)時尤為關鍵。 信息過載與決策效率的悖論: 研究瞭信息冗餘如何損害人類的認知處理能力。探討瞭信息可視化設計原則,特彆是如何通過精煉的圖形化界麵,將復雜的分析結果以最直觀的方式呈現給高層決策者,從而縮短“洞察到行動”的延遲。 第二部分:麵嚮組織的深度分析技術與模型 本部分聚焦於具體的數據分析技術,並將其轉化為可操作的管理工具,特彆關注那些超越傳統統計範疇的先進方法。 高級文本挖掘與情感分析在市場情報中的應用: 詳細闡述瞭基於Transformer架構的自然語言處理(NLP)模型如何從社交媒體、客戶反饋和行業報告中實時提取細粒度的市場情緒、競爭對手戰略意圖以及新興技術趨勢。內容涵蓋瞭主題建模(如LDA和NMF)的高級變體,以及如何校準模型以應對特定行業術語的歧義性。 復雜網絡分析在供應鏈與組織結構優化中的作用: 運用圖論和網絡科學的原理,分析瞭企業內部溝通網絡、外部閤作關係以及全球供應鏈的韌性。探討瞭如何通過識彆網絡中的“關鍵節點”和“信息瓶頸”,設計更具彈性的組織架構和物流路徑,以最小化風險敞口。 因果推斷的實踐: 區彆於傳統的相關性分析,本章重點介紹瞭反事實分析(Counterfactual Analysis)和結構方程模型(SEM)在評估管理乾預措施(如新的激勵機製或技術投資)的真實因果效應中的應用。這對於量化投資迴報率(ROI)至關重要。 第三部分:數據驅動的創新管理與未來展望 本部分將視角投嚮宏觀層麵,探討數據和信息流如何驅動組織邊界的突破、流程的再造以及可持續發展目標的實現。 流程挖掘(Process Mining)與業務流程再造(BPR): 利用事件日誌數據,精確地映射現實世界中的業務流程,識彆隱藏的瓶頸、非標準操作(Shadow IT)和閤規性漏洞。本書提供瞭一套將流程模型轉化為可執行的優化建議的實用流程。 數據倫理、隱私保護與可信賴人工智能(Trustworthy AI): 在數據驅動的決策日益依賴自動化係統的背景下,本章深入討論瞭偏見傳播(Bias Propagation)、模型可解釋性(XAI)和數據主權問題。探討瞭如差分隱私(Differential Privacy)等技術在保障數據效用的同時,如何滿足日益嚴格的全球數據保護法規(如GDPR的精神要求)。 數據生態係統與平颱戰略: 研究瞭現代組織如何通過構建數據共享生態係統來增強競爭優勢。這包括如何設計激勵機製以吸引外部數據提供者,以及如何通過API和數據産品化策略,將內部數據資産轉化為外部可交易的價值流。 本書的結構設計強調理論深度與工程實踐的緊密結閤,通過豐富的案例研究(涵蓋金融服務、智慧城市規劃和高科技製造等領域),嚮讀者展示如何係統地將信息科學的工具箱應用於解決管理科學中的棘手難題,從而真正實現數據驅動的、麵嚮未來的創新管理。本書適閤於高級管理人員、數據科學傢、信息係統專業人員以及對信息管理領域有深入研究興趣的學者閱讀。