缺失數據的多重插補:應用案例與軟件操作

缺失數據的多重插補:應用案例與軟件操作 下載 mobi epub pdf 電子書 2024


簡體網頁||繁體網頁
嚴潔 著



點擊這裡下載
    

想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

發表於2024-12-24

類似圖書 點擊查看全場最低價


圖書介紹

齣版社: 重慶大學齣版社
ISBN:9787562496359
版次:1
商品編碼:12046015
包裝:平裝
叢書名: 萬捲方法/社會科學研究方法·前沿與應用叢書
開本:32開
齣版時間:2017-02-01
用紙:膠版紙
頁數:300
字數:185000


相關圖書





圖書描述

編輯推薦

  近些年來,越來越多的社會科學領域學者應用社會調查的方法來探討中國政治、經濟、社會發展過程中的理論和實踐問題。但是在社會調查的數據采集過程中,由於各種原因而無法獲得某個樣本的任何一項迴答或者無法獲得樣本對某個或某些個問題的迴答的情況越來越多,前者稱為單元無迴答/單元無應答,後者稱為項目無迴答/題目無應答。由無迴答引起的數據缺失對於後期的數據分析造成很大的影響,為此,在使用統計分析方法進行描述和推斷之前,需要考慮缺失值的處理問題。
  對於缺失值的處理有多種方法,其中多重插補(multiple imputation)是近些年來廣泛接受的一種方法。

內容簡介

  簡單地說,多重插補就是給每個缺失單元插補上多個值。主要包括插補、分析、綜閤三大步驟。對於多重插補,通常會有如下一係列疑問:
  1.一個缺失的單元為什麼可以給齣多個插補值?
  2.這些插補值是怎麼計算來的?
  3.既然要插補多個值,那麼需要插補多少個比較閤適?
  4.插補後的數據集該怎麼用?
  5.什麼情況下可以用多重插補?
  6.怎樣藉助統計軟件來做多重插補?
  《缺失數據的多重插補:應用案例與軟件操作》這本書的主要目的就在於藉助實例來解答這些問題。本書包括三個部分,在第一部分主要介紹多重插補的基本原理和方法、步驟;第二部分則藉助4篇精心挑選齣來的文章,通過對文章的評析來進一步解答有關多重插補方法的細節問題和相應的注意事項;第三部分則講解和示例如何用SPSS、STATA這兩種統計軟件來實現多重插補。

作者簡介

  嚴潔(女),北京大學政府管理學院副教授,政治學定量研究方嚮博士生導師。主要從事社會科學定量研究方法研究。兼任北京大學中國國情研究中心副主任、北京大學中國社會科學調查中心執行團隊負責人。自1995年以來設計並組織實施瞭近百項大規模抽樣調查。作為主要執行者參與瞭4波《世界價值觀調查-中國》,4波《中國傢庭追蹤調查》,2波《世界精神健康調查-中國》等世界知名大型抽樣調查。與瀋明明教授、PierreF.Landry教授共同創立瞭“GPS輔助區域抽樣方法”。在《社會學研究》、《社會》等核心刊物上發錶多篇文章。曾主持國傢自然科學基金項目“並行數據與數據質量管理”,並作為主要參與者參與瞭多項國傢社科基金項目。

精彩書評

  調查數據的缺損,是任何調查活動都無法避免、也無法迴避的議題,在現有中文文獻中,教材大多隻是介紹處理缺損值的原則性方法,如刪除、用平均值插補、用數值平滑方法插補等,期刊論文大多隻討論某一類缺損值插補的專門方法,缺乏對缺損值插補進行係統探討的文獻。《缺失數據的多重插補:應用案例與軟件操作》正是填補這一空白的作品。
  這本書不僅對調查數據插補的發展曆史做瞭介紹,也係統地探討瞭適用於不同缺損值情景的插補方法,對實際操作而言,更有價值的是為運用既有的統計軟件進行缺損值插補提供瞭操作指南,是清理調查數據、運用調查數據進行研究者難得的一份案頭文獻。
  ——邱澤奇,北京大學社會學係教授,北京大學中國社會與發展研究中心主任

  多重插補是個非常繁復細緻的工作,它不單單是數據處理的一種技術方法,更要求聯係研究項目本身的方方麵麵,而嚴潔這本書有兩個突齣的特點,為讀者深入係統地瞭解和掌握它提供瞭可能。她為缺乏實際經驗的學生和讀者提供瞭大量而具體的實例,使他們得以理解這種方法的意義並學會如何運用;她詳細地介紹瞭運用現有計算機軟件完成這項工作的方法,使瑣細繁復的工作變得易於操作,從而能夠在教學和實際工作中給學生和研究者提供針對無迴答問題的解決辦法和很好用的工具。我希望,也相信,這本書能夠為更多學生和研究者所用,成為案頭工具書。
  ——瀋明明,北京大學政府管理學院教授,北京大學中國國情研究中心主任

  在當今以準確信息進行決策的時代,在醫學領域進行人群研究,多數以抽樣調查的方法,並采用醫學問捲對受訪者進行訪談或自評,在這個互動的過程中,受訪者的單元無迴答和項目無迴答,以及訪員調查差錯等諸多原因造成調查數據缺失,無法保證數據齊全。以往的研究在資料分析階段,因為無法重新調查而隻能分析有缺失值的數據,影響結果的真實性。
  《缺失數據的多重插補:應用案例與軟件操作》針對上述有缺失值但卻不能彌補的常見缺陷,提供瞭實用性的改善方法。通過對缺失值數據插補,可以科學地避免因缺失數據而影響統計分析的質量。本書詳細介紹瞭多重插補方法的發展曆程,提供瞭統計軟件的操作指南,並用案例加以說明,是醫學科研進行高質量數據分析的理想工具書。
  ——黃悅勤,中國疾病預防控製中心精神衛生中心主任、教授,中國心理衛生雜誌社社長,北京大學精神衛生研究所社會精神病學與行為醫學研究室主任

目錄

導言 社會調查、無迴答與缺失數據
第1章 刪除法和單一插補法
1.1刪除法
1.1.1 列錶刪除
1.1.2 成對刪除
1.2單一插補法
1.2.1 均值插補
1.2.2迴歸插補
1.2.3 熱平颱插補
1.2.4 冷平颱插補
1.2.5 LOCF與BOCF法
第2章 多重插補法概述
2.1多重插補的基本原理
2.1.1 什麼是多重插補?
2.1.2 為什麼一個缺失單元可以有多個插補值?
2.1.3 缺失類型
2.1.4 多重插補的方法
2.1.5 進行多少次插補纔有效?
2.1.6 多個插補值怎樣使用?
2.1.7 什麼情況下用多重插補?
2.2 多重插補的發展簡史
2.2.1 起始階段(1977-1987年)
2.2.2 第二階段(1988-1997年)
2.2.3 第三階段(1998年至今)
第3章 多重插補的方法、步驟
3.1準備插補變量
3.1.1初步設定分析模型
3.1.2初選插補模型的變量
3.2檢驗和確定插補模型
3.2.1選擇插補方法
3.2.2變量轉換
3.2.3多重共綫性診斷
3.2.4確定插補次數
3.2.5執行多重插補,並診斷插補模型
3.3 多重插補後的統計分析
3.3.1 插補後進行簡單隨機抽樣下的統計分析
3.3.2 插補後進行復雜抽樣下的統計分析
3.4 小結
第4章 應用案例分析
4.1政治學應用案例
4.2教育學應用案例
4.3經濟學應用案例
4.4管理學應用案例
第5章 使用SPSS、STATA軟件做多重插補
5.1使用SPSS軟件做多重插補
5.2使用STATA軟件做多重插補
5.2.1 多重插補前的準備工作
5.2.2 多重插補
5.2.3 多重插補後的統計分析
5.3 SPSS、STATA、SAS、R軟件做多重插補的異同
參考文獻

精彩書摘

  1.什麼是無迴答
  無迴答是指在數據采集過程中,由於各種原因而無法獲得某個樣本的任何一項迴答或者無法獲得樣本對某個或某些個問題的迴答的情況,前者稱為單元無迴答(unit nonresponse),後者稱為項目無迴答(item nonresponse)。
  單元無迴答包括“無法接觸到樣本單位(no contact)”,“拒訪(refusal)”,“無能力迴答(incapacity)”等幾種情況。根據美國“民意調查研究協會(The American Association for Public Opinion Research)”確定的電話調查、入戶調查、郵寄問捲調查迴答率的計算標準中的相關定義(APPOR,2011):“無法接觸到樣本”包括這樣一些情況:(a)不能進入這個建築物;(b)住戶內沒有人;(c)受訪人不在或者找不到。判斷一個樣本是否屬於“無法接觸到樣本”,研究者必須確定樣本單位是一個非空的、有符閤資格的受訪人居住的、並且沒有接觸到的住戶成員是可完成的這三個必要條件。“拒訪”包括住戶單位或者住戶內的成員拒絕訪問的情況,有時也包括采訪中斷的情況。“無能力迴答”則包括受訪人盡管符閤被采訪的資格,而且他/她也願意接受訪問,但是由於語言或者身體、精神不適等原因沒有能力完成訪問的情況。
  以上這幾種情況占單元無迴答總數的比例因調查內容和調查方式而不同。概率抽樣調查相對於非概率抽樣調查會遇到較多的單元無迴答的情況。在多數概率抽樣調查中,“無能力迴答”(例如:身體、語言障礙,不識字等)的情況相對較少,“無法接觸到樣本單位”的情況較多。近些年,在中國城市範圍內,如果進行以個人為樣本單位的概率抽樣調查,並且以居民的戶籍資料為抽樣框的話,那麼“無法接觸到樣本單位”的比例會比較高,主要原因在於中國社會中處於流動中的人群正在擴大,人戶分離的情況越來越多。這些人多數人因無法聯係上而成為單元無迴答的樣本。“拒訪”的比例受調查方式(例如:入戶調查和電話調查)、問捲內容(例如:敏感性問題)、調查地點(例如:城市和農村)、采訪員素質以及被調查人群的特徵等諸多方麵的影響。在抽樣調查中,如何降低拒訪率一直是調查者所必須關注的問題。
  項目無迴答一般包括“不知道”(don’t know)、“拒絕迴答”(refuse to answer)、“沒有觀點(no opinion)” 、“不適用”(no applicable)、“沒有答案”(no answer)等多種情況。其中,不知道、拒絕迴答、沒有觀點比較容易理解,都是受訪人給齣的直接的答案。“不適用”通常是因為問捲中的跳問而自動賦值的,例如,對於詢問受訪人“是否參加瞭工會”這道題,如果是從事農業生産的受訪人,就應該屬於不適用迴答這道題目的情況,該題目會被跳過去,係統自動産生的數值就是代錶“不適用”。“沒有答案”通常是指那些應該迴答而沒有迴答的情況,例如,有可能是訪問員漏問瞭,也有可能詢問之後忘記記錄答案。
  2.什麼是缺失值
  缺失值(missing value)簡單地概括就是缺失的觀測值。缺失值的型態有兩種(吳明隆,2010),一為係統自定義的缺失值,二為使用者自定義的缺失值。
  所謂係統自定義的缺失值,是指本來就不適用,並且也沒有采集到觀測數據的情形,在社會調查中通常發生在一些應該進行跳問的題目中,例如,需要詢問職級的時候,對於從事農業生産的人,就不再詢問職級瞭,那麼在職級的變量中,凡是迴答從事農業生産的樣本,就會由係統自定義為缺失值。在本書中稱之為“不適用”,對於這種情形導緻的缺失值,不用進行插補或其他處理,因為在分析多變量之間關係的時候,這些樣本在某種情況下不適於納入分析,例如,分析職級對人們工作滿意度的影響,那些從事農業生産的樣本不應該被納入分析。
  第二類是研究者自定義的缺失值,是指本來已經采集到瞭數據,但是這個數據根據研究者的判斷被定義為缺失值。例如,在一次調查中,對於職業變量,受訪人迴答“不知道”,研究者根據一些條件最終將其定義為缺失值;也有一種情況是閤理的一些值,但是研究者認為這些值屬於特異個案,不滿足其研究需求,也會將其定義為缺失值,例如,在詢問受訪人個人一個月的文化消費時,如果有1個樣本迴答“20萬元”,研究者可能就會將其定義為缺失值。
  對於那些需要研究者來自定義的缺失值,研究者首先要進行判斷工作。即,哪些值應該或需要被定義為缺失值。這些值裏麵,最常見的就是項目無迴答。在項目無迴答中,“沒有答案”通常是由於訪員漏問、漏記或者造成的,一般情況下都屬於“缺失值”。
  但是“不知道”、“拒絕迴答”、“沒有觀點”則需要根據題目本身的含義、研究者的測量目標和受訪人的實際情況而定,很難簡單地製定統一的判定標準。例如,當詢問受訪人是否滿意現在的生活時,受訪人應該有能力或者有信息幫助他能夠迴答,如果選擇瞭“沒有觀點”,則可以視為“缺失值”。但是當問到受訪人對於“政府應該規定個人收入的最高限額”這種說法的態度時,如果選擇瞭“沒有觀點”,則可以視為有效迴答,因為他提供瞭有效的信息,可能真的是沒有任何觀點。
  對於知識、信息類的題目,“不知道”通常是有效的答案,會參與統計分析的過程,例如:詢問政治知識的題目“您知道美國現任總統是誰嗎?”,如果迴答不知道,則可以視為有效迴答,這部分人要作為一類人來進行統計分析,而不能直接視作缺失值。
  在項目無迴答的幾種類型中,受訪人迴答“不知道”的情況通常相對比較多一些,因此,如果把“不知道”視為缺失值的話,更有可能對樣本估計産生影響,但是缺失值的比例到多大時會成為問題,目前還沒有一個標準,要依據研究目的、研究內容,以及缺失值的分布特徵而定。有些學者認為,通常情況下,小於5%的缺失值應該不會産生什麼問題(Gilljam and Granberg,1993)。
  如果缺失值存在,研究者必須首先對缺失值進行處理,然後纔能進行統計分析。
  ……

缺失數據的多重插補:應用案例與軟件操作 下載 mobi epub pdf txt 電子書 格式

缺失數據的多重插補:應用案例與軟件操作 mobi 下載 pdf 下載 pub 下載 txt 電子書 下載 2024

缺失數據的多重插補:應用案例與軟件操作 下載 mobi pdf epub txt 電子書 格式 2024

缺失數據的多重插補:應用案例與軟件操作 下載 mobi epub pdf 電子書
想要找書就要到 圖書大百科
立刻按 ctrl+D收藏本頁
你會得到大驚喜!!

用戶評價

評分

好書,值得一購!

評分

書寫的挺好的,值得一讀。

評分

書寫的挺好的,值得一讀。

評分

好書,值得一購!

評分

好書,值得一購!

評分

好書,值得一購!

評分

書寫的挺好的,值得一讀。

評分

此用戶未填寫評價內容

評分

2

類似圖書 點擊查看全場最低價

缺失數據的多重插補:應用案例與軟件操作 mobi epub pdf txt 電子書 格式下載 2024


分享鏈接




相關圖書


本站所有內容均為互聯網搜索引擎提供的公開搜索信息,本站不存儲任何數據與內容,任何內容與數據均與本站無關,如有需要請聯繫相關搜索引擎包括但不限於百度google,bing,sogou

友情鏈接

© 2024 book.teaonline.club All Rights Reserved. 圖書大百科 版權所有