編輯推薦
·一本非常實用的社會統計軟件Stata數據管理的指導書!
·有效提升大數據時代的數據管理能力和處理能力!
·社會科學工作者、數據工作者的數據管理參考書!
·手把手逐步演示數據管理的流程,易上手,易操作,突齣實務!
·國際Stata齣版社授權,中國人民大學中國調查與數據中心翻譯,準確、經得起檢驗的數據管理實務手冊。
一本生動可讀的數據管理書。作者就像是一個坐在對麵娓娓道來的講故事的人,將數據管理的流程和步驟一一展現,讓我們重新認識到Stata在數據管理方麵的迷人魅力。大數據時代,讓數據為我所用,易用,樂用,是這本書的一個齣發點。
該書的翻譯也是可圈可點的,精確,流暢,譯者唐麗娜不虧是科班齣身並長期緻力於社會統計的專傢,她在社會數據的管理與統計方麵的專業經驗,以及在CGSS(中國綜閤社會調查)項目中豐富的實操經驗,也極大保證瞭這本書的翻譯質量。
內容簡介
數據管理是介於原始數據收集和統計分析之間的一項重要工作,其包含瞭數據分析中那些挑戰性的方麵。《Stata環境下的數據管理實務手冊》從Stata入手,展示瞭Stata在管理數據工作中的作用,而非僅僅是其在統計上的優勢。
《Stata環境下的數據管理實務手冊》各章甚至各章中的大多數小節都是相互獨立的,每一部分都關注某一個特定的數據管理任務,並且提供瞭相應的實例來展示如何在Stata中實現這一特定數據管理任務。這使得本書提供瞭兩種不同的方式供讀者使用。讀者可挑選其中某一章節進行閱讀學習,或以數據管理任務為導嚮快速獲得相應幫助。
《Stata環境下的數據管理實務手冊》包含11章,第1章是簡介,第2—5章討論數據管理的基本問題:讀入和保存數據、數據清理、給數據加標簽以及創建變量。第6—8章討論的是在數據管理項目中較為常見的問題:閤並數據、處理子群體中的個案以及改變數據結構。第9章討論的是有關數據管理編程的問題。其相對第2—5章的內容而言更為深入和高級。這章描述瞭應怎樣組織構建數據分析以便其能被循環使用,並介紹瞭很多用來處理重復性任務的簡單編程方法。第10章主要為拓展內容,介紹瞭怎樣為本書獲取一些在綫資源,如何尋找和安裝其他STATA用戶編寫的程序,並推薦瞭一係列補充的在綫資源。最後附錄列齣STATA操作中的一些基本要素。這些要素並不是關於某一個特定的數據管理任務,較為分散,但卻無處不在。
作者簡介
邁剋爾 ·N·米歇爾(Michael N. Mitchell),是一位醫療衛生服務領域的高級統計師。12年來,他一直在加州大學洛杉磯分校學術技術服務部門的統計谘詢組工作。所著書籍有A Visual Guide to Stata Graphics,Interpreting and Visualizing Regression Models Using Stata,Stata for the Behavioral Sciences等。
唐麗娜,社會學博士,就職於中國人民大學中國調查與數據中心。研究領域為宗教社會學、社會調查方法與技術、社會科學數據管理及數據可視化、數據庫建設。
內頁插圖
精彩書評
有人說收集數據就像收垃圾一樣:收集之前就應該想好怎麼處理它。
——羅素.福剋斯,馬剋思.哥白尼和羅伯特.虎剋
目錄
第一章 入門介紹
1.1 本書的使用
1.2 本書的概要
1.3 本書使用的案例
第二章 讀取和錄入數據
2.1 簡 介
2.2 讀入Stata數據
2.3 保存Stata數據
2.4 讀取逗號或製錶符作分隔符的文件
2.5 讀取空格作分隔符的文件
2.6 讀取固定格式文件
2.7 讀取一條觀測值包含多行原始數據的固定格式的文件
2.8 讀取SAS XPORT文件
2.9 讀取數據時的常見錯誤
2.10 在Stata數據編輯器中直接輸入數據
2.11 保存逗號或製錶符作分隔符的文件
2.12 保存空格作分隔符的文件
2.13 保存SAS XPORT文件
第三章 數據清理
3.1 簡 介
3.2 數據的雙錄
3.3 單個變量檢查
3.4 用分類變量檢查分類變量
3.5 用連續變量檢查分類變量
3.6 用連續變量檢查連續變量
3.7 修正數據中的錯誤
3.8 識彆重復錄入
3.9 關於數據清理的總結性思考
第四章 給數據加標簽
4.1 簡 介
4.2 描述數據
4.3 給變量加標簽 4.4 給取值加標簽
4.5 標簽的作用
4.6 用不同的語言給變量和取值加標簽
4.7 給數據添加注釋
4.8 格式化變量的顯示
4.9 改變數據中的變量順序
第五章 創建變量
5.1 簡 介
5.2 創建和修改變量
5.3 數值錶達式和函數
5.4 字符錶達式和函數
5.5 重新編碼
5.6 給缺失值編碼
5.7 虛擬變量
5.8 日期變量
5.9 日期-時間變量
5.10 變量間的計算
5.11 個案間的計算
5.12 更多的使用egen命令的例子
5.13 把字符型變量轉換成數值型變量
5.14 把數值型變量轉換成字符型變量
5.15 變量重命名和變量排序
第六章 閤並數據
6.1 簡 介
6.2 添加數據
6.3 添加數據時存在的問題
6.4 一對一匹配閤並數據
6.5 一對多匹配閤並數據
6.6 閤並多個數據
6.7 更新閤並
6.8 閤並數據時的其他選項
6.9 閤並數據時的問題
6.10 連接數據
6.11 交叉閤並數據
第七章 處理分組的觀測值
7.1 簡 介
7.2 為每個分組獲取獨立的結果
7.3 分組獨立計算數值
7.4 組內計算:加下標的觀測值
7.5 組內計算:跨觀測值計算
7.6 組內計算:求和
7.7 組內計算:更多示例
7.8 比較by命令和tsset命令
第八章 改變數據形狀
8.1 簡 介
8.2 寬數據和長數據
8.3 長數據轉換成寬數據
8.4 長數據轉寬數據時的問題
8.5 寬數據轉換成長數據
8.6 寬數據轉長數據時的問題
8.7 多層次數據
8.8 延展數據
第九章 數據管理編程
9.1 簡 介
9.2 對數據管理長期目標的建議
9.3 執行do文件和製作日誌文件
9.4 數據檢驗的自動化
9.5 閤並do文件
9.6 介紹Stata中的宏
9.7 使用Stata中的宏
9.8 通過變量循環實現命令的重復執行
9.9 通過數字循環實現命令的重復執行
9.10 任何數據管理都能用循環實現命令的重復執行
9.11 獲取Stata命令保存的結果
9.12 把estimation命令的結果保存為數據
9.13 編寫Stata程序
第十章 附加資源
10.1 本書的在綫資源
10.2 搜索並安裝其他程序
10.3 更多在綫資源
附錄 基礎知識
A1.簡 介
A2.Stata語法概述
A3.用by命令進行分組分析
A4.注釋
A5.數據類型
A6.邏輯錶達式
A7.函數
A8.用if和in對觀測值進行分組
A9.用keep和drop選擇觀測值和變量
A10.缺失值
A11.變量列錶
主題詞錶
精彩書摘
書如其名,這是一本關於用Stata來管理數據的操作手冊。作為一本操作手冊,也就沒有必要一定遵循某種順序來閱讀每個章節。書中各章不僅各自獨立,並且各章中的大多數小節也相互獨立。書中每一部分都關注某一個特定的數據管理任務,且提供瞭相應的示例來展示如何在Stata中實現這一特定的數據管理任務。我認為本書至少有兩種使用方式。
讀者可挑選其中一章,比如第3章“數據清理”,通過閱讀這一章來掌握一些有關如何清理和準備數據的新知識點或小技巧。這樣,當下次需要清理數據時,就可以直接使用之前學到的這些相關知識點,如果需要的話,也可以再快速瀏覽一下相關章節。
或者,麵對之前從來沒有做過的數據任務(或者也許之前做過,但是已經很長時間沒有操作過瞭),希望能夠快速獲得幫助。例如,要讀入一個用逗號作為分隔符的數據文件。這時候,拿起這本書直接翻到第2章“讀入數據”的2.4節,這節介紹瞭如何讀入以逗號和製錶符作分隔符的數據文件。根據這節中的示例,就能把逗號分隔的數據文件讀入Stata,然後繼續你的數據處理工作。
當閱讀這本書的時候,讀者會發現本書的每個章節都是為解決某個具體問題而設計的,但韆萬不要迷失在一些附屬或難懂的細節之中。如果發現自己需要瞭解一些更深的知識,本書的每個小節也列齣瞭一些Stata幫助文件中的相關參考文件,這些參考中包含瞭更多的知識。如果讀者用的是Stata 11.0版本,那麼這些幫助文件中還包含瞭在綫參考手冊的鏈接。由於本書是按照實際數據管理中會遇到的不同任務來組織的,而Stata的參考手冊是根據命令來組織的,因此我希望本書能夠幫助讀者將手頭上要處理的數據管理任務和手冊中與這些任務相關的對應條目聯係起來。從這個角度來看,本書並不是Stata參考手冊的競爭者,相反是它們的使用指南。
建議讀者能夠自己去操作和運行書中的示例。和被動學習(比如僅閱讀本書)相比,實際操作讓你進入一種主動學習的狀態。如果讀者主動在Stata中敲入命令,查看運行結果,自己試驗同一命令的變體,那麼相信這時你對知識的理解,和被動學習相比,會更好且更深入。
為瞭方便讀者重復操作書中列齣的示例,書中所有的數據都可以從網絡上直接下載。通過在Stata中鍵入下麵的命令,將書中涉及到的所有數據直接讀入Stata的當前工作目錄下:
執行完這些命令後,就可以使用這些數據瞭,比如:要用數據wws.data,隻需鍵入如下命令即可:
. use wws
書中每個小節都是獨立的,因此可以在每個小節開時,鍵入相關命令,直接重復運行本節中的示例。有時,甚至可以在某個小節的中間重復運行一個示例,但並不是在所有的小節中都能這麼操作。此時,需要重新迴到這一小節的開頭來重復這些示例。盡管大部分的章節是獨立的,但有些部分仍是建立在之前章節的基礎上。即使在這種情況下,數據也是可用的,以便讀者能從任何一個給定小節開頭部分來運行這些示例。
盡管書中講的所有示例都可以通過點擊Stata菜單中的相關條目來實現,但本書的重點是使用Stata的命令行進行操作。但,有一點需要說明:Stata裏有兩個非常方便的交互界麵/點擊的功能,即使一些以寫命令為主的用戶(包括我自己)也會發現這些功能很有用。數據編輯器(Data Editor,2.10節會介紹)是一個非常有用的用來把數據錄入Stata的交互界麵。在這節中,還介紹瞭變量管理器(Variable Manager)的使用。雖然這是在給一個新創建的數據添加標簽的背景中,介紹變量管理器,但它對修改(或增加)一個既存數據的標簽同樣非常有用。
需要說明的是本書是在Stata 11.0下寫成的。書中大部分示例在11.0之前的版本中也同樣有效。但是,有些示例在11.0之前的版本下是無效的,最明顯的是第6章中那些用來講解數據閤並的例子。
這就提齣瞭一個問題,讀者要一直保持自己所用的Stata是最新的,這也是一個不錯的練習。要想證實你的Stata是最新版並獲取所有免費更新,輸入下麵這個命令:
然後根據提示操作。升級完成後,可鍵入命令 help whatsnew來查看剛剛都更新瞭些什麼以及此前Stata的更新記錄。
在下載完所需數據並實現Stata的全麵升級後,便可投入到本書的學習中,並親自操作書中的所有示例。在此之前,希望讀者能看完下麵一節,它是對本書的總體介紹,能夠幫助讀者選擇可能是你想最先閱讀的章節。
……
前言/序言
Stata 環境下的數據管理實務手冊 下載 mobi epub pdf txt 電子書 格式