編輯推薦
“萬捲方法”的受眾
圖書館及大學社會科學各院係的資料室
社會科學工作者各領域的研究人員
社會科學工作者各學科研究方法課程的教學人員
社會科學工作者各專業的研究生和本科生
內容簡介
本書所介紹的樣本設計的思路,為我們提供瞭在整個研究過程中如何在若乾備擇設計方案中進行抉擇的基礎。我們將這一思路稱之為實用抽樣設計方法。我們之所以使用“實用”一詞是因為我們為讀者介紹的框架,強調的是各種可供我們選擇的方案和如何在這些備擇方案中進行選擇的操作要領而非抽樣的理論。本書將在概念上對這樣的框架進行闡述的同時,還輔之以來自實際的抽樣實踐的詳盡實例。雖然本書並不打算多地從理論和數學的角度來介紹抽樣問題,但它介紹的內容都以以往的理論和數學的抽樣著作為基礎,而這些著作將為那些有誌於對這方麵文獻作更深入瞭解的讀者提供瞭一個完整的參考書目。
本書的主要閱讀對象是那些將抽樣作為自己的研究工具的研究人員。同樣,本書也可作為社會和政策科學的本科生的方法課的補充教材,以幫助那些有誌於從事研究工作的學生學習有關抽樣的知識。除上述兩個用途之外,本書也可用作那些在計劃自己的研究項目時,在抽樣方麵需要一些谘詢的研究人員的參考書。而那些計劃進行抽取大的、復雜的樣本的研究人員,則最好去尋求有經驗的抽樣專傢的幫助。
作者簡介
加裏·T.亨利(Gary T.Henry) 在美國弗吉尼亞大學公共管理學教授研究方法、統計學、項目評估和政策分析等課程。曾擔任弗吉尼亞公立學校教學評估指標體係研究的項目負責人和中國某大學統計學客座教授。此外,他也是國傢議會全國會議的成員和演講人。
早年在威斯康星大學取得博士學位之後,他進入瞭弗吉尼亞審計和評審委員會,在那裏擔任首席方法專傢,用定量方法進行教育、懲處和交通問題的研究。隨後在州內閣擔任教育部副部長。他的研究興趣涉及穩健估計、實地因果關係評估和公正評測等方麵。亨利博士是《評估評論》(Evaluation Review)和《公共管理評論》(Public.Administration Review)等雜誌的非常活躍的撰稿人和評審人。他也是美國評估協會規範和道德委員會的主席。
瀋崇麟中國社會科學院社會學研究所研究員,中國社會科學院研究生院教授,“第二、三、四批百縣市國情調查問捲調查”、“中國城鄉居民生活調查”、“中國城鄉傢庭變遷調查”和“中國城鄉社會變遷調查”等研究項目主持人。
內頁插圖
目錄
第1章導論
定義樣本
抽樣和效度
為什麼要抽樣
本書概要
第2章樣本選擇方法
非概率抽樣
非概率樣本的用途
概率抽樣
結論
第3章實用樣本設計法
抽樣設計中的誤差源
實用抽樣設計的框架
抽樣前抉擇
研究的性質究竟是什麼——探索性的、描述性的還是分析性的
最感興趣的變量是什麼
研究的目標總體是什麼
某些子總體或特定的群體是否對研究很重要
用什麼樣的方法收集數據
是否宜於抽樣
抽樣抉擇
什麼樣的目標總體清單可作為抽樣框使用
可容忍的誤差或估計的效應的大小是多少
采用什麼類型的抽樣技術
選擇的概率是相等的還是不等的
選人樣本的單位是多少
抽樣後抉擇
如何評估無迴答問題的影響
樣本數據是否需要加權
研究變量的標準誤差是什麼
小結
第4章實用樣本設計的四個實例
劫匕卡羅萊納州居民調查
抽樣前抉擇
抽樣抉擇
抽樣後抉擇
佛羅裏達高齡老人調查
抽樣前抉擇
抽樣抉擇
抽樣後抉擇
弗吉尼亞齣院精神病人調查
抽樣前抉擇
抽樣抉擇
抽樣後抉擇
調查研究中心的美國本土住戶樣本
抽樣前抉擇
抽樣抉擇
抽樣後抉撣
小結
第5章抽樣框
一般總體的抽樣框
特殊總體的抽樣框
總誤差和抽樣框
結論
第6章抽樣方法
簡單隨機抽樣
係統抽樣
分層抽樣
整群抽樣
多級抽樣
小結
第7章樣本容量
高效樣本的容量
樣本容量設計的實質
子總體分析
不閤格和無問答的修正
費用
信度
小總體抽樣
小結
第8章抽樣後選擇
權的使用
無迴答評估
陳述數據
結論
參考文獻
精彩書摘
第二章 樣本選擇方法
樣本選擇方法可歸結為兩類:概率抽樣和非概率抽樣。概率樣本是以這樣的方式,即總體的每一成員實際上都有一個被選人樣本的概率選取的。非概率樣本的選取都基於研究者的主觀判斷。研究者一般都以手頭進行的研究所要達到的特定目標作為判斷的依據。本書主要介紹概率抽樣。其原因在於概率樣本使我們能對它們進行嚴格的統計分析,從而確定可能的偏倚和誤差。非概率樣本則不具備類似的優點。但是在某些場閤,非概率樣本也不失為一種頗為有用的工具。
非概率抽樣
很多研究項目都使用非概率樣本。這些樣本可以方便地或以某種係統的標準為根據選取。非概率樣本實際上是一組性質各異,用主觀判斷選擇的樣本的抽樣方法的總稱。這些方法在確定將總體中的哪些單位選人樣本時,都以主觀判斷為準。非概率樣本的選擇方法與概率樣本的不同,後者都采用基於某種隨機機製的選擇方法,以確保樣本的選擇能獨立於主觀判斷。
常用的非概率樣本設計有以下六種:
?方便樣本(Conveniences samples)
?最相似/最不相似樣本(Most similar/most dissimilar samples)
?典型個案樣本(Typical case samples)
?關鍵個案樣本(Critical case samples)
?滾雪球樣本(Snowball samples)
?配額樣本(Quota samples)
方便抽樣。方便樣本是由一組樂於接受調查的個人組成的樣本。例如,對電影中的暴力和美國民眾的攻擊性行為這兩者之間的關係感興趣的心理學傢,可以在實驗中使用一些來自選修心理學導論課的學生的誌願者作為實驗對象。學生首先自願報告他們自己對暴力問題的態度、傾嚮,再對他們在一個人為編排的衝突場景中的作為進行觀察。隨後我們用隨機分配法(random assignment)將學生分成兩個組。隨機分配法是一種用來將自願參加實驗的學生分為一個實驗組(treatment group)和控製組(control group)的專門技術。它不同於隨機抽樣。隨機抽樣是一種關乎整個樣本,即兩個組的所有成員的選擇的概率方法。我們在本例中使用的方便樣本不是隨機抽樣。在事後將樣本分為兩個組的時候,譬如像本例那樣,我們應該使用隨機分配法。
一組成員被示以有暴力畫麵的電影,另一組放映的電影則沒有暴力畫麵。隨後我們對兩組的成員進行訪談,再觀察他們在可能有暴力衝突的場景中的言行。然後對兩組成員在電影放映前後的態度和行為的差異進行比較。
參與這一實驗的學生便是一個方便樣本。他們是一個現存的群體的一部分,研究者很方便從這一群體中獲取誌願者。獲取數據的方便性隻是研究者諸多目的中的一個目的。研究的主要目的還在於瞭解暴力電影對美國民眾的影響。但從這樣的樣本得到的數據究竟能使我們對這一問題有多少瞭解,則另當彆論。
除瞭暴力電影揭示的因素之外,在理論上講,還可能存在其他滋長暴力傾嚮的因素。這些其他的因素是一些混淆變量(confoundingvariable)。這些變量使我們難以確定自變量(independent variable)(本例中的暴力電影)的影響。例如,個人在精神或情感上的壓抑程度可能被假設與暴力傾嚮有關。不僅如此,年輕人性格可能比較外嚮,因而更易具有暴力傾嚮。
在這個意義上講,樣本中的所有學生(包括實驗組和控製組)較美國的成年人口總體的壓抑程度不是更高,就是更低。就存在於實驗組和控製組的攻擊性行為的差異而言,樂抑程度同樣也可能是一個混淆變量。如果學生的壓抑程度低於成年人口總體,那麼我們實驗得齣的暴力電影不會使暴力傾嚮有所增長的結論,並不適用於成年人口總體。這樣的設計的主要問題在於在問題涉及壓抑程度時,使用這樣的樣本作為總體的模型是不夠精確的。不僅如此,這樣的樣本也無法瞭解其他假設的可能引發暴力行為的因素。因此,我們無法斷定暴力電影的影響(或沒有影響)這樣的結論是否適用於樣本之外的場閤。
在本例中,年齡是一個更易觀察到的混淆因素。大專院校的學生年齡大多數在18到25歲之間。如果年輕的成年人更傾嚮於暴力行為的話,那麼樣本就可能有偏嚮更高的侵略性行為的偏倚。選擇如本例所示的方便樣本,可能會使結果有偏倚,因而使我們無法將得齣的結論推廣到總體。不言而喻,其他因素也可能對暴力態度和行為有所影響,而這些因素在樣本和總體之間的分布是不均衡的。
不確定性和偏倚可以有兩種方法加以控製:一種方法是使用更多的數據,對方便樣本加以改進;另一種方法是放棄使用方便樣本,改而使用概率樣本。首先,對那些易於量度的特徵,如年齡,我們可以直接加以控製。一個可供我們選擇的方便樣本是比例代錶樣本,即按每一年齡組的比例(但可能不是從一個心理學班)來分配和選擇樣本成員。
我們難以得到有關總體的壓抑程度方麵的信息。而這些信息對於分組和按比例地選擇個體都是必不可少的。隨機選擇可以確保總體的每一成員都有被選人樣本的可能,給我們提供瞭一個控製壓抑程度的量度。隨機選擇是一種隱含的控製,用來得到多種特徵,包括壓抑程度和其他尚未直接控製的特徵的混閤體。隨機選擇,作為概率抽樣的一個重要性質我們將在以下節進行介紹。
我們有必要花費一點時間給大傢介紹一下本例中將學生隨機地分配給實驗組和控製組的問題,以使大傢對與內部效度(internal va—li(tity)有關的選擇偏倚有所瞭解(Cook&Campbell;,1979)。這就是說,實驗組和控製組(二者均由來自該校心理學選修班的學生組成)之問的在侵略性行為上存在的差異可歸結為暴力電影的影響。隨機分配的目的在於去除那些任何其他也許可以解釋存在於誌願者身上的差異的變量。然而隨機分配並不能解決在將從樣本數據發現的效應外推到美國公眾時,可能發生的不確定性和偏倚的問題。在本例中,由於方便樣本的使用,使我們對樣本的發現的概括受到瞭很大限製。
有關無傢可歸者人口和非機構(deinstitutionalization,指20世紀末發生在美國社會中將精神病患者從公立醫院轉到社區醫療服務中心的趨勢,譯者注)問題的文獻為我們提供瞭一個采用方便樣本的具體例子。隨著政策製定者對無傢可歸者問題的嚴重性認識的深入,他們也越來越急需我們能為他們提供有關的經驗數據。這就意味著更多的數據將使用方便樣本收集(Burnam&Koegel;,1988)。通常教堂和其他各種為無傢可歸者提供床位的場所都是我們用來選擇調查對象和收集數據的地方。因為有關什麼樣的人纔可以得到床位的規定將某些人排除在瞭樣本之外,所以這樣的樣本可能存在某些偏倚。此外,某些無傢可歸者並不願意,或不能通過得到一張床位所要求的手續。
近年來,有兩個有關無傢可歸者的研究,試圖為我們提供一些基於概率樣本的信息。羅西、賴特、費希爾和威利斯(Rossi,wright,Fisher,and Willis,1987),以及伯納姆和考傑(Bumam&Koegel;,1988)描述的方法,雖然比方便樣本需要更多的時間和預算,但是他們的發現確實與以前的調查有所不同。例如,伯納姆和考傑發現隻有不到一半(44.2%)的無傢可歸者在教堂或收容所的床上過夜,而基於方便樣本的這一數字幾乎為三分之二(66%)。二者存在明顯的差異。
最相似/最不相似個案抽樣。最相似/最不相似樣本由立意樣本(purposeful sample)變化而來,多用於比較性的政體研究和政策取嚮的個案研究。為瞭比較政治、社會和經濟體係之間的關係,西方國傢,如美國、加拿大、英國、法國、德國和意大利經常被組閤在一起作為一個國傢的樣本。其他的組閤,例如發展中國傢組閤,則常被用來進行諸如國傢債務的增加對國傢的生活水平的影響這樣的研究。在最不相似設計中,為瞭對政策的實施結果進行比較,個案研究經常選擇“最好”和“最壞”的個案。
如果個案和資源都比較有限,而所需的信息主要用來進行比較,這些研究是很有用的,但是問題在於,由這樣的研究得到的結論能否推廣到個案研究的範圍之外。在考慮財産稅率或斷定州資助是否適當時,一個地區常常需要將自己與相鄰的地區進行比較。在這種情況中,地理上的鄰近程度是相似性的操作定義。這些比較既可能,也可能不太精確地刻畫那些在課稅基數或提高地方收入能力相似的地區的相對位置。
典型個案抽樣。在時間和資源極度不足時,我們也常常會改而選取非概率的樣本。“典型個案”設計便是在遇有這樣的情況時采用的抽樣設計。在采用這樣的抽樣設計時,研究者選取為數不多的幾個、他們認為是正常的或一般的個案。為瞭提高設計的信度,那些看做獨特的或特殊的個案都不會被選人樣本。
在這樣的設計中,研究者本人對總體的判斷和瞭解對於樣本的信度是至關重要的。在政策研究中,“典型個案”樣本的選取常常需要進行非常嚴密的詳細審查。對選擇偏倚的疑慮是這樣的樣本存在的一個普遍的問題。使用“典型個案”會引起人們對選取的個案進行詳細的審視,而在人們感到個案並非那麼典型時,我們發現的那些信度就會因此而大為減色。這樣一種類型的設計的個案選擇法,其注意力主要集中在每一單獨的個案上。樣本變成瞭審視的焦點。
關鍵個案抽樣。另一種在許多方麵都與“典型個案”設計頗為相似的非概率樣本設計是“關鍵個案”設計。在關鍵個案設計中,研究者選擇瞭數目有限的幾個個案,這些個案在邏輯上或依據以往的經驗允許我們進行總體的推論。為瞭預測大選的結果,我們可以關鍵個案的邏輯為依據來選擇關鍵的選區。在美國社會幾乎是傢喻戶曉的格言“緬因在握,美國在握”(As Maine goes,SO goes the nation),便是這一設計應用的極端例證。在1948年前的美國大選中,用緬因州的選舉結果來預測全美的選舉結果是非常靈驗的。1948年的大選中,緬因州的選民大多數都把票投給瞭杜威(Dewey)。於是有人喊齣瞭這樣的口號“見緬因而知佛濛特”(As Maine goes.so goes Ver—mont)。
滾雪球抽樣。與其他非概率樣本顯著不同的非概率樣本是滾雪球樣本。滾雪球抽樣藉助先前確定的一組成員來確定總體中的其他成員。隨著新近確定的成員不斷列舉其他的成員,樣本如同滾雪球一般逐漸成長壯大。滾雪球抽樣多用於不存在總體的清單,且研究者也無法自行編撰諸如這樣的清單時。有關各種不同的群體,如非法僑民和社區“權力精英”的社會學研究常采用這種方法來生成總體的樣本。
配額抽樣。另一種非概率抽樣得到的樣本是配額樣本。配額樣本將我們研究的總體的群體分為子群體,例如分為男性和女性,或白人、西班牙裔、美國印第安人和其他少數民族等。然後,根據在最終的樣本中所需的子群體的比例;分配給調查員既定的、需要他們選取和調查的每一子群體的樣本單元數。配額樣本與概率樣本,特彆是與分層樣本有許多相似之處,但是它們在一個重要的方麵卻不盡相同。配額樣本允許調查員在選取樣本個體時做主觀判斷。我們給調查員以明確的指示,告訴他們我們希望應選作調查對象的特徵。例如,我們可能告訴調查員,在某一鄰裏地區選取的被調查人數,其中自人和黑人各多少,或在分配好的額度中,男性和女性各多少。在通常情況下,確定的各個子群體的數目將使整個樣本中各子群體所占比例與總體相同。
但是我們必須要指齣的是,配額樣本的被調查人是由調查員選擇的。斯圖加特(Stuart,1984)指齣,配額樣本可能會引起三種問題:
正如我們將要從這樣一種調查員的自由所證明的那樣,在群體抽樣中,總是存在著發生選擇的偏倚的危險,因為在這樣一種抽樣中,選擇程序的定義並不是十分明確的。至今我們仍然沒有可以用於估計這樣的樣本的標準誤差的有效方法……配額抽樣隱瞞瞭這樣那樣的無迴答問題。(黑體係原作第43頁所強調的要點)
我們之所以說配額抽樣隱瞞瞭無迴答問題,是因為每當調查員在遇有拒絕接受調查的被調查人,或找不到戶中的任何人的時候,隻是簡單地選另外一戶進行調查而已。因而調查員總是可以得到要求的調查數,但是總體中那些難於聯係到的被調查人的比例卻可能會因此而被低估。
庫剋和坎貝爾建議采用一種特殊的配額抽樣法。他們把這種方法叫做“異質詳析抽樣模型”(the model of deliberate sampling for het—erogeneity)(Cook&Campbell,1979)。他們提齣的這種配額抽樣策略,要求我們從各種各樣可能對調查結果有影響的背景和條件中來選取樣本成員。“因此一個綜閤性的教育實驗設計,必須包括來自城市、小鎮和農村地區的不同傢庭背景的,在天資和價值觀上存在很大差異的男孩和女孩。”(Cook&Campbell;,1979,P.75)而這樣一種設計的不足之處在於它難以用來進行歸納概括。研究者至多隻可以說“至少從一個樣本來看,影響是存在的(或不存在的)”(Cook&Campbell;,1979,P.76)。雖然在這樣一個層次上,我們的陳述可被認為是正確的,但是用一個不同的樣本,某些混淆變量(confoundingvariables)有可能使我們的發現不復存在。不瞭解樣本的前提條件,配額抽樣對於理論構建的用處是很有限的。此外,將發現限於某一個特定的樣本的做法,會使我們提供的信息對於政策所産生的影響變得十分有限。
鑒於上述理由,配額樣本作為一種抽樣方法,並不為我們看好。盡管如此,我們一直還在使用配額抽樣,因為在通常情況下,它的費用比概率樣本低。在以戶為基本研究單位的研究中,我們有時會使用一種與配額樣本多少有些相似,但實際上卻是一種概率樣本的抽樣方法。帶有配額的概率樣本要求調查員在特定的地理位置,按照特定的路綫,對配額規定的數目的被調查人進行調查。
蘇德曼對我們之所以將這樣一種抽樣形式看做一種概率抽樣的根據做瞭簡要的闡述:
配額概率樣本的基本假設是,被調查人是可以進行分層的,且層中宜於進行調查的概率是已知的……任何一個被調查人被調查的概率等於他最初被選到的概率與他的宜於進行調查的概率的積。(Sudman,1976,P.193)
然而,配額概率抽樣是一種有偏的抽樣方法,盡管這種偏倚一般不算太大。此外,它的抽樣誤差也高於同樣容量的其他概率樣本(Hess,1985)。
非概率樣本的用途
在某些場閤非概率樣本是一種有用和便於進行調查的抽樣方法。在許多情況中,它是一種比較閤適的抽樣方法,而在某些時候,它是唯一可以使用的抽樣方法。例如在某些特定人口總體,如非法使用毒品的人口總體的研究中,我們不可能得到抽取概率樣本所需的清單。用於滾雪球式抽樣的列舉法可能是唯一可行的抽樣方法。
在研究者的確對人口總體中的特定成員感興趣的時候,用這些特定成員而非整個人口總體中的所有成員來構成樣本時,采用非概率樣本也許也比較恰當。例如,某些比較性的政府研究更感興趣的是某些特定的國傢,而非國傢的分組(如發展中的債務國)。
實用抽樣方法 下載 mobi epub pdf txt 電子書 格式