1、各 種 抽 樣 方 法 之 選 擇 、 步 驟 及 優 劣比 較一 、 簡 介調 查 之 目 的 即 在 蒐 集 資 料 , 由 資 料 中 獲 得 訊 息 , 以 對 未 知 狀況 或 現 象 , 加 以 瞭 解 , 提 供 決 策 參 據 。 調 查 方 式 可 採 普 查 或 抽 樣調 查 。 普 查 : 即 對 欲 研 究 對 象 (母 體 )中 每 一 份 子 均 加 以 調 查 。 抽樣 調 查 : 由 所 欲 研 究 對 象 (母 體 )中 抽 取 一 部 分 份 子 (樣 本 ), 加 以調 查 蒐 集 資 料 。普 查 之 優 缺 點 與 必 要 性 :1.普 查 優 點 :
2、(1)包 羅 母 體 中 每 一 份 子 , 最 能 陳 示 母 體 狀 況 。(2)可 做 各 細 分 特 性 之 統 計 分 析 。(3)不 致 產 生 抽 樣 誤 差 。2.普 查 缺 點 :(1)耗 費 大 量 人 力 , 物 力 , 財 力 。(2)整 理 時 間 過 長 , 統 計 結 果 常 有 過 期 之 憾 。(3)調 查 問 卷 不 易 深 入 。(4)易 導 致 非 抽 樣 誤 差 。3.普 查 必 要 性 :(1)基 本 國 勢 之 陳 示 。(2)各 種 抽 樣 調 查 之 母 體 。(3)細 分 特 性 之 陳 示 。(4)各 種 抽 樣 調 查 估 計 之 權 數
3、 。第四章 各種抽樣方法之選擇、步驟及優劣比較抽 樣 調 查 :抽 樣 調 查 係 自 調 查 對 象 之 母 體 中 抽 取 一 部 份 個 體 , 加 以 觀 察 ,然 後 再 推 估 母 體 之 現 象 。 抽 樣 調 查 成 為 科 學 的 調 查 方 法 , 乃 是 由於 推 測 統 計 理 論 的 發 展 , 加 上 近 年 來 統 計 的 重 要 性 倍 增 , 依 據 調查 資 料 與 現 存 事 實 進 行 之 交 叉 分 析 結 果 頗 獲 各 方 關 心 , 主 要 原 因須 歸 功 於 統 計 在 經 濟 發 展 中 所 發 揮 的 功 能 , 所 以 統 計 學 中
4、的 抽 樣調 查 不 僅 是 一 門 學 問 , 業 已 成 為 研 究 社 會 問 題 與 經 濟 現 象 的 主 要工 具 之 一 。1.抽 樣 之 基 本 觀 念(1)抽 樣 不 過 是 一 個 方 法 、 手 段 、 其 最 終 目 標 仍 在 推 論 。(2)對 於 各 種 抽 樣 方 法 , 建 立 直 覺 的 瞭 解 , 以 及 探 求 其 優 點 及 限制 。(3)注 意 各 種 抽 樣 方 法 之 觀 念 及 使 用 時 機 。(4)不 要 見 樹 而 不 見 林 。 (注 意 樣 本 之 代 表 性 )2.抽 樣 之 基 本 原 則(1)所 抽 樣 本 能 以 代 表 母
5、體 。 (代 表 性 )(2)以 樣 本 訊 息 估 計 母 體 之 特 性 , 要 儘 可 能 精 確 , 並 且 可 測 度 其可 信 度 (精 確 性 )。(3)取 樣 成 本 要 儘 量 少 。 (成 本 低 )(4)配 合 不 同 之 母 體 狀 況 及 行 政 限 制 下 , 採 取 適 宜 方 法 (即 考 量實 務 問 題 )。 亦 即 如 何 達 到 快 速 、 準 確 、 具 代 表 性 而 又 能 配合 實 務 。 (可 行 性 )3.抽 樣 的 步 驟建 立 母 體 分 析 母 體決 定抽 樣 方 法 選 定估 計 量 估 計 量 的變 異 數 信 賴區 間決 定樣 本
6、 大 小 樣 本 抽出 方 式 樣 本 與 母 體差 異 分 析4.抽 樣 調 查 優 點(1)抽 樣 調 查 可 節 省 人 力 與 財 力 。(2)抽 查 可 縮 短 調 查 與 整 理 時 間 。(3)抽 查 所 抽 出 之 樣 本 可 做 更 詳 細 之 調 查 。(4)抽 查 可 迅 速 獲 得 調 查 結 果 。(5)可 配 合 研 究 特 性 與 機 動 性 之 行 政 措 施 。本 章 的 概 述 最 主 要 目 的 是 作 為 導 讀 之 用 , 期 望 讀 者 在 念 完 本章 節 後 對 抽 樣 調 查 有 些 許 初 步 的 認 識 與 興 趣 , 並 在 往 後 各
7、章 內 容中 均 有 非 常 詳 細 的 介 紹 。 現 在 , 就 讓 我 們 一 同 進 入 抽 樣 調 查 的 世界 裡 , 一 探 抽 調 的 神 奇 之 美 。二 、 抽 樣 方 法 之 分 類抽 樣 方 法 分 類 : 可 粗 分 為 非 機 率 抽 樣 與 機 率 抽 樣 。(一 )非 機 率 抽 樣 : 亦 即 樣 本 不 按 照 其 機 率 予 以 抽 出 , 而 是 由 抽樣 者 之 主 觀 抽 出 或 自 願 樣 本 。優 點 : 在 某 些 調 查 時 , 有 其 必 要 性 。缺 點 : (1)難 以 評 斷 樣 本 之 代 表 性 。(2)無 法 估 計 精 確 度
8、 。(3)樣 本 偏 差 往 往 較 大 。第四章 各種抽樣方法之選擇、步驟及優劣比較非 機 率 抽 樣 之 種 類 :1.便 利 樣 本 (偶 然 樣 本 )事 先 不 預 定 樣 本 , 碰 到 即 問 或 自 動 回 答 者 。 如 街 頭 訪 問 或 主動 打 電 話 回 答 問 題 者 。 缺 點 : 注 意 樣 本 之 偏 激 性 及 兩 極 化 。2.立 意 樣 本 (判 斷 樣 本 )由 抽 樣 者 立 意 抽 取 之 樣 本 。 如 民 間 代 表 、 意 見 領 袖 、 學 者 、專 家 或 代 表 性 之 樣 本 。3.滾 式 樣 本 (輻 射 樣 本 )利 用 樣 本
9、尋 找 樣 本 , 亦 即 利 用 樣 本 之 滾 雪 球 方 式 或 輻 射 力 抽取 樣 本 。 如 都 市 中 之 原 住 民 抽 樣 。 使 用 時 機 : 可 用 於 當 樣 本不 易 取 得 時 , 或 針 對 特 殊 族 群 之 調 查 。4.配 額 樣 本 :按 母 體 某 些 特 性 予 以 配 置 樣 本 , 但 取 樣 時 卻 由 調 查 員 任 意 抽取 。 非 機 率 抽 樣 有 時 雖 然 可 予 使 用 , 惟 在 其 結 果 之 引 用 上 ,要 特 別 注 意 , 亦 即 其 結 果 之 參 考 性 大 於 其 實 際 之 代 表 性 。(二 )機 率 抽 樣
10、 : 抽 取 之 樣 本 是 按 照 樣 本 之 機 率 隨 機 抽 出 。優 點 :1.樣 本 較 具 代 表 性 。2.可 計 算 估 計 之 精 確 度 。3.可 隨 不 同 之 抽 樣 設 計 採 取 不 同 之 抽 樣 方 法 。4.隨 之 不 同 之 抽 樣 方 法 , 採 取 相 互 配 合 之 估 計 方 法 。機 率 抽 樣 之 種 類 :1.簡 單 隨 機 抽 樣不 對 母 體 加 以 任 何 修 飾 或 分 割 , 而 使 每 一 樣 本 均 有 相 同 之 被抽 中 機 率 。2.分 層 隨 機 抽 樣將 母 體 按 照 某 些 特 性 , 分 成 數 個 不 重 疊
11、的 組 群 , 這 些 組 群 即稱 為 層 , 而 再 由 各 層 分 別 抽 取 樣 本 。3.系 統 抽 樣將 母 體 之 元 素 按 順 序 編 號 後 , 有 系 統 的 每 隔 一 定 間 隔 抽 取 一個 樣 本 之 方 法 。4.集 體 抽 樣將 母 體 中 相 鄰 近 之 個 體 排 成 為 一 集 體 , 而 以 集 體 為 抽 樣 單 位 ,即 每 一 抽 樣 單 位 為 一 集 體 之 抽 樣 單 位 。5.兩 段 集 體 抽 樣首 先 抽 出 一 些 樣 本 集 體 , 再 由 樣 本 集 體 內 抽 出 部 分 基 本 個 體 。6.分 層 集 體 抽 樣將 母 體
12、 內 之 集 體 予 以 分 層 後 , 再 由 各 層 抽 取 樣 本 。三 、 各 種 抽 樣 方 法 之 適 用 時 機 、 步 驟及 估 計 量(一 )影 響 抽 樣 調 查 結 果 準 確 度 的 因 素為 使 抽 樣 估 計 值 能 達 到 估 計 全 事 物 的 目 的 , 需 考 慮 影 響 其 準確 的 各 種 因 素 :原 始 資 料 的 變 異 程 度樣 本 數 的 大 小抽 樣 方 法分 層 抽 樣 法 抽 樣 的 不 同(二 )估 計 值 準 確 度 構 成 的 條 件不 偏 性 (unbiased ness)第四章 各種抽樣方法之選擇、步驟及優劣比較有 效 性 (e
13、fficiency)充 分 性 (sufficiency)一 致 性 (consistency)1.不 偏 性 (unbiased ness)定 義 , 其 中 表 示 期 望 值 。 本 定 義 即 說 明 , 統 計 量 的E)E期 望 值 等 於 參 數 , 這 種 性 質 叫 做 不 偏 性 。 舉 例 來 說 , 假 設 某 母 體大 小 為 , 且 母 體 平 均 為 , 今 從 母 體 內 抽 取 出 一 組 樣 本 , 求Nn得 平 均 為 , 若 , 則 稱 為 的 不 偏 估 計 值 。Y()Y2.有 效 性 (efficiency)定 義 ; 此 定 義 的 意 思 是
14、說 , 若 同 時 有 二 個 統 計212)(量 ( 及 ), 其 中 一 個 統 計 量 的 變 異 數 較 另 一 個 統 計 量 的 變 異 數 為1小 , 則 變 異 數 小 的 那 個 統 計 量 便 具 有 有 效 性 。 舉 例 來 說 , 假設 母 體 平 均 值 為 , 而 估 計 的 統 計 量 有 中 位 數 (median)及 算 術平 均 數 (arithmetic mean), 但 因 為 前 者 的 變 異 數 大 於 後 者 的 變 異數 , 則 算 術 平 均 數 具 有 效 性 。3.充 分 性 (sufficiency)定 義 ; 此 定 義 的 意 思
15、 是 說 ,,(,(,)YhgYn1 1 假 設 母 體 參 數 為 , 但 若 樣 本 統 計 量 可 直 接 由 樣 本 觀 測 值 去 估計 , 而 與 無 關 , 則 叫 具 有 充 份 性 。4.一 致 性 (consistency)定 義 ; 此 定 義 的 意 思 是 說 , 當 樣 本 大 小 趨 近 於 無limn n窮 大 ( )時 , 統 計 量 即 等 於 參 數 , 這 種 性 質 叫 做 符 合 一 致 性 。 例 如 ,當 增 大 為 時 , 則 所 求 得 的 趨 近 於 , 亦 即 , 故 可 知NYlimnY具 有 一 致 性 。Y(三 )估 計 的 方 法
16、在 某 些 情 況 下 , 如 所 需 的 原 始 資 料 不 易 得 到 , 或 得 到 的 資 料所 要 花 費 的 金 錢 、 時 間 較 多 時 , 可 用 輔 助 變 數 (auxiliary variable or concomitant variable) , 此 類 變 數 值 的 取 得 代 價 較yi低 。 舉 例 來 說 , 目 測 值 花 費 時 間 、 金 錢 較 評 估 估 計 值 所 費 均 少 ,估 計 得 較 準 確 的 估 計 值 , 每 個 抽 樣 單 位 有 兩 個 變 數 值 ,X(,)xyi與 之 間 有 相 關 (correlation)存 在 ,
17、 母 體 總 合 必 須 已 知 。 另 外 ,xiyi Y估 計 值 估 計 的 方 法 有 下 列 二 種 : (1)比 率 估 計 法 (ratio estimation),和 (2)迴 歸 估 計 法 (regression estimation)。(四 )母 體 與 參 數 及 樣 本 與 統 計 量1.母 體 與 參 數同 類 個 體 的 全 部 記 錄 集 合 一 起 , 使 組 合 成 一 個 全 體(aggregate), 這 個 全 體 稱 為 母 體 (population), 母 體 種 類 很 多 ,表 示 其 特 徵 的 方 法 有 圖 表 法 、 常 數 法 等
18、。 利 用 常 數 法 研 究母 體 即 由 母 體 中 計 算 出 若 干 穩 定 常 數 , 此 等 常 數 有 介 紹 母 體 特 性的 作 用 稱 為 參 數 (parameters)包 括 有 四 類 :(1)測 定 母 體 趨 中 性 : 主 要 有 算 術 平 均 、 型 量 、 中 位 數 等 。(2)測 定 分 散 度 : 主 要 有 變 異 數 、 均 方 、 標 準 偏 差 。 標 準 偏 差愈 大 , 則 母 體 中 所 有 個 體 間 的 變 異 愈 大 。(3)測 定 偏 歪 度 : 主 要 有 Fisher 氏 的 係 數 , E. S. Pearson1氏 的
19、係 數 。b1(4)測 定 頻 度 分 布 的 曲 線 峰 度 : 常 用 有 Fisher 氏 的 係 數 , 及2Geary 氏 的 係 數 。Wn第四章 各種抽樣方法之選擇、步驟及優劣比較2.樣 本 與 統 計 量母 體 涵 蓋 範 圍 很 大 , 資 料 經 統 計 分 析 後 , 所 得 結 論 的 適 當 範圍 必 很 大 ; 所 須 顧 慮 者 , 乃 在 於 母 體 範 圍 過 大 時 , 蒐 集 、 計 數 、度 量 及 統 計 工 作 隨 著 浩 大 , 所 費 時 間 、 金 錢 往 往 無 法 許 可 , 故 只好 由 樣 本 資 料 來 推 斷 母 體 的 特 性 。
20、來 自 同 樣 個 體 的 全 部 N 個 個 體 中 只 抽 出 n 個 單 位 進 行 計 數 ,度 量 而 得 個 單 位 的 記 錄 (Nn)集 結 此 n 個 單 位 記 錄 在 一 起 , 便n構 成 一 個 樣 本 (sample), 再 由 樣 本 資 料 求 得 某 一 統 計 值 來 估 計 參數 , 此 估 計 值 稱 為 統 計 量 (statistic)。 因 樣 本 有 抽 樣 變 異 , 故 統 計量 亦 有 抽 樣 變 異 , 如 把 母 體 中 可 能 發 生 的 樣 本 全 部 取 出 , 然 後 求得 各 樣 本 的 某 種 統 計 量 , 再 求 統 計
21、 量 的 總 平 均 值 , 此 總 平 均 值 稱為 某 統 計 量 的 期 望 值 , 若 某 統 計 量 的 估 計 方 法 適 當 , 則 該 統 計 量即 母 體 參 數 。 抽 樣 方 法 的 不 同 , 及 抽 樣 單 位 的 不 同 會 改 變 統 計 量的 大 小 , 改 變 對 該 母 體 的 代 表 程 度 。(五 )各 種 抽 樣 方 法 之 適 用 時 機 、 步 驟 及 估 計 量1.簡 單 隨 機 抽 樣 法 (simple random sampling)簡 單 隨 機 抽 樣 是 一 種 最 基 礎 且 最 簡 便 的 抽 樣 方 法 。 它 的 優 點是 (
22、i)當 母 體 底 冊 完 整 時 , 直 接 由 母 體 中 抽 出 樣 本 , 方 法 簡 單 ; 和(ii)每 一 單 位 被 抽 中 的 機 率 均 相 等 , 參 數 的 估 計 較 簡 單 。 而 它 的 限制 是 (i)母 體 底 冊 不 易 取 得 , 或 取 得 很 費 時 , 費 力 且 費 錢 ; (ii)母體 內 樣 本 單 位 太 多 時 , 作 業 不 方 便 ; (iii)樣 本 分 配 較 分 散 , 行 政作 業 較 不 易 ; 和 (iv)樣 本 代 表 性 恐 有 不 足 (尤 其 當 樣 本 點 差 異 大 時或 重 要 性 不 同 時 )。 因 此 ,
23、 使 用 簡 單 隨 機 抽 樣 的 最 佳 時 機 , 便 是當 (i)母 體 內 樣 本 單 位 不 多 , 且 有 完 備 名 冊 , 可 茲 編 號 時 ; (ii)母體 內 樣 本 單 位 間 的 差 異 不 大 時 (對 研 究 的 目 的 而 言 ); 和 (iii)對 母體 資 訊 無 法 充 份 獲 得 時 。 簡 單 隨 機 抽 樣 法 的 準 確 度 會 受 下 列 二 因素 的 影 響 , 即 (i)母 體 本 身 的 變 異 , 和 (ii)樣 本 的 大 小 。 以 下 以 算術 平 均 值 為 例 來 分 別 說 明 。 例 子 (1)母 體 本 身 的 變 異
24、: 分 別 對 原 始 母 體 當 變 異 數 較 小 和 變 異 數 較大 時 , 計 算 簡 單 隨 機 抽 樣 法 的 所 有 可 能 的 樣 本 組 合 , 結 果 列在 表 4-1 及 表 4-2 內 。表 4-1 簡 單 隨 機 抽 樣 法 的 所 有 可 能 的 樣 本 組 合(原 始 母 體 變 異 數 較 小 )樣 本 順 序 樣 本 個 體 樣 本 總 計 樣 本 平 均 母 體1234567891011121314151617abcdeabcdfabcdgabcefabcegabcfgabdefabdegabdfgabfegacdefacdegacdgfacefgadef
25、gacdefbcdeg38.438.739.138.939.339.639.339.740.040.239.640.040.340.540.940.140.57.687.747.827.787.867.927.867.948.008.047.928.008.068.108.188.028.10a=6.9b=7.4c=7.7d=8.1e=8.3f=8.6g=9.0N=7n=5T=56=8.0第四章 各種抽樣方法之選擇、步驟及優劣比較18192021bcdfgbcefgbdefgcdefg40.841.041.441.78.168.208.288.34總 計 840.0平 均 40.0表 4-2
26、簡 單 隨 機 抽 樣 法 的 所 有 可 能 的 樣 本 組 合(原 始 母 體 變 異 數 較 大 )樣 本 順 序 樣 本 個 體 樣 本 總 計 樣 本 平 均 母 體1234567891011121314151617abcdeabcdfabcdgabcefabcegabcfgabdefabdegabdfgabfegacdefacdegacdgfacefgadefgacdefbcdeg26272934363736383946384041485039415.25.45.86.87.27.47.27.67.89.27.68.08.29.610.07.88.2a=1b=2c=4d=6e=13
27、f=14g=16N=7n=5T=56=8.018192021bcdfgbcefgbdefgcdefg424951538.49.810.210.6總 計 840.0平 均 40.0比 較 表 4-1 及 表 4-2, 可 看 出 同 樣 的 抽 樣 方 法 、 同 樣 大 小 的母 體 及 樣 本 , 在 表 4-1 中 由 於 原 始 母 體 的 變 異 小 , 樣 本 平 均 的 變異 也 隨 著 變 小 , 而 大 多 能 代 表 母 體 平 均 , 也 就 是 說 有 較 大 的 準 確度 。 而 在 表 4-2 中 , 因 為 母 體 變 數 由 1 到 16 的 間 , 大 小 相
28、差 甚多 , 結 果 可 能 的 樣 本 組 合 平 均 值 由 5.2 變 化 到 10.6, 故 其 準 確度 較 小 。(2)樣 本 的 大 小 : 同 樣 的 也 分 別 對 當 樣 本 大 小 不 同 時 , 計 算 簡 單隨 機 抽 樣 法 的 所 有 可 能 的 樣 本 組 合 , 結 果 列 在 表 4-3 及 表4-4 內 。表 4-3 當 n=4 時 簡 單 隨 機 抽 樣 法 所 有 可 能 的 樣 本 組 合樣 本 順 序 樣 本 個 體 樣 本 總 計 樣 本 平 均 母 體12345678abcdabceabcfabcgabdeabdfabdgacde1320212
29、3222325243.255.005.255.755.505.756.256.00a=1b=2c=4d=6e=13f=14g=16N=7第四章 各種抽樣方法之選擇、步驟及優劣比較91011121314151617181920212223242526272829303132333435acdfacdgbcdebcdfbcdgabefabegabfgacefacegacfgadefadegadfgbcefbcegbcfgbdefbdegbdfgcdefcdegcdfgaefgdefgcefgdefg25272526283031333234353436373335363537383739404445
30、47496.256.756.256.507.007.508.008.258.008.508.758.509.009.258.258.759.008.759.259.509.259.7510.0011.0011.2511.7512.25n=4T=56=8.0總 計 1120.0 280.00平 均 280.0 8.00表 4-4 當 n=6 時 簡 單 隨 機 抽 樣 法 所 有 可 能 的 樣 本 組 合樣 本 順 序 樣 本 個 體 樣 本 總 計 樣 本 平 均 母 體1234567abcdefabcdegabcdfgabcefgabdefgacdefgbcdefg404243505254
31、556.677.007.178.338.679.009.17總 計 336.0 56.01平 均 48.0 8.00a=1b=2c=4d=6e=13f=14g=16N=7n=6T=56=8.0表 4-3 中 , 當 n=4 時 的 樣 本 平 均 由 3.25 至 12.25 間 便 動 ,而 在 表 4-4 中 , 當 n=6 時 的 樣 本 平 均 則 由 6.67 至 9.17 間 變 動 ,可 見 其 準 確 度 差 異 相 當 的 大 。 我 們 可 由 這 二 個 表 而 歸 納 出 一 個 結論 , 亦 即 大 樣 本 的 準 確 度 較 大 , 而 小 樣 本 的 準 確 度
32、較 小 。2.分 層 抽 樣 法 (stratified sampling)按 照 某 種 原 因 或 其 他 一 定 的 標 準 , 將 所 含 抽 樣 單 位 個 數 分 別定 為 , 但 ; 這 些 分 枝 的 母 體 簡 稱 為 層NNhL12, NhL1(stratum)。 再 以 簡 單 隨 機 抽 樣 法 , 分 別 從 各 層 獨 立 的 抽 出個 單 位 組 成 一 個 含 有 個 單 位 的 樣 本 , 根nnhL12, nhL1第四章 各種抽樣方法之選擇、步驟及優劣比較據 此 樣 本 中 各 單 位 的 平 均 與 母 體 各 層 單 位 的 個 數 去 推 估 母xh
33、Nh體 平 均 。 亦 即 , 其 中 N 為 母 體 中 單 位 總 數 , 而 h 為hL1層 號 。往 往 調 查 對 象 的 母 體 中 , 包 含 每 一 抽 樣 單 位 附 隨 的 某 種 特 性的 變 數 間 具 有 很 大 的 變 異 性 , 即 分 散 度 很 大 , 或 具 有 歪 度 很 大 的分 布 。 此 時 倘 若 置 的 不 理 , 而 採 用 簡 單 隨 機 抽 樣 法 從 整 個 母 體 中抽 出 樣 本 , 則 可 能 在 分 布 兩 端 的 單 位 便 沒 有 被 抽 中 的 機 會 , 或 者抽 出 太 多 極 端 的 樣 本 , 因 而 失 去 母 體
34、 的 代 表 性 , 以 致 估 計 的 準 確度 不 高 。 反 之 , 假 如 按 照 母 體 分 布 的 狀 態 , 將 其 抽 樣 單 位 分 為 大 、小 二 層 或 更 細 分 的 , 使 各 層 內 的 單 位 間 的 變 異 程 度 較 低 , 而 各 層間 的 變 異 程 度 較 高 ; 根 據 變 異 數 分 析 原 理 , 層 間 變 異 愈 大 則 層 內變 異 愈 小 , 因 此 各 層 樣 本 的 代 表 性 將 會 增 高 , 將 其 合 併 以 估 計 整個 母 體 總 合 或 平 均 值 必 能 獲 得 準 確 度 很 高 的 估 計 結 果 。分 層 隨 機
35、 抽 樣 在 實 際 應 用 上 是 最 常 用 的 一 種 抽 樣 方 法 。 通 常欲 調 查 的 母 體 內 各 個 抽 樣 單 位 , 當 其 間 變 異 甚 大 , 即 分 散 度 很 大或 具 有 歪 度 (skewness)時 , 若 採 用 簡 單 隨 機 抽 樣 , 則 可 能 造 成 分散 在 兩 端 的 樣 本 將 不 被 抽 中 或 抽 中 太 多 , 如 此 抽 出 的 樣 本 不 具 高度 代 表 性 , 反 而 使 估 計 誤 差 過 大 , 因 此 有 使 用 分 層 隨 機 抽 樣 的 必要 。 舉 例 來 說 , 欲 估 計 超 級 市 場 的 平 均 營
36、業 額 , 即 要 對 超 級 市 場按 超 市 大 小 分 層 後 再 作 抽 樣 。分 層 隨 機 抽 樣 法 的 優 點 是 (i)可 增 加 樣 本 代 表 性 ; (ii)可 提 高估 計 的 確 度 ; (iii)可 分 別 獲 得 各 層 的 訊 息 , 並 做 各 層 間 的 比 較 分析 ; (iv)可 在 各 層 設 立 行 政 單 位 , 以 便 於 執 行 ; 和 (v)可 視 各 層 情形 , 採 取 不 同 的 抽 樣 方 法 。 而 它 的 限 制 是 (i)分 層 變 數 的 選 取 (要與 所 欲 估 計 的 特 徵 值 具 有 高 度 相 關 ); (ii)
37、層 數 的 釐 定 (要 適 當 並配 合 母 體 的 分 配 狀 況 ); (iii)分 層 標 準 的 決 定 (各 層 不 能 有 重 疊 現象 ); (iv)各 層 樣 本 的 配 置 方 法 ; 和 (v)分 層 後 , 樣 本 資 料 的 整 理 及估 計 較 複 雜 。 因 此 , 使 用 分 層 隨 機 抽 樣 法 的 最 佳 時 機 , 便 是 當 (i)母體 內 樣 本 單 位 的 差 異 較 大 時 ; 和 (ii)分 層 後 能 達 到 層 間 差 異 大 ,層 內 差 異 小 的 原 則 。 原 則 上 要 使 層 內 變 異 小 , 而 層 間 變 異 大 ; 各層
38、 不 能 有 重 疊 現 象 。3.分 層 隨 機 抽 樣 法 的 配 置 問 題由 前 面 所 述 我 們 已 經 知 道 當 分 組 得 宜 時 , 分 層 隨 機 抽 樣 法 較簡 單 隨 機 抽 樣 法 的 準 確 度 來 的 大 , 然 而 在 總 樣 本 個 數 n 確 定 的情 況 下 , 各 層 究 竟 應 該 分 別 抽 取 多 少 , 才 能 獲 得 最 高 的 準 確 度 ?進 一 步 的 說 , 也 就 是 在 固 定 的 成 本 下 , 要 如 何 使 準 確 度 達 至 最 高 ?而 在 要 求 的 準 確 度 的 下 , 又 如 何 使 成 本 減 至 最 低 ?
39、 這 些 皆 是 屬 於配 置 上 的 問 題 。 一 般 的 配 置 方 法 可 分 為 均 等 配 置 、 比 例 配 置 、Neyman 配 置 和 最 適 配 置 等 四 種 , 下 面 我 們 將 以 民 國 六 十 四 年 度二 期 作 坪 割 資 料 各 鄉 鎮 各 鄉 鎮 應 抽 的 農 家 數 (或 坵 田 數 )為 例 , 將此 四 法 分 別 加 以 說 明 並 討 論 。(1)均 等 配 置 (equal allocation)在 所 有 配 置 法 中 , 最 簡 單 的 就 是 將 總 樣 本 個 數 平 均 配 置 於 各層 的 中 。 換 句 話 說 , 也 就
40、 是 由 各 層 中 抽 取 相 同 個 數 的 樣 本 , 此 即所 謂 均 等 配 置 。 在 均 等 配 置 中 , 第 h 層 的 樣 本 數 為( )nLhL12,其 中 n 為 總 樣 本 個 數 , L 為 總 層 數 。 以 坪 割 為 例 , 民 國 六 十 四 年二 期 作 所 採 用 的 即 是 一 種 均 等 配 置 , 亦 即 在 29 個 鄉 鎮 中 , 每 鄉鎮 均 抽 取 4 小 區 , 便 構 成 了 n=116 的 樣 本 。第四章 各種抽樣方法之選擇、步驟及優劣比較由 於 均 等 配 置 並 未 討 論 各 層 本 身 所 含 單 位 的 多 寡 及 層
41、內 變異 的 大 小 , 自 然 它 的 準 確 度 一 般 說 來 不 會 很 高 , 因 此 也 只 適 用於 各 層 大 小 略 為 相 等 且 變 異 程 度 相 似 的 母 體 下 使 用 。(2)比 例 配 置 (proportional allocation)比 例 配 置 是 按 照 各 層 含 有 單 位 數 多 寡 的 比 例 來 配 置 樣 本 的 ,用 公 式 來 表 達 即 是nNnNnhL12 也 就 是, (4.3.1)nh其 中 為 第 h 層 所 含 有 的 單 位 數 ( )。h L12,在 坪 割 計 畫 中 , 每 一 小 區 包 括 10 到 20 公
42、 頃 的 水 稻 耕 地 ,取 其 中 間 值 我 們 以 15 公 頃 為 每 一 小 區 面 積 , 那 麼 以 15 公 頃 來除 該 鄉 的 水 稻 耕 地 總 面 積 即 為 該 鄉 所 擁 有 的 小 區 數 , 也 就 是值 , 即 (第 h 鄉 的 水 稻 栽 培 面 積 )。 為 了 與 前 面 均 等 配 置Nhh做 一 比 較 , 我 們 仍 以 294=116 作 為 總 樣 本 個 數 (也 就 是 n 值 ),而 N 為 族 群 大 小 ( ), 將 、 n、 N 等 代 入 式 (4.3.1)中 即NhLh可 得 各 鄉 鎮 所 應 抽 取 的 小 區 數 。 若
43、 以 宜 蘭 縣 羅 東 鎮 為 例 , 而 羅東 水 稻 栽 培 面 積 1429.40 公 頃 , 除 以 15 得 為 95, 各 鄉 鎮 計h算 結 果 得 , 則 羅 東 鎮 應 抽 取 的 小 區 數 為hL16。nh95624除 了 比 例 配 置 外 , 尚 有 其 他 更 精 細 完 備 的 配 置 方 法 , 如 後 述的 Neyman 配 置 、 最 適 配 置 等 。 但 是 比 例 配 置 法 也 有 它 的 優 點 ,即 (i)比 例 配 置 法 不 須 要 知 道 各 層 內 的 變 異 數 ; (ii)比 例 配 置 法 未涉 及 成 本 , 因 此 各 層 的
44、 單 位 抽 樣 成 本 也 不 必 明 瞭 ; 和 (iii)由 其 他配 置 法 (如 Neyman 配 置 、 最 適 配 置 )所 獲 得 的 準 確 度 的 提 高 ,並 不 是 很 大 , 但 手 續 卻 較 繁 雜 。 當 然 若 各 層 內 變 異 程 度 相 差 很 大時 , 由 Neyman 或 最 適 配 置 所 得 的 準 確 度 的 提 高 超 過 比 例 配 置 法的 簡 便 時 , 比 例 配 置 法 是 不 宜 被 採 用 的 , 但 無 論 如 何 比 例 配 置 法是 一 種 簡 單 而 經 常 被 使 用 的 配 置 方 法 。(3)最 適 配 置 法 (
45、optimum allocation)最 適 配 置 法 是 在 總 預 算 成 本 為 C, 樣 本 個 數 固 定 為 n, 第 h層 單 位 抽 樣 成 本 為 的 情 況 下 , 欲 使 平 均 的 變 異 數 為 最 小 時 所 採Ch用 的 一 種 配 置 方 法 。 最 適 配 置 中 第 h 層 所 須 抽 出 的 樣 本 數 為(4.3.2)nNSChhhL1其 中 為 第 h 層 的 層 內 均 方 。Sh由 上 列 公 式 我 們 可 看 出 是 和 成 正 比 例 的 , 也 就 是 說 當nhNSh或 大 時 , 第 h 層 就 必 須 多 抽 些 樣 本 。 這 意
46、 義 是 顯 而 易 見 的 ,NhS即 當 層 內 各 單 位 間 的 差 異 越 大 , 越 是 須 要 較 大 的 樣 本 才 能 具 有 代表 性 。 由 上 式 我 們 也 可 看 出 是 和 成 反 比 的 , 也 就 是 應 該 從nhCh較 小 的 層 內 抽 取 較 多 的 樣 本 個 數 。 若 各 層 單 位 的 抽 樣 成 本 相 等 ,Ch且 變 異 情 形 相 似 , 則 式 (4.3.2)中 的 和 便 可 略 去 , 而 簡 化 為Shh, 即 成 為 比 例 配 置 法 。nNnhhh由 最 適 配 置 這 個 名 詞 的 表 面 意 義 , 我 們 即 可
47、知 道 在 者 四種 配 置 法 中 它 是 最 適 的 , 因 為 它 不 但 考 慮 了 成 本 , 更 獲 得 了 最 高的 準 確 度 ; 只 是 一 般 說 來 每 層 的 單 位 抽 樣 成 本 很 難 正 確 的 計 算 ,像 坪 割 資 料 就 是 因 為 沒 有 成 本 的 函 數 , 所 以 不 能 以 最 適 配 置 法 計算 出 每 鄉 鎮 應 抽 出 的 最 適 小 區 數 。第四章 各種抽樣方法之選擇、步驟及優劣比較(4) Neyman 配 置 (Neyman allocation)在 某 些 情 形 下 , 各 層 的 單 位 抽 樣 成 本 差 異 不 大 ,
48、因 此 式Ch(4.3.2)中 的 可 省 略 而 變 成 了Ch.(4.3.3)nSNnhhL1此 法 首 先 由 Neyman 提 出 , 故 稱 為 Neyman 配 置 。 以 坪 割 計 畫中 各 鄉 鎮 所 的 小 區 數 為 例 , 和 比 例 配 置 時 相 同 , n 也 仍 是h116。 只 是 另 外 必 須 再 計 算 各 鄉 鎮 內 小 區 變 異 數 , 開 方 後 得 ,Sh由 計 算 , 即 可 獲 得 Neyman 分 配 下 各 鄉 鎮 所 應 採nShh16取 的 小 區 數 。由 以 上 所 述 我 們 可 以 下 一 結 論 : 最 適 配 置 是 最
49、 完 美 的 配 置 方法 , 但 當 各 層 單 位 抽 樣 成 本 未 知 時 可 採 用 Neyman 配 置 , 又 當各 層 內 變 異 程 度 約 略 相 似 時 可 採 用 比 例 配 置 。 而 由 坪 割 計 算 結 果我 們 得 到 比 例 配 置 的 相 對 效 率 , 是 均 等 配 置 的 1.556 倍 ,Neyman 配 置 是 均 等 配 置 的 2.529 倍 , Neyman 配 置 是 比 例 配 置的 1.625 倍 , 更 可 作 為 配 置 法 重 要 性 的 一 個 驗 證 。 由 於 比 例 配 置法 在 實 務 上 使 用 最 多 , 故 下 例 中 便 此 方 法 加 以 介 紹 。【 例 】 假 設 某 公 司 欲 估 計 某 類 產 品 的 潛 在 用 戶 的 每 年 平 均 支 出 。企 劃 人 員 擬 就 整 個 潛 在 用 戶 的 名 單 (母 群 體 ), 採 用 分 層 隨機 抽 樣 法 抽