課程名稱︰統計史導論
課程性質︰通識A6
課程教師︰黃旻華
開課學院:社科院
開課系所︰政治系
考試日期(年月日)︰
考試時限(分鐘):
(期末前會給是非50+選擇50題庫,每屆都有些許差異,共抽50題出題,答案網路上有幾
個人分享,我全參考過,但仍存在些許錯誤,在此附上個人答案供參考。)
試題
一、是非題:
1. 任何統計量在母體中都是固定值。 (O)
2. 統計學在 19 世紀時的應用與發展,主要集中在天文學、生物學和農學,與社會科學
沒有 關係。 (X)
3. 中距當作最佳估計元的原因,主要是認為多數人具有認識真理的理性能力。 (X)
4. 主觀機率論的機率定義中,並不需要主張有一個外於認識主體存在的資料產生機制。(
O)
5. 抽樣樣本中的最大值也是一個變量。(O)
6. 曲線適配問題在統計史的發展中,17 世紀就公認最佳答案為「最小平方法」。 (X)
7. 要能應用最大概似法推論,必須完整界定所欲推估參數的值域空間。 (X)
8. 只要概似函數的函數形式相同,比方說二項分配和負二項分配,最大概似解並沒有辦
法區 辨其資料產生機制的不同。(O)
9. 統計史家邱吉爾‧艾森哈特的研究中,有關隨機誤差的設想,也存在有誤差機率隨誤
差大 小呈等比遞增的設想。(X)
10. 在事後機率的定義中,已發生事件結果是作為條件機率中的條件。(O)
11. 概似函數中的概似值,與事後機率一樣,都需要滿足機率定義的必要邏輯條件,就
是所有 參數空間中的概似值加總必須等於百分之百。(X)
12. 抽樣理論中的公正性特質,只有在大樣本(抽樣數大於 30)中才成立。(X)
13. 抽樣理論中的代表性特質,是指任何一個抽樣實驗中,較大抽樣樣本數得出的結果
,一定 會比較小抽樣樣本數得出的結果,更接近母體參數值。(X)
14. 中央極限定理主要的貢獻是推導出母體和抽樣樣本的統計分配性質關係。 (O)
15. 若事件(E)指涉是每天早上的天氣情況,而假設(H)指涉當晚地主球隊比賽的結果,令
天氣 狀況有晴天、陰天、雨天三種,而地主球隊有勝敗兩種結果,根據去年 100 場的比
賽經 驗,晴天陰天雨天分別有 30、30、40 場,勝和敗分別為 60,40 場,且晴天且勝
和雨天且 敗皆為 15 場,P(陰天|敗)為 0.25。(O)
16. 中央極限定理的應用,是限定在母體為常態分配的先決條件。(X)
17. 古典機率論中的離散機率分配,其起源主要來自於「賭博學」中的機率計算。(O)
18. 中央極限定理的應用,無法用在算術平均數以外的其他統計量。(X)
19. 針對抽樣分配進行的有限次數模擬實驗結果,可以用來否定中央極限定理的數理推
演。 (X)
20. 在進行最大概似法推論時,即便資料產生機制屬於何種分配都是人為選定的。(O)
21. 在概似原則的論證中,母體參數的先驗機率必須從主觀機率才能定義。(O)
22. 在民意調查中,在一定預算成本限制下,最適樣本數推導的依據是邊際代表性的遞
增。(O)
23. 真正具有效度的民意調查,是每次進行隨機抽樣後所得出的樣本統計量數值都分毫不
差的 與母體統計量相同。(X)
24. 誤差分配的主張中,誤差值沒有界域限制的假設,會牴觸古典機率中所有事件機率
加總值 為 1 的必要邏輯定義。(X)
25. 當代統計學中期望值的計算等同於算術平均數的計算。 (O)
26. 採用主觀機率論來界定一事件的機率時,不需要將所有可能事件值域中所的機率都清
楚界定出來。(O)
27. 在客觀機率論中,時空僅僅是載體,乘載了呈象事件的實現數值。 (O)
28. 從客觀機率論來看,要讓 f(x)=a*(x+2) 在
x ∈ [1,5] 滿足連續性機率密度函數的定義,則 a = 0.1。(O)
29. 在負二項分配中,以生小孩五胎中得出三男二女為例,生育總胎數為隨機變量。(O)
30. 統計學的發端,在歷史上是完全與宗教對立,否定神的存在。(X)
31. 離散分配中的隨機變量值域一定是有限界域的。 (X)
32. 針對這組資料{ 1,2,3,5,5,5,6,8,10 }取中位數、算術平均數和眾數,三者答案並不
相同。 (X)
33. 若按邱吉爾‧艾森哈特的研究結果,「平均數」在四百年前統計發展之初並不專門指
算術 平均數,而是指涉所有可以當作「準的問題」之備選答案。 (O)
34. L∞範式法是取一樣本中的「均方差」作為變異數測量值。 (X)
35. 抽樣分配(sampling distribution)的資料產生機制是隨機抽樣的操作。 (O)
36. 從古典機率論的觀點來看,事後機率 P( θ|x) 在現實中,參數 θ 是具有唯一真值
的固定 值,不是隨機變量。(O)
37. 針對任意資料,若我們採用 L p 範式法當作「穩的問題」標準, p 越接近 0,則
中位數越有 可能「準的問題」的最佳估計量。(X)
38. 最大概似法預設了「已經實現的事件結果,在尚未發生時本來要發生的機率就是最
大」的假設。(O)
39. 對數函數以無窮級數來表達,其構成項的分母皆是階層項。 (X)
40. 已知有一袋不同顏色的 10 顆色球,其中紅球有 4 顆,藍球有 6 顆,以取出不放回
的方法進行隨機抽樣,出現抽 5 顆球中出現 3 顆紅球的機會為10/21 。(X)
41. 尺度參數隨著不同的統計分配而具有不同的定義。(O)
42. 「過度認定」是指未知參數個數少於已知限制式數目的問題。(O)
43. 針對下列已發生事實:「擲七次銅板中有二次正面」來進行最大概似推論,不管主
張事件 的資料產生機制為二項分配還是負二項分配,其參數推估結果(擲一次銅板出現正
面的機率)的答案是相同的。(X)
44. 「統計」的字根 Statistik 一詞,是指涉由賭博學延伸的邏輯機率計算,與憲政史
、政治經濟學、治國之術、法哲學都沒有任何關係。(X)
45. 若將平均數一般化為 x=(1/n * Σ xi^m) ^1/m,則 m=-1為調和平均數。 (O)
46. 直到 18 世紀中葉,仍有統計學家認為對於個別觀察值進行可信程度的判斷並取出最
佳估計值,比取集中趨勢值的統計量更能答對欲求的未知物理量。(O)
47. 抽樣理論中「公正性」的意思是指「抽樣樣本的統計量期望值等於母體樣本的統計
量真值」。(O)
48. 抽樣理論中「代表性」的意思是指,「抽樣樣本的統計量推估值會等同於母體樣本
的統計量真值」。 (X)
49. 羅納德‧費雪(Ronald Fisher)曾經強烈反對「損失函數」的統計推論方法。(O)
50. 由 n->∞ 時的二項分配推導出常態分配曲線的統計學家是高斯。(X)
二、選擇題 (50%,50 題選 25 題)
1. 下面何者不是當代的統計史家?
(A)邱吉爾‧艾森哈特(Churchill Eisenhart) (B)史蒂芬‧ 史坦格勒(Stephen Stigler)
(C)安得斯‧霍德(Anders Hald) (D)皮耶德‧費馬(Pierre de Fermat)。
2. 下面哪位學者在統計史上的主要貢獻在治國之術(statecraft)上?
(A)約翰‧葛蘭特(John Graunt)(B)卡爾‧皮爾森(Karl Pearson)(C)約瑟夫‧拉格朗日(J
oseph-Louis Lagrange)(D)皮 耶賽門‧拉普拉斯(Piere-Simon Laplace)。
3. 從統計史來看,下面何者不是常用的「準的問題」候選答案?
(A) 眾數 (B) 均方差 (C) 加權平均數(D)中距。
4. 針對一未知物理量進行測量,得到下面 10 個觀察值{20,18, 22,16,21,21,18,15, 23
, 21},若我們採用眾數當作最佳估計元,以「極小化最大誤差絕對值法」(Minmax Metho
d)當作度量資料歧異程度的標準,請問那個觀察值會給出變異數的答案?
(A)15(B)16(C)23(D)21。
5. 概似原則可表為: P(H|E) 正比於 P(E|H),其中任一參數值假設的為真的先驗機率 P
(Hi) ,若完全基於古典機率論觀點來論機率,下面有關P(Hi)的敘述何者較為正確?
(A) P(Hi) 是研究者心中對參數值特定假設為真的可能性評估 (B) P(Hi) 中的隨機變量
就是 E 中所指涉的呈象事件結果 (C) P(Hi)代表呈象事件背後的資料產生機制中所含參
數值由另一個資料產生機制所決定的 (D) 任一 P(Hi) 的估計值都相同。
6. 以統計史的觀點,當代 Mean 和 Average 當作平均數的不同之處在於?
(A)前者是算術平均數,後者是泛指集中趨勢數(B)前者隱含觀測值背後存在有一資料產
生機制,後者則 沒有這樣的假設 (C)Mean 是正式用法,Average 是非正式用法 (D)以上
皆非。
7. 下面對於統計學的內涵,何者與其定義差得最遠?
(A)是一門猜的學問(B)是探索「過度認定」的問題(C)是有系統的研究「不確定性」的問
題(D)純粹是數理演繹計算的學問。
8. 若以解聯立方程組的例子來解釋統計學,請問下列哪一個結果最接近統計問題的本質
? (A)無限多解(B)唯一解(C)無解(D)以上皆非。
9. 一個箱子中有深紅球二顆、深藍球二顆、淺紅球五顆、淺籃球一顆,倘若你欲從其中
隨 機抽出九顆,抽樣方式為取出不放回,請問抽出結果為淺紅球四顆的機率為?
(A)1/2 (B)1/5 (C)1/10 (D)以上皆非。
10. 常態分配與雙指數分配的最大不同是?
(A)前者的隨機變量無界域限制,後者有界域限 制(B)前者的機率密度函數為指數的二次
方函數,後者為指數的一次方函數(C)前者有位 置參數,後者沒有(D)前者有尺度參數,
後者沒有。
11. 在誤差理論的演進過程中,何者並未被當時的統計學者接受?
(A)欲推估的物理量真值有唯一性(B)人的認識能力是有限的(C)神或自然也是擲骰子決定
隨機誤差中資料產生機 制所含的參數值(D)隨機誤差發生的必然性。
12. 有關母體統計量的敘述,何者有誤?
(A)倘若母體可得,母體統計量為定值(B)母體的迴 歸係數值是母體統計量的一種(C)假設
檢定的目的是在使用樣本統計量的抽樣分配來對 母體統計量的特定值假設做出決策判斷(
D)不管母體可不可得,母體統計量皆為變數。
13. 從古典機率論來看,擲一骰子出現三點的機率為1/6 的主張,何者有誤?
(A)此主張指涉 的是邏輯機率(B)此主張預設時間只是載體,不同時間投擲同一個骰子其
背後具有相同 的資料產生機制(C)若有一個人當下擲了 10 次,發現三點的結果僅出現 2
次,則此結果可以否定此主張(D)此主張若要能真的被驗證或否證,必須要在投擲次數
夠大的前提 下,才有說服力。
14. 哪位統計學家在 19 世紀將統計學應用在指紋鑑識上有很大的貢獻?
(A)法蘭西斯‧高爾頓(Francis Galton) (B) 古斯塔夫‧費希納(Gustav Fechner) (C)阿
道夫‧凱特勒(Adolphe Quetelet) (D) 威廉史丹利‧傑文斯(William Stanley Jevons)
。
15. 下面何者與統計學的源起關係較小?
(A)賭博學 (B)幾何學 (C)治國之術(statecraft) (D)社會 科學。
16. 從統計史來看,回到西元 1700 年之前,請問下面何者是「平均數」(mean)?
(A)中位數 (B)算術平均數(C)中距(D)以上皆是。
17. 按中央極限定理的推論,在抽樣樣本數足夠大的前提下,母體要依循著下列何者分
配才 會讓樣本統計量的抽樣分配呈現常態分配?(A)常態分配(B)二項分配(C)伯努力分配
(D) 以上皆是。
18. 已知道存在有某個樣本數為 N 母體樣本,分配的形式未知,但是其算術平均數和變
異數分別為μ和 σ^2,若從該母體樣本中隨機抽樣出一個樣本數為n抽樣樣本( n大於等
於30 ),請問 按照中央極限定理,樣本平均數的抽樣分配趨近為?
(A)常態分配(B)樣本平均數是定值, 沒有所謂的抽樣分配(C)二項分配(D)樣本統計量的
分配是未知的。
19. 承上題,樣本平均數的期望值為?
(A) μ/n (B) nμ(C) μ (D)樣本平均數的期望值是未 知的。
20. 承上題,樣本平均數的變異數為?
(A) σ/n (B) nσ (C) σ^2 (D)樣本平均數的變異數是未知的。
21. 就代數運算來進行統計推估的技巧來說,何種操作對解題來說較不相關?
(A)對資料產生機制提出主張(B)進行資料簡化(C)進行資料篩選(D)進行資料重組。
22. 關於統計分配中的參數,從古典機率論來看,何者有誤?
(A)其值可能未知(B)其值必為固定數(C)其值必為一隨機變數並依循某種分配(D)參數的維
度和值域都已經明確已知。
23. 當代統計學中將最大概似法進行學理化,並將概似的概念確立下來廣為被接受的學者
是?
(A)卡爾‧皮爾森(B)羅納德‧費雪(C)邱吉爾‧艾森哈特(D)卡爾‧菲德里克‧高斯 (Carl
Friedrich Gauss)。
24. 在誤差函數的統計史討論中,隨機誤差並沒有意含何者?
(A)誤差分配為對稱形狀(B)誤 差的期望值為零(C)誤差必然沒有上下界(D)誤差出現機率
隨誤差值呈現嚴格遞減。
25. 請問下列哪一個統計量有用到排序資訊?(A)中距(B)算術平均數(C)中位數(D)眾數。
26. 在隸美弗以二項分配逼近常態分配的推導中,下面哪一個近似式並沒有使用到?
(A)斯特林近似公式(B) lim [ log (1+x) ] 約等於 x (C)史拉斯基定理 (D) lim [1/2 m
(1+m) ] 約等於1/2 m^2。
27. 何者是「中距」被當作最佳估計元的主要理由?
(A)僅取樣本中最中間觀察值的資訊(B) 觀察值取得很容易,幾乎不需要成本(C)沒有上下
界問題(D)以上皆是。
28. 下面三組數字:甲(10%, 12%, 16%, 6%, 9%, 10%);乙(1%, 7%, 2%, 8%, 2%, 1%);
丙 (7%, 14%, 15%, 15%, 14%, 10%),若用「絕對離差和法」(Sum of Absolute Deviati
on)來 度量其資料的歧異程度,並以中位數為離差計算基準,請問何組數字的歧異程度最
大?
(A)甲(B)乙(C)丙(D)甲乙丙一樣大。
29. 請問f(x) = 1/(√2π * σ ) exp [ (- (x-μ)^2 ) / 2σ^2 ]是哪個分配的機率
密度函數?
(A)拉普拉斯分配(B)指數分配(C)卜瓦松分配 (D)常態分配。
30. 下面何者是主觀機率論中機率的必要定義?
(A)呈象事件背後需要存在有可以無限反覆 發生的資料產生機制(B)呈象事件發生頻率需
要由一個連續可微的數學函數來表示(C)機 率為目標事件集合數與所有事件集合數的比值
(D)所有事件發生的機率總和為 1。
31. 倘若有對夫妻生育兒女前並沒有計畫一定要生三個女兒,但恰巧最終生了五胎中有
三胎 位是女兒,請問若以最大概似法來推估,該夫妻生一胎為男孩的機率為?
(A) 50% (B) 40% (C) 60% (D) 70%。
32. 當代的統計學典範,在「準的問題」上,也就是有關最佳估計量的問題,是確立在
下面哪一個統計量的基礎上?
(A)算術平均數(B)中位數(C)眾數(D)以上皆非。
33. 若以平均絕對離差當作變異數的量測值,請問哪個統計量當作母體參數真值的估計
會給 出最小的變異數值?
(A)算術平均數(B)調和平均數(C)眾數(D)中位數。
34. 西元 18 世紀在歐陸出現的德文「統計」(Statistik)一詞,較不指涉下列何種學問
?
(A)憲 政史(B)理論數學(C)政治經濟學(D)法哲學。
35. 下列哪一個分配的隨機變量可以為負值的?
(A)負二項分配(B)常態分配(C)指數分配(D) 柏努力分配。
36. 請問在 18 世紀時,下面哪一個問題已被發現有絕對的正確答案?
(A)「準的問題」(B) 「穩的問題」 (C)「最佳的誤差分配問題」(D)以上皆非。
37. 某民調公司對於一個現任的議員進行支持度調查,在其選區中,隨機抽樣出 1000個
樣本,得到樣本支持率估計值為 40%,請問下面何者為誤?
(A)進行民調時,該選區所有 合格選民中此議員支持度真值為 40% (B)此民調得出的支持
率估計值 40%僅為一次抽樣 的推估結果,如果進行多次抽樣民調,該數值是會變動的(C)
根據中央極限定理,樣本平均數的 95%信賴區間數值為 40% 넠1.96 휠√[( 40% 휠60% )
/1000](D)該家民調公司同時做了競爭 對手的支持率調查,得出支持率為 37.5%,若以
α= 0.05顯著水準來進行假設檢定,兩人的支持率在該區所有合格選民中是沒有顯著差異
的。
38. 採用民意調查方式來預測選舉結果,往往在取樣上,電話號碼抽樣樣框所覆蓋的民眾
跟 投票日當天去投票的選民有差異,請問這是選舉民調推論上何種誤差?
(A)時間差(B)母體差(C)估計差(D)變動差。
39. 在選舉民調中,可以用中央極限定理來解決的統計推論問題是?
(A)時間差(B)母體差(C) 估計差(D)變動差。
40. 抽樣理論中隨機抽樣的「公正性」特質,可以解決下面那一個統計推論問題?
(A)時間差(B)母體差(C)估計差(D)變動差。
41. 邱吉爾‧艾森哈特在他的著作「誤差法則一」中曾經提到,「準的問題」在早期公
認的 最佳答案並非是算術平均數,他曾經以 11 世紀穆斯林科學家為例,他們曾經主張
下面那一種統計量為「準的問題」的最佳答案?
(A)中位數(B)眾數(C)加權平均數(D)中距。
42. 「政治算術」一詞由下面哪位學者提出?
(A)威廉‧佩提(William Petty) (B)約翰‧葛蘭特 (John Graunt) (C)葛佛萊‧艾肯沃(G
ottfried Achenwall) (D)約翰‧辛克萊(John Sinclair)。
43. 經驗機率在什麼條件下會逼近邏輯機率?
(A)實驗次數趨近無限大 (B)實驗被公正的執行 (C)純粹憑運氣 (D)兩個不同概念,永遠
不會逼近。
44. 下面哪一個統計分配的母體參數中沒有位置參數?
(A)雙指數分配(B)常態分配(C)貝他分配(D)以上皆無。
45. 在高斯證成算術平均數為當代統計學典範中「準的問題」答案中,何者並非其必要
假設?
(A)採用逆機率的推論(B)常態分配為資料產生機制(C)隨機變量數值由相同且獨立的分配
反覆產生(D)主張「均方差」為變異數的測量標準。
46. 何者不屬於統計推論方法?
(A)生成函數法(B)最大熵值法(C)動差法(D)最小平方法。
47. 下面的統計史家何者曾任美國統計學會 1971 年的會長?
(A)史蒂芬‧史坦格勒(Stephen Stigler) (B) 安得斯‧霍德(Anders Hald) (C) 邱吉爾
‧艾森哈特(Churchill Eisenhart) (D)以上都不曾當過。
48. 下面有關於指數函數的性質,何者有誤? (A) e^x = lim [1+ (x/n)^n ] (B) e^x
= x^0 /0! +x^1 /1! +x^2 / 2! + x^3 / 3! +..... (C) lim e^x -> -∞ (D) d/dx
e^x = e^x 。
49. 有關三角函數sin x 的敘述何者有誤?
(A) 一次微分為cos x (B) sin x = x^0 / 0! - x^2 / 2! + x^4 / 4! - x^6 / 6!
+....... (C)四次微分為sin x (D)可被定義為一個收斂的無窮級數。
50. 請問f(x)= 1/ (b-a) , ( a < x < b ) 是哪個分配的機率密度函數?
(A)拉普拉斯分配(B)均等分配 (C)常態分配(D) 指數分配。