日期:2022-02-14
這是總體均值的無偏估計,是優秀的數學教案文章,供老師家長們參考學習。
在學完通過抽樣來收集數據后,我們必須通過圖、表計算來分析數據。這就需要對總體作出相應的估計。一般有兩種估計,一是用樣本頻率分布估計總體的分布,二是用樣本的數字特征估計總體的數字特征。
用樣本頻率分布估計總體的分布,可以用頻率分布表和頻率分布直方圖,此時要明確它的具體做法分五個步驟進行,知道直方圖中的小長方形的面積表示相應各組的頻率,了解應用直方圖的優缺點;再者就是莖葉圖也被用來表示數據,懂得如何作莖葉圖,特別指出葉是指數據中的最后一個數字,注意是否需要補0,當然也要知道它的優缺點。
用樣本的數字特征估計總體的數字特征,這里的數字特征包括眾數、中位數、平均數、標準差和方差。給出一組具體的樣本數據后,通過計算獲取的數字特征的值是準確的,但如果通過頻率分布直方圖獲取的,所得的數值只是近似值(如何算?)。對于標準差或方差,要懂得公式、取值范圍、和特點。
1、數據的兩個特征:集中趨勢和波動性。集中趨勢指的是數據的“一般水平”或曰“平均水平”,波動性指的是數據圍繞“平均值”的變化情況。
2、反映數據“大多數水平”(集中趨勢)的量——眾數
眾數:即樣本數據中頻數最大(或頻率最高)的數據。
特點:①可以不存在或不止一個;
②不受極端數據的影響,求法簡單;
③可靠性差,如0,0,2,3,5這組數據中,眾數是0,它很難真實反映這組數據的“平均水平”(集中趨勢);
④眾數在難以定義“平均數”或“中位數”時常用,故一般可用于統計非數字型數據,如“牛,羊,馬,魚,牛”這組數據中,眾數是“牛”;
⑤眾數在銷售統計中常用
3、反映數據“中間水平”(集中趨勢)的量——中位數
中位數:把一組數據按從小到大的數序排列,在中間的一個數字(或兩個數字的平均值)叫做這組數據的中位數。
特點:①中位數把樣本數據分為兩部分,一部分大于中位數,另一部分小于中位數;
②中位數不受少數幾個極端值的影響;
③由于當樣本數據為偶數個時,中位數等于中間兩個數據的平均值,因此有時中位數未必在樣本數據中
4、反映數據“平均水平”(集中趨勢)的量——平均數
平均數:所有數據之和再除以數據的個數所得值,又稱算術平均數。
公式:
特點:一般情況下能有效地反映數據的集中趨勢;但易受極端值的影響,在極差較大的情況下,不如眾數和中位數準確;
5、反映數據“波動范圍”的量——極差
極差(R):一組測量數據中,最大值與最小值之差稱為極差
特點:極差只指明了測定值的最大離散范圍,而未能利用全部測量值的信息,不能精確反映測量值彼此相符合的程度;但計算簡單
6、反映數據“波動大小”的量——方差
方差:樣本中各數據與樣本平均數的差的平方的平均數叫做樣本方差(或均方差),隨機變量X的方差可記作:S2(或D(X))。
特點:①方差越大,數據的波動性越大;
②
7、反映數據“波動大小”的量——標準差
標準差:方差的平方根,記作S。
特點:①標準差越大,數據的波動性越大;
②
8、用樣本來估計總體:一般情況下,如果總體的容量較大,不便分析其數據特征,我們可以通過隨機抽取一定的樣本,通過樣本的數據特征來對總體的數據特征進行估計;但難免有一定誤差。
考點一 合理選擇統計量
例1、有一首打油詩“張村有個張千萬,隔壁九個窮光蛋,平均起來算一算,人人都是張百萬。”這首詩反映了什么現象?如何選擇恰當的統計量來反映該村的收入水平?某次數學考試,婷婷得到 78分。全班共30人,其他同學的成績為1個100分,4個90分,22個80分,以及1個2分和1個10分。婷婷計算出全班的平均分為 77分,所以婷婷告訴媽媽說,自己這次的成績在班上處于“中上水平”。她說得對嗎?如何選擇恰當的統計量來反映她的成績在班上的真實位置?
分析:在極差較大的情況下,用平均數來反映數據的特征往往出現較大的偏差,具體表現為標準差較大,如打油詩中數據的標準差達到了驚人的3000000,而婷婷班上成績數據的標準差也達到了19.93,所以才會出現基本上都是不名一文的村子卻“人人都是百萬富翁”以及排名倒數第三的成績成了“中上水平”的不正常現象。
解析:上述現象表明:平均數受極端值影響較大,在極差較大的情況下,不宜用平均數來刻畫數據的數字特征,可選用眾數或中位數。
考點二 從統計圖表中提取樣本的數字特征
例2、已知一組數據共有二十個,它的頻率分布直方圖如下(縱軸表示頻率):
試根據上圖寫出該組數據的中位數,眾數,平均數并求其標準差。
分析:①了解頻率分布直方圖的意義;②了解所求各量的意義。
解析:由圖可知:該組數據的中位數是
,眾數是5,平均數
標準差S=1.64
說明:如果已知各數據的頻率,則求平均值時對頻率與對應數據的積求和即可,即
。
考點三 反映數據集中趨勢的常用量——平均值
例3、在一次射擊訓練中,甲乙兩位選手分別進行了10次射擊測試,中靶成績如下:
甲
10
10
9
9
8
10
10
7
9
8
乙
9
6
10
10
9
10
7
9
10
8
根據上表數據計算,誰的成績更好?
分析:①本題是根據10次測試的成績來對選手的競技狀態進行評價,屬于根據樣本來對總體進行估計;②兩組數據的極差均不大,因此可選用平均數來進行估計。
解析:
,因為
,因此甲的成績好于乙的成績。
考點四 反映數據波動性的常用量——方差或標準差
例4、甲乙兩位選手在射擊訓練中的測試成績如下:
甲
10
10
9
9
9
9
8
9
9
8
乙
9
6
10
10
9
10
9
9
10
8
根據上表回答:
①哪位選手的狀態更好?
②按照歷次比賽的數據統計,獲獎選手平均中靶的環數至少為9.5,那么應該派哪位選手參賽較好?
分析:①以這10次測試的平均成績來進行估計;②經過計算可知,兩位選手的平均成績都不超過9.5,可結合穩定性來考慮;顯然,穩定性越好,獲獎的可能性越小。
解析:①
,因此兩位選手的平均成績是相同的;但是,S甲=0.67,S乙=1.25,因為S甲乙,所以甲發揮得更穩定;
②由于
,且S甲乙,因此可派出乙選手參加比賽。
說明:對第二個問題的處理,也可結合眾數進行。甲的數據的眾數是9,乙的數據的眾數是10和9,反映出大多數情況下,甲能打出9環,而乙能打出9環或10環。
1 、數據的兩個特征:集中趨勢和波動性。集中趨勢指的是數據的“一般水平”或曰“平均水平”,波動性指的是數據圍繞“平均值”的變化情況。
2 、反映數據“大多數水平”(集中趨勢)的量——眾數
眾數:即樣本數據中頻數最大(或頻率最高)的數據。
特點:①可以不存在或不止一個;
②不受極端數據的影響,求法簡單;
③可靠性差,如0 ,0 ,2 ,3 ,5 這組數據中,眾數是0 ,它很難真實反映這組數據的“平均水平”(集中趨勢);
④眾數在難以定義“平均數”或“中位數”時常用,故一般可用于統計非數字型數據,如“牛,羊,馬,魚,牛”這組數據中,眾數是“牛”;
⑤眾數在銷售統計中常用
3 、反映數據“中間水平”(集中趨勢)的量——中位數
中位數:把一組數據按從小到大的數序排列,在中間的一個數字(或兩個數字的平均值)叫做這組數據的中位數。
特點:①中位數把樣本數據分為兩部分,一部分大于中位數,另一部分小于中位數;
②中位數不受少數幾個極端值的影響;
③由于當樣本數據為偶數個時,中位數等于中間兩個數據的平均值,因此有時中位數未必在樣本數據中
4 、反映數據“平均水平”(集中趨勢)的量——平均數
平均數:所有數據之和再除以數據的個數所得值,又稱算術平均數。
公式:
特點:一般情況下能有效地反映數據的集中趨勢;但易受極端值的影響,在極差較大的情況下,不如眾數和中位數準確;
5 、反映數據“波動范圍”的量—— 極差
極差(R ):一組測量數據中,最大值與最小值之差稱為極差
特點:極差只指明了測定值的最大離散范圍,而未能利用全部測量值的信息,不能精確反映測量值彼此相符合的程度;但計算簡單
6 、反映數據“波動大小”的量—— 方差
方差:樣本中各數據與樣本平均數的差的平方的平均數叫做樣本方差(或均方差),隨機變量X 的方差可記作:S 2 (或D (X ))。
特點:①方差越大,數據的波動性越大;
②
7 、反映數據“波動大小”的量—— 標準差
標準差:方差的平方根,記作S 。
特點:①標準差越大,數據的波動性越大;
②
8 、用樣本來估計總體:一般情況下,如果總體的容量較大,不便分析其數據特征,我們可以通過隨機抽取一定的樣本,通過樣本的數據特征來對總體的數據特征進行估計;但難免有一定誤差。
考點一合理選擇統計量
例1 、有一首打油詩“張村有個張千萬,隔壁九個窮光蛋,平均起來算一算,人人都是張百萬。” 這首詩反映了什么現象?如何選擇恰當的統計量來反映該村的收入水平?某次數學考試,婷婷得到78 分。全班共30 人,其他同學的成績為1 個100 分,4 個90 分,22 個80 分,以及1 個2 分和1 個10 分。婷婷計算出全班的平均分為77 分,所以婷婷告訴媽媽說,自己這次的成績在班上處于“中上水平”。她說得對嗎?如何選擇恰當的統計量來反映她的成績在班上的真實位置?
解析:上述現象表明:平均數受極端值影響較大,在極差較大的情況下,不宜用平均數來刻畫數據的數字特征,可選用眾數或中位數。
考點二從統計圖表中提取樣本的數字特征
例2 、已知一組數據共有二十個,它的頻率分布直方圖如下(縱軸表示頻率):
試根據上圖寫出該組數據的中位數,眾數,平均數并求其標準差。
分析:①了解頻率分布直方圖的意義;②了解所求各量的意義。
由圖可知:該組數據的中位數是,眾數是5 ,平均數
標準差S=1.64
說明:如果已知各數據的頻率,則求平均值時對頻率與對應數據的積求和即可,即
。
考點三反映數據集中趨勢的常用量——平均值
例3 、在一次射擊訓練中,甲乙兩位選手分別進行了10 次射擊測試,中靶成績如下:
甲
10
10
9
9
8
10
10
7
9
8
乙
9
6
10
10
9
10
7
9
10
8
根據上表數據計算,誰的成績更好?
分析:①本題是根據10 次測試的成績來對選手的競技狀態進行評價,屬于根據樣本來對總體進行估計;②兩組數據的極差均不大,因此可選用平均數來進行估計。
,因為,因此甲的成績好于乙的成績。
考點四反映數據波動性的常用量——方差或標準差
例4 、甲乙兩位選手在射擊訓練中的測試成績如下:
甲
10
10
9
9
9
9
8
9
9
8
乙
9
6
10
10
9
10
9
9
10
8
根據上表回答:
①哪位選手的狀態更好?
②按照歷次比賽的數據統計,獲獎選手平均中靶的環數至少為9.5 ,那么應該派哪位選手參賽較好?
分析:①以這10 次測試的平均成績來進行估計;②經過計算可知,兩位選手的平均成績都不超過9.5 ,可結合穩定性來考慮;顯然,穩定性越好,獲獎的可能性越小。
①,因此兩位選手的平均成績是相同的;但是,S 甲=0.67 ,S 乙=1.25 ,因為S 甲
②由于S 甲
說明:對第二個問題的處理,也可結合眾數進行。甲的數據的眾數是9 ,乙的數據的眾數是10 和9 ,反映出大多數情況下,甲能打出9 環,而乙能打出9 環或10 環。
1、數據的兩個特征:集中趨勢和波動性。集中趨勢指的是數據的“一般水平”或曰“平均水平”,波動性指的是數據圍繞“平均值”的變化情況。
2、反映數據“大多數水平”(集中趨勢)的量——眾數
眾數:即樣本數據中頻數最大(或頻率最高)的數據。
特點:①可以不存在或不止一個;
②不受極端數據的影響,求法簡單;
③可靠性差,如0,0,2,3,5這組數據中,眾數是0,它很難真實反映這組數據的“平均水平”(集中趨勢);
④眾數在難以定義“平均數”或“中位數”時常用,故一般可用于統計非數字型數據,如“牛,羊,馬,魚,牛”這組數據中,眾數是“牛”;
⑤眾數在銷售統計中常用
3、反映數據“中間水平”(集中趨勢)的量——中位數
中位數:把一組數據按從小到大的數序排列,在中間的一個數字(或兩個數字的平均值)叫做這組數據的中位數。
特點:①中位數把樣本數據分為兩部分,一部分大于中位數,另一部分小于中位數;
②中位數不受少數幾個極端值的影響;
③由于當樣本數據為偶數個時,中位數等于中間兩個數據的平均值,因此有時中位數未必在樣本數據中
4、反映數據“平均水平”(集中趨勢)的量——平均數
平均數:所有數據之和再除以數據的個數所得值,又稱算術平均數。
公式:
特點:一般情況下能有效地反映數據的集中趨勢;但易受極端值的影響,在極差較大的情況下,不如眾數和中位數準確;
5、反映數據“波動范圍”的量——極差
極差(R):一組測量數據中,最大值與最小值之差稱為極差
特點:極差只指明了測定值的最大離散范圍,而未能利用全部測量值的信息,不能精確反映測量值彼此相符合的程度;但計算簡單
6、反映數據“波動大小”的量——方差
方差:樣本中各數據與樣本平均數的差的平方的平均數叫做樣本方差(或均方差),隨機變量X的方差可記作:S2(或D(X))。
特點:①方差越大,數據的波動性越大;
②
7、反映數據“波動大小”的量——標準差
標準差:方差的平方根,記作S。
特點:①標準差越大,數據的波動性越大;
②
8、用樣本來估計總體:一般情況下,如果總體的容量較大,不便分析其數據特征,我們可以通過隨機抽取一定的樣本,通過樣本的數據特征來對總體的數據特征進行估計;但難免有一定誤差。
【典型例題】
考點一 合理選擇統計量
例1、有一首打油詩“張村有個張千萬,隔壁九個窮光蛋,平均起來算一算,人人都是張百萬。”這首詩反映了什么現象?如何選擇恰當的統計量來反映該村的收入水平?某次數學考試,婷婷得到 78分。全班共30人,其他同學的成績為1個100分,4個90分,22個80分,以及1個2分和1個10分。婷婷計算出全班的平均分為 77分,所以婷婷告訴媽媽說,自己這次的成績在班上處于“中上水平”。她說得對嗎?如何選擇恰當的統計量來反映她的成績在班上的真實位置?
【分析】在極差較大的情況下,用平均數來反映數據的特征往往出現較大的偏差,具體表現為標準差較大,如打油詩中數據的標準差達到了驚人的3000000,而婷婷班上成績數據的標準差也達到了19.93,所以才會出現基本上都是不名一文的村子卻“人人都是百萬富翁”以及排名倒數第三的成績成了“中上水平”的不正常現象。
【答】上述現象表明:平均數受極端值影響較大,在極差較大的情況下,不宜用平均數來刻畫數據的數字特征,可選用眾數或中位數。
考點二 從統計圖表中提取樣本的數字特征
例2、已知一組數據共有二十個,它的頻率分布直方圖如下(縱軸表示頻率):
試根據上圖寫出該組數據的中位數,眾數,平均數并求其標準差。
【分析】①了解頻率分布直方圖的意義;②了解所求各量的意義。
【解】由圖可知:該組數據的中位數是,眾數是5,平均數
標準差S=1.64
【說明】如果已知各數據的頻率,則求平均值時對頻率與對應數據的積求和即可,即。
考點三 反映數據集中趨勢的常用量——平均值
例3、在一次射擊訓練中,甲乙兩位選手分別進行了10次射擊測試,中靶成績如下:
甲
10
10
9
9
8
10
10
7
9
8
乙
9
6
10
10
9
10
7
9
10
8
根據上表數據計算,誰的成績更好?
【分析】①本題是根據10次測試的成績來對選手的競技狀態進行評價,屬于根據樣本來對總體進行估計;②兩組數據的極差均不大,因此可選用平均數來進行估計。
【解】,因為,因此甲的成績好于乙的成績。
考點四 反映數據波動性的常用量——方差或標準差
例4、甲乙兩位選手在射擊訓練中的測試成績如下:
甲
10
10
9
9
9
9
8
9
9
8
乙
9
6
10
10
9
10
9
9
10
8
根據上表回答:
①哪位選手的狀態更好?
②按照歷次比賽的數據統計,獲獎選手平均中靶的環數至少為9.5,那么應該派哪位選手參賽較好?
【分析】①以這10次測試的平均成績來進行估計;②經過計算可知,兩位選手的平均成績都不超過9.5,可結合穩定性來考慮;顯然,穩定性越好,獲獎的可能性越小。
【解】①,因此兩位選手的平均成績是相同的;但是,S甲=0.67,S乙=1.25,因為S甲<>乙,所以甲發揮得更穩定;
②由于,且S甲<>乙,因此可派出乙選手參加比賽。
說明:對第二個問題的處理,也可結合眾數進行。甲的數據的眾數是9,乙的數據的眾數是10和9,反映出大多數情況下,甲能打出9環,而乙能打出9環或10環。
Copyright 2010-2019 Qinzibuy.com 【親親園丁】 版權所有 備案編號:粵ICP備14102101號