『壹』 分層抽樣的演算法步驟
分層抽樣 1、知識與技能:
(1)正確理解分層抽樣的概念;
(2)掌握分層抽樣的一般步驟;
(3)區分簡單隨機抽樣、系統抽樣和分層抽樣,並選擇適當正確的方法 進行抽樣。
2、過程與方法:通過對現實生活中實際問題進行分層抽樣,感知應用數學 知識解決實際問題的方法。
3、情感態度與價值觀:通過對統計學知識的研究,感知數學知識中「估計 與「精確」性的矛盾統一,培養學生的辯證唯物主義的世界觀與價值觀。
4、重點與難點:正確理解分層抽樣的定義,靈活應用分層抽樣抽取樣本, 並恰當的選擇三種抽樣方法解決現實生活中的抽樣問題。
教學設想: 教學設想 【創設情景】 假設某地區有高中生 2400 人,初中生 10900 人,小學生 11000 人,此地 教育部門為了了解本地區中小學的近視情況及其形成原因,要從本地區的 小學生中抽取 1%的學生進行調查,你認為應當怎樣抽取樣本? 【探究新知 探究新知】 探究新知 一、分層抽樣的定義。 一般地,在抽樣時,將總體分成互不交叉的層,然後按照一定的比例, 從各層獨立地抽取一定數量的個體,將各層取出的個體合在一起作為樣本, 這種抽樣的方法叫分層抽樣。 說明】 【說明】分層抽樣又稱類型抽樣,應用分層抽樣應遵循以下要求:
(1)分層:將相似的個體歸人一類,即為一層,分層要求每層的各個個體 互不交叉,即遵循不重復、不遺漏的原則。
(2)分層抽樣為保證每個個體等可能入樣,需遵循在各層中進行簡單隨機 抽樣,每層樣本數量與每層個體數量的比與這層個體數量與總體容量 的比相等。 二、分層抽樣的步驟: (1)分層:按某種特徵將總體分成若幹部分。
(2)按比例確定每層抽取個體的個數。
(3)各層分別按簡單隨機抽樣的方法抽取。
(4)綜合每層抽樣,組成樣本。
【說明】 (1)分層需遵循不重復、不遺漏的原則。
(2)抽取比例由每層個體占總體的比例確定。
(3)各層抽樣按簡單隨機抽樣進行。
探究交流:
(1)分層抽樣又稱類型抽樣,即將相似的個體歸入一類(層) ,然後每層抽 取若干個體構成樣本,所以分層抽樣為保證每個個體等可能入樣,必 ( ) 須進行A、每層等可能抽樣 B、每層不等可能抽樣 C、所有層按同一抽樣比等可能抽樣
(2)如果採用分層抽樣,從個體數為 N 的總體中抽取一個容量為 n 樣本,那麼每個個體被抽到的可能性為 ( ) A. N 1 B. n 1 C. N n D. N n
點撥: 點撥: (1)保證每個個體等可能入樣是簡單隨機抽樣、系統抽樣、分層抽 共同的特徵,為了保證這一點,分層時用同一抽樣比是必不可少 的,故此選 C。
(2)根據每個個體都等可能入樣,所以其可能性本容量與總體容量 比,故此題選 C。
知識點 2 簡單隨機抽樣、系統抽樣、分層抽樣的比較 適 用 類 別 共同點 各自特點 聯 系 范 圍
(1)抽樣過程中每 總體個 簡 單 從總體中逐個抽取 個個體被抽到 數較少 隨 機 的可能性相等 將總體均分成幾部 抽 樣 在起始部分 總體個
(2)每次抽出個體 分, 按預先制定的規 樣時採用簡 數較多 後不再將它放 則在各部分抽取 隨機抽樣 系 統 回,即不放回 抽 樣 總體由 抽樣 分層抽樣時采 差異明 將總體分成幾層, 用簡單隨機抽 顯的幾 分 層 分層進行抽取 樣或系統抽樣 部分組 抽 樣 成 【例選精析】 例選精析】
例1、 某高中共有 900 人,其中高一年級 300 人,高二年級 200 人,高三年級 400 人,現採用分層抽樣抽取容量為 45 的樣本,那麼高一、高二、高三各 年級抽取的人數分別為 A.15,5,25 B.15,15,15 C.10,5,30 D15,10,20 分析]因為 300:200:400=3:2:4,於是將 45 分成 3:2:4 的三部分。設 [分析 分析 三部分各抽取的個體數分別為 3x,2x,4x,由 3x+2x+4x=45,得 x=5,故 高一、高二、高三各年級抽取的人數分別為 15,10,20,故選 D。
例 2:一個地區共有 5 個鄉鎮,人口 3 萬人,其中人口比例為 3:2:5:2:3, 從 3 萬人中抽取一個 300 人的樣本,分析某種疾病的發病率,已知這種疾 病與不同的地理位置及水土有關, 問應採取什麼樣的方法?並寫出具體過 程。
[分析 分析]採用分層抽樣的方法。 分析 解:因為疾病與地理位置和水土均有關系,所以不同鄉鎮的發病情況差異明 顯,因而採用分層抽樣的方法,具體過程如下:
(1)將 3 萬人分為 5 層,其中一個鄉鎮為一層。
(2)按照樣本容量的比例隨機抽取各鄉鎮應抽取的樣本。 300×3/15=60 (人) 300×2/15=100 , (人) 300×2/15=40 , (人) 300×2/15=60 , (人) ,因此各鄉鎮抽取人數分別為 60 人、40 人、100 人、40 人、60 人。 (3)將 300 人組到一起,即得到一個樣本。
『貳』 簡單抽樣怎麼算
(n-1)/n*(n-2)/(n-1)*1/(n-2)=1/n 沒錯啊
請注意、第二次抽的時候、總數是n-1,即沒抽中概率=1-1/n-1=(n-2)/(n-1)
『叄』 AQL抽樣標準是怎麼算的
AQL值是各公司依客戶要求、產品特性等決定的。抽樣檢驗裡面分抽樣水平和判定水平二種通常產品抽樣水平:外觀檢驗是用一般水平Ⅱ,尺寸抽樣是用物殊水平S-4。至於產品可靠性測試的抽樣則更是依產品而定。
通過AQL2.5/4.0抽查檢驗表(GB2828-87)得出的。
說明:Ac——Accept(合格判定數);Re——Rcject(不合格判定數)例:訂單數是3000件,按照AQL2.5標准抽查125件,次品數≤7就PASS(通過)。
次品數≥8就FAIL(不合格)訂單數為7件,按AQL2.5標准抽查5件,無次品就PASS,有一件次品都FAIL;如果按照AQL4.0標准則只抽查3件,無次品就PASS。
驗貨抽檢
批量范圍、檢查水平、AQL值決定抽樣的數量和合格與不合格產品的數量。服裝質量檢查採用一次抽樣方案,服裝批量的合格質量水平(AQL)為2.5,檢查水平為一般檢查水平,檢查的嚴格度為正常檢查。
正常檢查一次抽樣方案(AQL-2.5) AQL是----ACCEPTANCE QUALITY LIMIT 的簡稱,是一個國際標准, 1 ) AC=Acceptable number =使用箭頭下面的第一個數值 =使用箭頭上面的第一數值抽樣數量是以一般檢驗II級檢驗水平來進行的。
以上內容參考:網路-aql
『肆』 什麼是吉布斯采樣演算法
幾個可以學習gibbs sampling的方法
1,讀Bishop的Pattern Recognition and Machine Learning,講的很清楚,但是我記得好像沒有例子。
2,讀artificial Intelligence,2、3版,都有。但是我沒讀過。
3,最方便的,查wiki,這個說的最清楚。
這里通俗點的解釋一下。首先,什麼是sampling。sampling就是以一定的概率分布,看發生什麼事件。舉一個例子。甲只能E:吃飯、學習、打球,時間T:上午、下午、晚上,天氣W:晴朗、刮風、下雨。現在要一個sample,這個sample可以是:打球+下午+晴朗。。。
問題是我們不知道p(E,T,W),或者說,不知道三件事的聯合分布。當然,如果知道的話,就沒有必要用gibbs sampling了。但是,我們知道三件事的conditional distribution。也就是說,p(E|T,W),p(T|E,W),p(W|E,T)。現在要做的就是通過這三個已知的條件分布,再用gibbs sampling的方法,得到joint distribution。
具體方法。首先隨便初始化一個組合,i.e. 學習+晚上+刮風,然後依條件概率改變其中的一個變數。具體說,假設我們知道晚上+刮風,我們給E生成一個變數,比如,學習-》吃飯。我們再依條件概率改下一個變數,根據學習+刮風,把晚上變成上午。類似地,把刮風變成刮風(當然可以變成相同的變數)。這樣學習+晚上+刮風-》吃飯+上午+刮風。
同樣的方法,得到一個序列,每個單元包含三個變數,也就是一個馬爾可夫鏈。然後跳過初始的一定數量的單元(比如100個),然後隔一定的數量取一個單元(比如隔20個取1個)。這樣sample到的單元,是逼近聯合分布的。
我也是剛wiki到的,可能不完全正確,歡迎討論:
[email protected]
『伍』 抽樣樣本選擇的方法是
抽樣調查的一般程序:抽樣調查是由五個步驟組成的工作過程。 1、確定調查總體:即明確調查的全部對象及其范圍。這是抽樣調查的前提和基礎。 2、抽樣框架的確定和個體編號:抽樣框架這是提供抽樣所用被調查對象的詳細名單。在沒有現成名單的情況下,可由調查人員自己編制。個體編號:即對調查總體中的個體進行編號。 3、選擇調查樣本:需首先確定抽樣的技術(隨機抽樣還是非隨機抽樣),要確定具體的抽樣方法(如分層抽樣還是分群抽樣)還要確定樣本的數量。在上述問題確定後,按預定的要求選擇調查的樣本。 4、實施調查:對選定的樣本運用不同的調查方法逐個進行調查,從而取得第一手資料。 5、測算結果:這是抽樣調查的最後一個步驟,也是抽樣調查的目的的所在。指用樣本指標推斷總體指標的結果。具體方法包括百分比推演算法和平均推演算法等。
『陸』 采樣頻率是怎麼計算出來的
采樣點數的多少與要求多大的頻率解析度有關,例如:機器轉速3000r/min=50Hz,如果要分析的故障頻率估計在8倍頻以下,要求譜圖上頻率解析度ΔF=1 Hz ,則采樣頻率和采樣點數設置為:
最高分析頻率Fm=8·50Hz=400Hz;
采樣頻率Fs=2.56·Fm=2.56 ·400Hz=1024Hz;
采樣點數N=2.56·(Fm/ΔF)=2.56·(400Hz/1Hz)=1024
(6)抽樣演算法擴展閱讀:
采樣頻率只能用於周期性采樣的采樣器,對於非周期性采樣的采樣器沒有規則限制。
采樣頻率必須大於被采樣信號帶寬的兩倍,另外一種等同的說法是奈奎斯特定律必須大於被采樣信號的帶寬。如果信號的帶寬是100Hz,那麼為了避免混疊現象采樣頻率必須大於200Hz。換句話說就是采樣頻率必須至少是信號中最大頻率分量頻率的兩倍,否則就不能從信號采樣中恢復原始信號。
『柒』 請通俗的介紹一下「抽樣誤差」是怎麼算出來的
抽樣誤差是指由於隨機抽樣的偶然周素使樣本各單位的結構對總體各單位結構的代表性差別,而引起的抽樣指標和全及指標之間的絕對離差。如抽樣平均數與總體平均數的絕對離差,抽樣成數與總體成數的絕對離差等等。
必須指出,抽樣誤差是抽樣所特有的誤差。凡進行抽樣就一定會產生抽樣誤差,這種誤差雖然是不可避免的,但可以控制,所以又稱為可控制誤差。抽樣誤差與另外兩種誤差不同。一種是調查誤差,即在調查過程中,由於觀察測量、登記、計算上的差錯所引起的誤差:另一種是系統偏誤,即由於違反隨機原則,有意地選擇較好或較差單位進行調查,造成樣本代表性不足所引起的誤差。這兩種誤差是可以防止和避免的。
影響抽樣誤差大小的因素主要有:
(1)總體單位的標志值的差異程度。 差異程度愈大則抽樣誤差愈大,反之則愈小。
(2)樣本單位數的多少。 在其他條件相同的情況下,樣本單位數愈多,則抽樣誤差愈小。
(3)抽樣方法。 抽樣方法不同,抽樣誤差也不相同。一般說,重復抽樣比不重復抽樣,誤差要大些。
(4)抽樣調查的組織形式。 抽樣調查的組織形式不同,其抽樣誤差也不相同,而且同一組織形式的合理程度也會影響抽樣誤差。
『捌』 采樣,量化,編碼之間三者之間有什麼關系
音頻?
采樣是指用每隔一定時間的信號樣值序列來代替原來在時間上連續的信號,也就是在時間上將模擬信號離散化.量化是用有限個幅度值近似原來連續變化的幅度值,把模擬信號的連續幅度變為有限數量的有一定間隔的離散值.編碼則是按照一定的規律,把量化後的值用二進制數字表示.
把模擬信號轉換成數字信號的過程稱為模/數轉換,它主要包括:
采樣:在時間軸上對信號數字化;
量化:在幅度軸上對信號數字化;
編碼:按一定格式記錄采樣和量化後的數字數據。
采樣頻率
采樣頻率是指一秒鍾內采樣的次數。奈奎斯特(Harry
Nyquist)采樣理論:如果對某一模擬信號進行采樣,則采樣後可還原的最高信號頻率只有采樣頻率的一半,或者說只要采樣頻率高於輸入信號最高頻率的兩倍,就能從采樣信號系列重構原始信號。
根據該采樣理論,CD激光唱盤采樣頻率為44KHz,可記錄的最高音頻為22KHz,這樣的音質與原始聲音相差無幾,也就是我們常說的超級高保真音質(Super
High
Fidelity-HiFi)。采樣的三個標准頻率分別為:44.1KHz,22.05KHz和11.025KHz。
量化位數
量化位是對模擬音頻信號的幅度軸進行數字化,它決定了模擬信號數字化以後的動態范圍。由於計算機按位元組運算,一般的量化位數為8位和16位。量化位越高,信號的動態范圍越大,數字化後的音頻信號就越可能接近原始信號,但所需要的存貯空間也越大。
量化位
等份
動態范圍(dB)
應用
8
256
48-50
數字電話
16
65536
96-100
CD-DA
聲道數
有單聲道和雙聲道之分。雙聲道又稱為立體聲,在硬體中要佔兩條線路,音質、音色好,但立體聲數字化後所佔空間比單聲道多一倍。
編碼演算法
編碼的作用一是採用一定的格式來記錄數字數據,二是採用一定的演算法來壓縮數字數據。壓縮編碼的基本指標之一就是壓縮比:
壓縮比通常小於1。壓縮演算法包括有損壓縮和無損壓縮;有損壓縮指解壓後數據不能完全復原,要丟失一部分信息。壓縮比越小,丟掉的信息越多、信號還原後失真越大。根據不同的應用,可以選用不同的壓縮編碼演算法,如PCM,ADPC,MP3,RA等等。
數據率=采樣頻率(Hz)×量化位數(bit)×聲道數(bit/s)
『玖』 如何用公式算出抽樣的可信度有多高。
用算出批量法再以總數除以部分的這種的演算法,會有一些偏差。但是偏差並不大。如果你需要的不是非常非常准確的數字,那這樣算就可以了。
『拾』 抽樣樣本計算方法
那麼對有N個個體的總體,所抽取的樣本容量到底該有多大?根據統計學的研究,這與要求的誤差把握(概率)有關.
以一個實際問題來說明,設上文所提到的某地區15歲學生共有N人,設這N人中近視眼比例為a,a未知,待估計.而我們抽出的樣本容量為n,樣本中近視眼的比例為p,把p作為a的估計值,兩者之間是有誤差的.
在統計學中有專門的根據誤差要求計算樣本容量的公式,舉幾例如下:
(1)如果希望有95%的把握,使得誤差|p-a|<0.15,那麼只要取樣本容量為
(2)如果希望有95%的把握,使得誤差|p-a|<0.1,那麼可以取樣本容量為
(3)同樣地,如果希望有95%的把握,使得誤差|p-a|<0.05,那麼要取
綜上可知:
(1)隨著誤差|p-a|的減小,樣本容量n必須增加.這說明,要提高估計的精確性,必須增加樣本容量.在N=50並要求有95%的把握時,兩者的關系如下表所示.
|p-q|<0.15
|p-a|<0.1
|p-a|<0.05
n
24
34
45
(2)隨著總體中個體個數的增加,樣本容量n也隨之增加,但n的增加比N的增加要慢得多,無正比例關系.例如在要求誤差|p-a|<0.05時,兩者的關系如下表所示.
N
50
100
200
500
1000
2000
3000
4000
5000
n
45
80
132
218
278
323
341
351
357
它告訴我們,在保證估計達到一定的精確性的前提下,在總體中個體個數很多時,並不需要很大的樣本容量.這是抽樣調查之所以行之有效的原因之一.