A. 分位數回歸和最小二乘回歸有什麼不同
(一)含義不同
1、分位數,是指將一個隨機變數的概率分布范圍分為幾個等份的數值點,如中位數、四分位數。
2、上側分位數,對於任意α(0<α<1),滿足條件P{X>x}≤α≤P{X≥x}的x值,稱做隨機變數X的α上側分位數,記作xα。
(二)范疇不同
1、分位數,對於某一特定概率分布,其某一分位數,如二分位數(中位數)通常是唯一的。對於有限的數集,可以通過把所有觀察值高低排序後找出正中間的一個作為二分位數。如果觀察值有偶數個,通常取最中間的兩個數值的平均數作為二分位數。
2、對於任意概率分布,上側分位數xα存在但未必唯一。
分位數採用加權殘差絕對值之和的方法估計參數,其優點體現在以下幾方面:
首先,它對模型中的隨機擾動項不需做任何分布的假定,這樣整個回歸模型就具有很強的穩健性。
其次,分位數回歸本身沒有使用一個連接函數來描述因變數的均值和方差的相互關系,因此分位數回歸有著比較好的彈性性質。
分位數回歸由於是對所有分位數進行回歸,因此對於數據中出現的異常點具有耐抗性;第四,不同於普通的最小二乘回歸,分位數回歸對於因變數具有單調變換性;最後,分位數回歸估計出來的參數具有在大樣本理論下的漸進優良性。
B. 分位數回歸和中位數回歸的區別
分位數回歸和中位數回歸的區別是用法不同,影響不同。
1、分位數回歸是估計一組回歸變數X與被解釋變數Y的分位數之間線性關系的建模方法。不同分位數下的回歸系數估計量常常不同,即解釋變數對不同水平被解釋變數的影響不同。
2、中位數回歸是按順序排列的一組數據居於中間位置的數,代表一個樣本、種群或概率分布中的一個數值,其可將數值集合劃分為相等的上下兩部分。
C. 分位數如何計算
分位數的計算步驟如下:
第一步,要知道什麼是分位數。分位數也叫分位點,是指將一個隨機變數的概率分布范圍分為幾個等份的數值點。常用的有中位數(即二分位數)、四分位數、百分位數等。
第二步,生活中,最常見有中位數(也就是二分位數)、四分位數、百分位數等等。
第三步,對於二分位數,也就是中位數,可以通過把所有觀察值高低排序後,找出正中間的一個作為中位數。注意觀察法適用於有限的數集。
第四步,如果觀察值有偶數個,則中位數不唯一,通常取最中間的兩個數值的平均數作為中位數,即二分位數。
第五步,四分位數的計算方法就是即把所有數值由小到大排列並分成四等份,處於三個分割點位置的數值就是四分位數。
第六步,對於四分位數我們也要區分好第一四分位數、第二四分位數、第三分位數等。
注意二分位數使用觀察法時,適用於數集有限,並數量較少。
分位數回歸思想的提出至今已經有近30多年了,經過這近30多年的發展,分位數回歸在理論和方法上都越來越成熟,並被廣泛應用於多種學科中。它對於實際問題能提供更加全面的分析,無論是線性模型還是非線性模型,分位數回歸都是一種很好的工具,它對一般回歸模型做了有益的補充。
D. 上下四分位數計算公式是什麼
確定四分位數的位置:b= 1+(n-1) × 0.25= 2.25,b的整數部分計為c b的小數部分計為d,計算Q1:Q1=a(c)+[a(c+1)-a(c)]*d=a(2)+[a(3)-a(2)] *0.25 =15+(36-15)×(2.25-2)=20.25。
當n為奇數時,中數Q2將該數列分為數量相等的兩組數,每組有 (n-1)/2 個數,Q1為第一組 (n-1)/2 個數的中數,Q3為為第二組(n-1)/2個數的中數。
當n為偶數時,中數Q2將該數列分為數量相等的兩組數,每組有n/2數,Q1為第一組 n/2個數的中數,Q3為為第二組 n/2 個數的中數。
應用
分位數回歸思想的提出至今已經有近30多年了,經過這近30多年的發展,分位數回歸在理論和方法上都越來越成熟,並被廣泛應用於多種學科中。
分位數回歸是對以古典條件均值模型為基礎的最小二乘法的延伸,它用幾個分位函數來估計整體模型。分位數回歸法的特殊情況就是中位數回歸(最小一乘回歸),用對稱權重解決殘差最小化問題,而其他條件分位數回歸則需要用非對稱權重解決殘差最小化。
E. 分位數回歸擬合程度怎麼算
分位數回歸擬合程度用分位數回歸中擬合優度的計算方法計算。定義為最小二乘回歸中的依據殘差平方和度量了回歸平方和占總離差平方和的比重,按照殘差絕對值的加權和,度量了在某個分位數下分位數回歸的擬合效果。描述的是在某個分位數下的局部擬合效果。
F. 什麼是分位數回歸
分位數回歸(Quantile Regression):是計量經濟學的研究前沿方向之一,它利用解釋變數的多個分位數(例如四分位、十分位、百分位等)來得到被解釋變數的條件分布的相應的分位數方程。
與傳統的OLS只得到均值方程相比,它可以更詳細地描述變數的統計分布。
傳統的線性回歸模型描述了因變數的條件分布
受到自變數X的影響過程。普通最dx--乘法是估計
回歸系數的最基本的方法,它描述了自變數X對於
因變數y的均值影響。如果模型中的隨機擾動項來
自均值為零而且同方差的分布,那麼回歸系數的最
dx--乘估計為最佳線性無偏估計(BLUE);如果近
一步隨機擾動項服從正態分布,那麼回歸系數的最
dx--乘法或極大似然估計為最小方差無偏估計
(MⅥ甩)。但是在實際的經濟生活中,這種假設常
常不被滿足,飼如數據出現尖峰或厚尾的分布、存在
顯著的異方差等情況,這時的最小二乘法估計將不
再具有上述優良性且穩健性非常差。最小二乘回歸
假定自變數X只能影響因變數的條件分布的位置,
但不能影響其分布的刻度或形狀的任何其他方面。
為了彌補普通最dx--乘法(0Ls)在回歸分析中
的缺陷,Koenkel"和Pxassett於1978年提出了分位數
回歸(Quantile Regression)的思想⋯。它依據因變
量的條件分位數對自變數X進行回歸,這樣得到了
所有分位數下的回歸模型。因此分位數回歸相比普
通最小二乘回歸只能描述自變數X對於因變數y
局部變化的影響而言,更能精確地描述自變數X對
於因變數y的變化范圍以及條件分布形狀的影響。
分位數回歸能夠捕捉分布的尾部特徵,當自變數對
不同部分的因變數的分布產生不同的影響時.例如
出現左偏或右偏的情況時。它能更加全面的刻畫分
布的特徵,從而得到全面的分析,而且其分位數回歸
系數估計比OLS回歸系數估計更穩健。
近10多年來,分位數回歸在國外得到了迅猛的
發展及應用,其研究領域包括經濟、醫學、環境科學、
生存分析以及動植物學等方面(見本文第四部分)。
為了說明分位數回歸的有用性,我們特介紹兩個分
位數回歸實證分析的例子。Koenker和Machado分
析了1965~1975以及1975~1985這兩段時間內世
界主要國家的經濟增長情況。模型選取了13個影響
經濟增長的自變數,通過分位數回歸得出結論:對於
起初的單位資本產出這一自變數來說,它的全部回歸分位系數基本保持不變,這就意味著對於經濟發
展迅速與緩慢的國家而言,起初的單位資本產出對
於經濟增長的影響基本相同;但是教育支出佔GDP
的比重以及公共消費佔GDP的比重這兩個自變數
對於經濟發展緩慢的國家影響更加的強烈[2l。
Chen使用分位數回歸方法深入研究了美國8 250名
男性的BMI(身體質量指數,一種廣泛用於測量偏
胖還是偏瘦的指標,BMI=體重/身高2)情況,並得
出結論:在2~20歲這一快速成長期中,BMI非常
迅速的增加;在中年期間其值保持比較穩定;60歲
以後,BMI的值開始減少⋯3。這對於如何保持一個
健康的身體提供了一種非常有效的措施,可以在各
個階段中分別採取相應的控制體重的方法。
在概要介紹分位數回歸的基本情況後