網(wǎng)站首頁
醫(yī)師
藥師
護(hù)士
衛(wèi)生資格
高級職稱
住院醫(yī)師
畜牧獸醫(yī)
醫(yī)學(xué)考研
醫(yī)學(xué)論文
醫(yī)學(xué)會議
考試寶典
網(wǎng)校
論壇
招聘
最新更新
網(wǎng)站地圖
您現(xiàn)在的位置: 醫(yī)學(xué)全在線 > 理論教學(xué) > 基礎(chǔ)學(xué)科 > 醫(yī)學(xué)統(tǒng)計學(xué) > 正文:直線回歸
    

直線回歸

  一、直線回歸方程的意義

  計算出相關(guān)系數(shù)后,如果r顯著,且又需要進(jìn)一步了解兩變量中一個變量依另一個變量而變動的規(guī)律時,則可進(jìn)行回歸分析。

  “回歸”是個借用已久因而相沿成習(xí)的名稱。若某一變量(Y)隨另一變量(X)的變動而變動,則稱X為自變量,Y為應(yīng)變量。這種關(guān)系在數(shù)學(xué)上被稱為Y是X的函數(shù),但在醫(yī)學(xué)領(lǐng)域里,自變量與應(yīng)變量的關(guān)系和數(shù)學(xué)上的函數(shù)關(guān)系有所不同。例如成年人年齡和血壓的關(guān)系,通過大量調(diào)查,看出平均收縮壓隨年齡的增長而增高,并且呈直線趨,但各點(diǎn)并非恰好都在直線上。為強(qiáng)調(diào)這一區(qū)別,統(tǒng)計上稱這是血壓在年齡上的回歸。

  直線回歸分析的任務(wù)就是建立一個描述應(yīng)變量依自變量而變化的直線方程,并要求各點(diǎn)與該直線縱向距離的平方和為最小。按這個要求計算回歸方程的方法稱為最小平方法或最小二乘法。所建立的方程是一個二元一次方程式,其標(biāo)準(zhǔn)形式是:

=a+bX(9.5)

  式(9.4)為由X推算得來的Y值,即Y的估計值:a稱為截距,它是當(dāng)X=0時的值,即回歸直線與縱軸的交點(diǎn):b稱為回歸系數(shù),它是回歸直線的斜率,其含意是當(dāng)X每增加一個單位時,相應(yīng)增(或減)b個單位。當(dāng)a與b求得后,直線回歸方程就確定了。

  二、直線回歸方程的計算法

  仍以表9.1資料為例,根據(jù)前面的相關(guān)分析以及醫(yī)學(xué)上有關(guān)凝血的機(jī)理,可知凝血時間依凝血酶濃度而異,且有密切的關(guān)系。因此可進(jìn)一步作由凝血酶濃度(X)推算凝血時間(Y)的回歸方程。求直線回歸方程的步驟如下:

  1.列回歸計算表(見表9.1),計算∑X、∑Y、∑X2、∑Y2、∑XY。

  2.計算X、Y、∑(X-X)2、∑(X-X)(Y-Y)

  X=∑X/n=15.1/15=1.01

  Y=∑Y/n=222/15=14.80

  ∑(X-X)2=∑X2-(∑X)2/n=0.2093

  ∑(X-X)(Y-Y)=∑XY-∑X·∑Y/n=-1.7800

  3.計算回歸系數(shù)b和截距a。b和a兩值計算公式均是根據(jù)最小二乘法的原理推算出來的,其公式如下:

(9.5)

  a=Y-bX               (9.6)

  本例b=-1.7800/0.2093=-8.5045

  a=14.80-(-8.5045)(1.01)=23.3895

  4.列出回歸方程,繪制回歸直線,將求得的b和a的值代入到式(9.4),即得所求的回歸方程:

=23.3895-8.504X

  在凝血酶濃度的實(shí)測范圍內(nèi),即X=0.8到X=1.2之間,任選兩個X值(一般選相距較遠(yuǎn)且直角坐標(biāo)系上容易讀出者),代入此回歸方程,即得相應(yīng)的兩個值。例如:

  取 X1=0.8,則1=23.3895-8.5045×0.8=16.59,

  X2=1.2 則2=23.3895-8.5045×1.2=13.18。

  連接(0.8、16.59)和(1.2、13.18)兩點(diǎn)所得直線,即為由凝血酶濃度推算凝血時間的回歸直線(見圖9.9)。須注意回歸直線必通過(χ,y )點(diǎn),并穿過觀察點(diǎn)群,直線上下各有一些點(diǎn)散布著,否則計算有誤。

  三、直線回歸方程的假設(shè)檢驗(yàn)

 。ㄒ)樣本回歸系數(shù)的假設(shè)檢驗(yàn)

  根據(jù)例9.1資料求得的是樣本回歸系數(shù)b,有抽樣誤差的,需作假設(shè)檢驗(yàn),檢驗(yàn)其是否是從回歸系數(shù)為0的假設(shè)總體(即β=0)中隨機(jī)抽得的,也就是檢驗(yàn)b與0的差別有無顯著性。如果差別有顯著性,可認(rèn)為X與Y間有直線回歸存在。

  樣本回歸系數(shù)的假設(shè)檢驗(yàn)亦用t檢驗(yàn)。

  H0:β=0即Y的變化與X無關(guān);

  H1:β≠0。

  計算公式為:

   (9.7)

  分母Sb是樣本回歸系數(shù)b的標(biāo)準(zhǔn)誤,計算公式為:

            (9.8)

  分子Sy.x為各觀察值Y距回歸線的標(biāo)準(zhǔn)差,即當(dāng)X的影響被扣去以后Y方面的變異,可按下式計算:

        (9.9)

  式中∑(Y-)2為估計誤差平方和,常用下式計算:

(9.10)

  根據(jù)數(shù)理統(tǒng)計的理論,同一批資料計算所得tr與tb是相同的,即tr=tb。處理資料時可檢驗(yàn)相關(guān)顯著性代替其回歸顯著性。

  由于例9.1資料的r在α=0.01水準(zhǔn)上顯著,故可判斷樣本回歸系數(shù)-8.5045與0的相差有顯著性,說明存在凝血時間隨凝血酶濃度變化而變化的回歸關(guān)系。

  (二)兩樣本回歸系數(shù)相差的假設(shè)檢驗(yàn)

  若有兩個可以比較的樣本,它們的回歸系數(shù)分別為b1與b2,經(jīng)檢驗(yàn)都為顯著,回歸系數(shù)的標(biāo)準(zhǔn)誤分別為Sb1和Sb2。b1與b2相差的顯著性也可用t檢驗(yàn)法檢驗(yàn),其計算公式為:

(9.11)

  ν=n1+n2-4

  式(9.11)中Sb1-b2為兩樣本回歸系數(shù)之差的標(biāo)準(zhǔn)誤,其計算公式為:

 (9.12)

  式(9.12)中S2C為兩樣本回歸系數(shù)的合并方差,其計算公式為: 

    (9.13)

  式(9.13)中∑(Y-)2為估計誤差平方和,即觀察值Y與估計值的差數(shù)(Y-)的平方之和。其計算公式見公式(9.10),

  現(xiàn)以實(shí)例說明兩樣本回歸系數(shù)t檢驗(yàn)的步驟。

  例9.2 表9.2資料為同一批白蛋白于38℃與25℃條件下,不同時間(分)的凝固百分比,問由此而得的兩樣本回歸系數(shù)相差是否顯著?

表9.2 白蛋白在兩種溫度下各不同時間的凝固百分比

時間(分) 凝固百分比(%)
X 25℃
Y1
38℃
Y2
3 7.2 12.0
6 18.4 30.0
9 30.0 44.0
12 40.0 53.0
15 49.0 66.0
18 58.0 81.5
合計 63 202.6 286.5

  本例圖示見圖9.10,本例計算見圖下:

圖9.10 白蛋白在兩種溫度下各不相同時間的凝固百分比

  r1=0.998(P<0.01) b1=3.389 ∑(Y1-1)2=5.7927n1=6

  r2=0.996(P<0.01) b2=4.424∑(Y2-2)2=24.5857n2=6

  ∑(X1-X1)2=∑(X-X)2=157.5000

  1.H0:β12=0

  H1:β12≠0

  α=0.01

  2.計算t值:

  3.查t值表作結(jié)論:以ν=6+6-4=8查t值表,得

  t0.01,8=2.355,今∣t∣>t0.01,8,故P<0.01。

  4.判斷結(jié)果:按α=0.01水準(zhǔn),拒絕H0,接受H1,故兩個回歸系數(shù)差別顯著。說明兩條回歸直線的斜率不同,兩條回歸直線中X對Y的影響規(guī)律不一致,F(xiàn)b2>b1,說明隨著時間的增加,蛋白質(zhì)在38℃時凝固百分比的增加量比在25℃時高。

關(guān)于我們 - 聯(lián)系我們 -版權(quán)申明 -誠聘英才 - 網(wǎng)站地圖 - 醫(yī)學(xué)論壇 - 醫(yī)學(xué)博客 - 網(wǎng)絡(luò)課程 - 幫助
醫(yī)學(xué)全在線 版權(quán)所有© CopyRight 2006-2026, MED126.COM, All Rights Reserved
浙ICP備12017320號
百度大聯(lián)盟認(rèn)證綠色會員可信網(wǎng)站 中網(wǎng)驗(yàn)證