基礎統計- PDF 免费下载

文章推薦指數: 80 %
投票人數:10人

統計學( 二) 第十一章簡單廻歸分析與相關分析(Simple Regression Analysis and Correlation Analysis) 授課教師: 唐麗英教授國立交通大學工業工程與管理學系聯絡 ... 基礎統計 SHARE HTML DOWNLOAD Size:px Startdisplayatpage: Download"基礎統計" Error: DownloadDocument 谓区范 3yearsago Views: 1統計學(二)第十一章簡單廻歸分析與相關分析(SimpleRegressionAnalysisandCorrelationAnalysis)授課教師:唐麗英教授國立交通大學工業工程與管理學系聯絡電話:(03)本講義未經同意請勿自行翻印2本課程內容參考書目教科書P.Newbold,W.L.CarlsonandB.Thorne(2013).StatisticsforBusinessandtheEconomics,8ttEdition,Pearson.參考書目Berenson,M.L.,Levine,D.M.,andKrehbiel,T.C.(2009).Basicbusinessstatistics:Conceptsandapplications,11ttEditionPrenticeHall.Larson,H.J.(1982).Introductiontoprobabilitytheoryandstatisticalinference,3rrEdition,NewYork:Wiley.Miller,I.,Freund,J.E.,andJohnson,R.A.(2000).MillerandFreund'sProbabilityandstatisticsforengineers,6ttEdition,PrenticeHall.Montgomery,D.C.,andRunger,G.C.(2011).Appliedstatisticsandprobabilityforengineers,5ttEdition,Wiley.Watson,C.J.(1997).Statisticsformanagementandeconomics,5thEdition.PrenticeHall.唐麗英王春和(2013),從範例學MINITAB統計分析與應用,博碩文化公司唐麗英王春和(2008),SPSS統計分析,儒林圖書公司王春和唐麗英(2007),Excel統計分析,第二版,儒林圖書公司唐麗英王春和(2005),STATISTICA與基礎統計分析,儒林圖書公司統計學(一)唐麗英老師上課講義23LinearRegressionModel統計學(一)唐麗英老師上課講義34ChapterSimpleRegressionAnalysis迴歸分析統計學(一)唐麗英老師上課講義45RegressionAnalysis迴歸分析之意義迴歸分析之主要目的是探究一個或數個自變數(independentvariable)和一個因變數(dependentvariable)間的關係,進而建構一個適當的數學方程式,並利用此方程式來解釋或預測因變數之值在迴歸分析中自變數(又稱解釋變數)以X表之,因變數(又稱反應變數)以Y表之;自變數X與因變數Y之間的函數關係或數學方程式,稱為迴歸模式統計學(一)唐麗英老師上課講義56RegressionAnalysis迴歸分析的例子1.某股票分析師想要建立台灣某上市公司之股價(Y)與該公司各項財務指標(X)之迴歸模式,以準確地預測該公司之股價2.某工程師想要建立某種化學合成之反應物含量(Y)與其合成時間(X)之迴歸模式,以預測該反應物之含量3.交通大學附近某房屋仲介想要藉由學生套房坪數的大小(X)與套房的月租(Y)之迴歸模式來預測學生套房之月租統計學(一)唐麗英老師上課講義67RegressionAnalysis簡單迴歸與複迴歸影響因變數之自變數通常不只一個,例如:房價(Y)可能與房子大小(x)房齡(x)離市區距離(x)有無空調(x)等因素都有關,但這些因素是否均會影響4因變數呢?可以利用迴歸分析來找出影響房價最重要的因素,以作為預測房價的重要根據統計學(一)唐麗英老師上課講義78RegressionAnalysis例1:a)如何由房子大小來預測房價?b)如何由房子大小房齡等來預測房價?統計學(一)唐麗英老師上課講義89RegressionAnalysis例1:(續)在迴歸分析中若只考慮一個自變數,則稱為簡單迴歸(SimpleRegression),否則,稱為複迴歸或多元迴歸(MultipleRegression)統計學(一)唐麗英老師上課講義910RegressionAnalysis例2:在例1中a)由房子大小來預測房價屬簡單迴歸b)由房子大小房齡等來預測房價屬複迴歸統計學(一)唐麗英老師上課講義1011RegressionAnalysis在進行迴歸分析之前,需先要瞭解變數間呈何種關係,才能適配一個適當之數學方程式或迴歸模式如何決定兩變數間的關係-利用散佈圖何謂散佈圖(scatterdiagram)?-將X變數標示於一維座標圖的橫座標,Y變數標示於縱座標,並將各(X,Y)各對應值點繪在X-Y二維座標上,以觀察點之變化,此圖形即稱為散佈圖統計學(一)唐麗英老師上課講義1112RegressionAnalysis兩變數間之關係1)正相關(positiverelationship)假如X增加,則Y增加;或X減少,而Y減少,稱為X與Y有正相關2)負相關(negatiuerelationship)假如Y增加,則X減少;或X減少,而Y增加,稱為X與Y有負相關3)不相關(norelationship)在散佈圖中之點大部份與水平軸平行,看不出任何特殊圖形統計學(一)唐麗英老師上課講義1213RegressionAnalysis例3:a)b)c)d)負向線性正向線性e)f)曲線曲線無明顯二次函數統計學(一)唐麗英老師上課講義1314RegressionAnalysis收集迴歸分析的資料時須注意什麼?1)迴歸分析的資料必須能代表所研究的系統或問題2)在作迴歸分析之前須先確定資料不含離群值迴歸模式有什麼用處?1)描述資料2)估計參數3)預測與估計因變數之值4)控制因變數之值統計學(一)唐麗英老師上課講義1415簡單迴歸分析如何決定簡單直線迴歸模式?由散佈圖大致可看出自變數與因變數間的關係自變數與因變數間最簡單的關係即為直線關係真實之簡單直線迴歸模式如下Yi=β0+β1Xi+εi其中Yi表第i個觀測值;Xi表對應於第i個觀測值之自變數之值;β0為截距;β1為斜率,表自變數每增加一單位時,因變數Y的改變量;εi表隨機誤差統計學(一)唐麗英老師上課講義1516簡單迴歸分析如何決定與觀測值最適配之直線迴歸模式?--利用最小平方法(LeastSquaresMethod)何謂最小平方法?樣本直線迴歸式:Yi=b0+b1Xi其中Yi為在特定之Xi值下之Y估計值的平均b0與b1分別為β0與β1之不偏估計值利用最小平方法可找出b0與b1之公式,此公式可使Σ(YiYi)2為最小統計學(一)唐麗英老師上課講義1617簡單迴歸分析利用最小平方法可找出b0與b1之公式,此公式可使(YiYi)2為最小bSSXX1=SSX其中SSXY=XiYYiY=XX(X)(Y)nSSX=(XiX)2=X2(X)2nb0=Yb1X;何謂殘差(Residual)ei?ei=YiYi(ei=0)統計學(一)唐麗英老師上課講義1718如何定義迴歸分析中的幾個變異量?在迴歸模式中,為了要知道自變數預測因變數的能力,必須要知道下列三個變異數的衡量值:1)總變異量=SST=Σ(YiY)2=ΣYi2-(ΣYi)2/n=ssy(Totalvariation)2)迴歸可解釋的變異量=SSR=Σ(YiY)2=bssxy=(SSxy)2/SSx(ExplainedVariation)3)其他因素解釋的變異量=SSE=Σ(Yi-Yi)2=SST-SSR(UnexplainedVariation)統計學(一)唐麗英老師上課講義1819迴歸模式好壞之判斷Σ(𝑌𝑖-𝑌)2=Σ(𝑌𝑖-𝑌)2+Σ(𝑌𝑖-𝑌)2即總變異量=迴歸可解釋的變異量+其他因素解釋的變異量SST=SSR+SSE統計學一唐麗英老師上課講義1920如何判斷X對預測Y提供了有用的資訊(或迴歸方程式是否顯著)?(1)由圖形判定(限簡單迴歸模式)資料點與迴歸方程式越接近表迴歸模式越有用(2)判定係數r2(CoefficientofDetermination):判定係數是用來衡量自變數(X)所能解釋因變數(Y)之變異量占Y總變異量的百分比r2迴歸式可解釋的變異量=總變異量r2值越近1越好=SSSSSS(0r21)統計學(一)唐麗英老師上課講義2021相關係數r(CorrelationCoefficient)是用來衡量兩個隨機變數X與Y間直線關係的方向與強弱r可由±r2求得,+或-符號則與斜率b1同1)-1r12)r=0並不一定表示Y與X間沒有關係,僅表示Y與X間無線性關係統計學(一)唐麗英老師上課講義2122(3)統計檢定---ttest及Ftest如何用統計方法來檢定X是否對預測Y提供了有用的資訊(或X與Y之間是否存在顯著的線性關係)?假設X與Y之間完全無關(亦即在預測Y值上,X幾乎未提供任何有用的資訊),則在線性模式:Y=β0+β1X中,β1值應為何?β1=0!因此,我們必須檢定β1假如H0:β1=0被拒絕,則可以下結論認為有足夠的證據顯示X與Y之間有顯著之線性關係或X在對預測Y上提供了有用的資訊統計學(一)唐麗英老師上課講義2223對迴歸係數作估計與檢定時,須有何統計假設?在線性模式Y=β+βX+ε中,為了檢定H:β=0,i01ii01首先須假設誤差項ε彼此獨立且服從平均數為0和變異i數為σ2的常態分配(亦即ε~N(0,σ2))i統計學(一)唐麗英老師上課講義2324H:β=0的兩種檢定ANOVAFtest:可利用ANOVA的F檢定來檢定X與Y之間是否有顯著之線性關係變異來源平方和自由度均方F簡單迴歸之ANOVA表:迴歸SSR1誤差SSEn-2總和SSTn-1SSR/1=MSRSSE/(n-2)=MSE=σ2MSR/MSE統計學(一)唐麗英老師上課講義2425ANOVA之檢定程序:假設:εi~NID(0,σ2)1)H0:β1=0(X與Y之間沒有線性關係;或對預測Y而言,迴歸模式無法提供有用之資訊)H1:β10(X與Y之間有線性關係,即斜率不為0;或在預測Y上,迴歸模式有用)2)設定α值3)檢定值:F=MMMMMM4)棄卻域:查F-表,自由度=(1,n-2)或計算p-值5)下結論統計學(一)唐麗英老師上課講義25262.ttest:*檢定程序:假設:εi~NID(0,σ2)1)H0:β1=β1,H1:β1β12)設定α值3)檢定值:t=b1β1MMMSSx4)棄卻域:查t-表,自由度=n-2或計算p-值5)下結論統計學(一)唐麗英老師上課講義2627簡單迴歸中,ANOVA之F檢定與t檢定有何關係?對檢定相同的假設H0:β1=0,ANOVA之F檢定與t檢定間的關係為:F(1,r)=t2(r)統計學(一)唐麗英老師上課講義2728例4:假設某產品之某種成份的含有率會隨溫度的變動而改變,工程師現做了12次實驗得資料如下表示:溫度(F)(X)含有率(%)(Y)(本例改編自白賜清編著之品質管制之統計方法)統計學(一)唐麗英老師上課講義2829例4:(續)試回答下列問題:a)本例中之自變數與因變數各為何?b)請畫出x-y散佈圖並判斷自變數與因變數之關係?c)請找出迴歸方程式d)判斷迴歸方程式是否適配原始資料?e)解釋迴歸係數b在本例中之意義為何?1f)假設溫度為187,則估計之平均含有率為何?統計學(一)唐麗英老師上課講義2930例4:(續)解a)本例中之自變數為_溫度與因變數為含有率b)請畫出x-y散佈圖並判斷自變數與因變數之關係為何?含有率Y含有率溫度X自變數與因變數間之關係為負向線性關係.統計學(一)唐麗英老師上課講義3031例4:(續)解c)找出迴歸方程式計算表令x=(x-189)令y=(y-89)xyxyxyx2y總計x=11y=-8xy=-121x2=251y2=62統計學(一)唐麗英老師上課講義3132例4:(續)解n=12,x=11,y=-8,xy=-121,x2=251,y2=62Y=b0+b1Xb1=SSXXSSX==Y==X==SSXX=SSxy=xyxySSX=SSx=x2x2SSY=SSy=y2y2nnn11(8)=121====62(8)212=b0=Yb1X==Y=b0+b1X=X統計學(一)唐麗英老師上課講義3233例4:(續)解d)判斷迴歸方程式是否適配原始資料?共分成以下四個部分說明:1)將迴歸模式繪於原始資料之散佈圖中,並判斷此迴歸模式是否適配樣本點統計學(一)唐麗英老師上課講義3334例4:(續)2)計算判定係數r2解r2迴歸式可解釋的變異量=總變異量=SSSSSS==94.63%SST=SSy=Σ(Yi-Y)2=ΣYi2-(ΣYi)2/n=SSR=Σ(Yi-Y)2=(SSxy)2/SSx==r:溫度(X)的變異會引起94.64%含有率的變異即溫度確實是影響含有率的一個重要因素統計學(一)唐麗英老師上課講義3435例4:(續)3)計算相關係數rr=r2(符號同斜率之符號)=:溫度與含有率間有非常強的負向線性關係即簡單線性模式是一個很好的預測模式統計學(一)唐麗英老師上課講義3536例4:(續)4)利用ANOVAFtest來檢定溫度(x)與含有率(y)間是否有顯著的直線關係?自由度SSMSF迴歸殘差總和統計學(一)唐麗英老師上課講義3637例4:(續)4)利用ANOVAFtest來檢定溫度(x)與含有率(y)間是否有顯著的直線關係假設:εi~NID(0,σ2)1)H0:β1=0(x與y之間沒有線性關係)H1:β10(x與y之間有線性關係亦即斜率不為0)2)α=0.053)檢定值:F==)棄卻域:臨界值F(1,10)=)結論:溫度與含有率間有顯著的直線關係統計學(一)唐麗英老師上課講義3738例4:(續)5)利用ttest來檢定溫度(x)是否為含有率(y)的一個有用的預測變數?解假設:εi~NID(0,σ2)1)H0:β1=0H1:β102)設定α值3)檢定值:t==)棄卻域:臨界值t=+或)結論:溫度(x)是含有率(y)的一個有用的預測變數統計學(一)唐麗英老師上課講義3839例4:(續)e)迴歸係數b在本例中之意義為何?解b1=:當溫度每增加1F時,平均含有率會下降%f)設溫度為187,則估計之平均含有率為何?解Y=(187)=99.54%統計學(一)唐麗英老師上課講義3940作迴歸分析時應注意事項:1)利用迴歸模式估計y時,所給定之x值必須在樣本之x值範圍內,y之估計值才會準確上例中,當所給定之X值介於182與197間,Y之估計值才會準確2)迴歸式並不表示自變數與因變數間一定有因果關係其因果關係可能須經由第三變數或其他理論依據而成立統計學(一)唐麗英老師上課講義4041例題4之Excel報表:迴歸統計R的倍數R平方調整的R平方標準誤觀察值個數12統計學(一)唐麗英老師上課講義4142ANOVA表自由度SSMSF顯著值迴歸殘差總和係數標準誤t統計P-值截距溫度統計學(一)唐麗英老師上課講義4243殘差輸出觀測值含有率殘差統計學(一)唐麗英老師上課講義4344統計學(一)唐麗英老師上課講義4445統計學(一)唐麗英老師上課講義45例5:某校工管研究所開設高等統計學,現隨機蒐查其中12位同學的期中考成績與期末考成績,如下表示試適配期末考成績之簡單迴歸模式期中考成績(X)期末考成績(Y)46例5:(續)期末考成績之簡單迴歸模式Y=X統計學(一)唐麗英老師上課講義4647tαα484950本單元結束統計學(一)唐麗英老師上課講義50 Similardocuments Tomakethiswebsitework,weloguserdataandshareitwithprocessors.Tousethiswebsite,youmustagreetoourPrivacyPolicy,includingcookiepolicy. Iagree.    



請為這篇文章評分?