資料分析系列 932 | Excel進行迴歸分析,預測真實值

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

前面學習了Excel中的相關分析,在資料分析中,相關分析和迴歸分析關係緊密,今天來學習下Excel中的迴歸分析。

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

PART

01

迴歸分析

迴歸分析(regressionanalysis)是確定兩種或兩種以上變數間相互依賴的定量關係的一種統計分析方法。

我們在得到兩組資料之間的相關程度之後,就可以使用迴歸分析進行預測了,換言之,相關分析是迴歸分析的基礎和前提,迴歸分析是相關分析的深入和繼續。但只有當資料之間存在高度相關時,進行迴歸分析尋求相關的具體形式才有意義。

迴歸分析分類

在我們的日常資料分析過程中,迴歸分析是應用十分廣泛的一種資料分析方法,該方法主要用於分析單個因變數是如何受到一個或多個自變數影響的。如分析某個產品的銷售情況與產品質量、價格、促銷活動、天氣等因素之間的關係。根據已知的一組資料,我們就可以知道這幾個因素對銷售額的影響,然後對同類產品的銷售額進行預測。

迴歸分析的分類如下圖1所示:

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

PART

02

多元線性迴歸分析

1、例項描述

某品牌汽車經銷商的經理瞭解到投放廣告對於汽車銷售額增長具有很大的作用,但是他並不明確在電視臺投放廣告與在各個影片網站投放廣告哪種方式對增加汽車銷售額更有效。在2017年1月,若在電視臺和影片網站分別投入的廣告費為20萬和30萬,那麼應估算汽車的銷售額為多少萬元?針對這種情況,經理收集本公司去年各月的汽車銷售額資料及每月在以上兩種媒介上投入的廣告費用資料,如下圖2所示。

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

2、例項分析

簡單根據上面的資料,我們並不能確定這兩種廣告投放渠道哪種更有效,所以,這裡我們使用Excel中的迴歸分析方法,先檢驗這兩組資料與銷售額的相關性程度,隨後再根據迴歸分析過程中所得到的線性迴歸方程預測確定廣告費時的銷售額。

3、操作分析

使用Excel進行多元線性迴歸分析的因變數是銷售額,自變數是兩種渠道的廣告費,具體步驟如下:

第1步:選擇迴歸分析工具並設定引數。

開啟“資料分析”對話方塊,選擇“迴歸”分析工具,單擊“確定”,如圖3所示,彈出“迴歸”對話方塊,設定“Y值輸入區域”為“$D$2:$D$14”,“X值輸入區域”為“$B$2:$C$14”;勾選“標誌”“置信度”複選框,並設定置信度為“95%”;單擊“輸出區域”,並設定該區域為“$F$1”;單擊確定即可。如圖4所示。

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

第2步:顯示迴歸分析結果。

此時返回工作表,就能得到詳細的各項引數值。如圖5所示。

資料分析系列 9/32 | Excel進行迴歸分析,預測真實值

操作解析:

迴歸分析的計算結果一共包括三個模組:

(1)第一個模組為迴歸統計表,其中主要包含MultipleR、RSquare、AdjustedRSquare、標準誤差和觀測值。MultipleR為複相關係數,也就是前面說的相關係數,用來衡量x和y之間的相關程度大小,RSquare為複測定係數R2,其用來說明自變數解釋因變數變差的程度,從而測量同因變數y的擬合效果,AdjustedRSquare為調整後的複測定係數R2,標準誤差衡量擬合程度大小,值越小,說明擬合程度越好,觀測值指的是用於估計迴歸方程資料的觀測值個數。

(2)第二個模組為方差分析表。其主要作用是透過假設檢驗中的F-檢驗來判斷迴歸模型的迴歸效果。

(3)第三個模組是迴歸引數表。第一列表示截距,第二列表示對應模型的迴歸係數,包括了截距和斜率,可以根據這個建立迴歸模型。第三列為迴歸係數的標準誤差,值越小,表明引數的精確度越高,第四列對應的是統計量t值,用於檢驗模型引數。第五列為各個迴歸係數的P值,當P<0。05時,可以認為模型在α=0。05的水平上顯著,或置信度達到了95%。最後幾列為迴歸係數置信區間的上限和下限。

4、決策分析

上面的結果中可以看到,R值為0。9813,表示廣告支出費與銷售額之間的關係為高度正相關,複測定係數為0。9630,表明用自變數可解釋因變數變差的96。3%,AdjustedRSquare為0。9538,說明自變數能說明因變數的95。38%,因變數剩餘的4。62%則由其他因素來解釋。

迴歸引數表中,迴歸方程的截距和兩個斜率分別為-359。48,9。35,52。46。又因為P值小於0。05,說明了這兩個自變數對汽車銷售額均有顯著影響,但是,兩個斜率中,影片網站對應的迴歸係數更大,說明在影片網站上投放廣告更有效。

由此可得該回歸分析的線性迴歸方程為:

y=-359.48+9.35x1+52.46x2。

預測一下,當電視廣告費和影片廣告費分別為20萬和30萬時,汽車銷售額的預測值為:y=-359。48+9。35*20+52。46*30=1401。32(萬)。

歡迎

關注公眾號

,訪問更多精彩:

資料之魅

如需轉載,請聯絡授權,謝謝合作。