A regresszió az Excelben egy módja annak, hogy automatizálja a több információhalmaz összehasonlításának statisztikai folyamatát, hogy megtudja, hogyan befolyásolják a független változók változásai a függő változók változásait. Ha valaha is szeretett volna összefüggést találni két dolog között, ennek egyik legjobb módja az Excel regressziós elemzése.
A cikkben található utasítások az Excel 2019, Excel 2016, Excel 2013 és Excel 2010 programokra vonatkoznak.
Mit jelent a regresszió?
A regresszió egy statisztikai modellezési megközelítés, amelyet az elemzők több változó közötti kapcsolatok meghatározására használnak.
A regressziós elemzés egyetlen változóval kezdődik, amelyet elemezni próbál, és független változókkal, amelyeket tesztel, hogy megnézze, befolyásolják-e az adott változót. Az elemzés megvizsgálja a független változókban bekövetkezett változásokat, és megpróbálja ezeket a változásokat összefüggésbe hozni az egyetlen (függő) változóban bekövetkezett változásokkal.
Ez fejlett statisztikának tűnhet, de az Excel bárki számára elérhetővé teszi ezt az összetett elemzést.
Lineáris regresszió végrehajtása Excelben
A regresszióanalízis legegyszerűbb formája a lineáris regresszió. Az egyszerű lineáris regresszió csak két változó közötti kapcsolatot vizsgálja.
Például a következő táblázat az egy személy által naponta elfogyasztott kalóriák számát és az adott napon elfogyasztott kalóriák adatait tartalmazza.
Mivel ez a táblázat két adatoszlopot tartalmaz, és az egyik változó hatással lehet a másikra, lefuttathat regressziós elemzést ezeken az adatokon az Excel segítségével.
Analysis ToolPak bővítmény engedélyezése
Mielőtt használhatná az Excel regressziós elemzési funkcióját, engedélyeznie kell az Analysis ToolPak bővítményt az Excel Beállítások képernyőjén.
-
Az Excelben válassza ki a Fájl menüt, és válassza a Options.
-
Válassza ki a Bővítmények lehetőséget a bal oldali navigációs menüben. Ezután győződjön meg arról, hogy az Excel Add-ins van kiválasztva a Manage mezőben.
-
Végül válassza ki a Go gombot.
-
A Bővítmények előugró ablakban. Engedélyezze az Analysis ToolPack elemet az előtte lévő négyzetre kattintva egy pipa hozzáadásához, és válassza az OK. lehetőséget.
Most, hogy az Analysis ToolPak engedélyezve van, készen áll a regressziós elemzés elvégzésére az Excelben.
Az egyszerű lineáris regresszió végrehajtása az Excelben
A súly- és kalóriatáblázatot példaként használva lineáris regressziós elemzést végezhet Excelben a következőképpen.
-
Válassza ki a Data menüt. Ezután az Analysis csoportban válassza a Adatelemzés. lehetőséget.
-
A Data Analysis ablakban válassza ki a Regression elemet a listából, majd kattintson az OK gombra.
-
A Input Y Range a függő változót tartalmazó cellatartomány. Ebben a példában ez a súly. A Input X Range a független változót tartalmazó cellák tartománya. Ebben a példában ez a kalória oszlop.
-
Válassza ki a Labels elemet a fejléccellákhoz, majd válassza az New Worksheet lehetőséget az eredmények új munkalapra küldéséhez. Válassza az OK lehetőséget, ha az Excel futtatja az elemzést, és elküldi az eredményeket egy új munkalapra.
-
Vizsgálja meg az új munkalapot. Az elemzési kimenetnek számos értéke van, amelyeket meg kell értenie az eredmények értelmezéséhez.
E számok mindegyike a következő jelentéssel bír:
- Többszörös R: A korrelációs együttható. Az 1 erős korrelációt jelez a két változó között, míg a -1 azt jelenti, hogy erős negatív kapcsolat van. A 0 azt jelenti, hogy nincs összefüggés.
- R Négyzet: Determinációs együttható, amely megmutatja, hogy a két változó között hány pont esik a regressziós egyenesre. Statisztikailag ez az átlagtól való négyzetes eltérések összege.
- Korrigált R négyzet: R négyzetnek nevezett statisztikai érték, amely az Ön által választott független változók számához igazodik.
- Standard Error: Milyen pontosak a regressziós elemzés eredményei. Ha ez a hiba kicsi, akkor a regressziós eredmények pontosabbak.
- Megfigyelések: A megfigyelések száma a regressziós modellben.
A regressziós kimenet fennmaradó értékei a regressziós elemzés kisebb komponenseiről nyújtanak részleteket.
- df: A varianciaforrásokhoz kapcsolódó szabadságfokokként ismert statisztikai érték.
- SS: Négyzetek összege. A maradék négyzetösszeg és a teljes SS arányának kisebbnek kell lennie, ha az adatok többsége illeszkedik a regressziós egyenesre.
- MS: A regressziós adatok átlagos négyzete.
- F: Az F-statisztika (F-teszt) a nullhipotézishez. Ez adja meg a regressziós modell jelentőségét.
- Szignifikancia F: Az F P-értékeként ismert statisztikai érték.
Hacsak nem érti a statisztikát és a regressziós modellek kiszámítását, az összegzés alján lévő értékeknek nem lesz sok jelentősége. Azonban a többszörös R és R négyzet a két legfontosabb.
Amint láthatja, ebben a példában a kalóriák erős korrelációt mutatnak a teljes tömeggel.
Többszörös lineáris regressziós elemzés az Excelben
Ugyanannak a lineáris regressziónak a végrehajtásához, de több független változóval, válassza ki a teljes tartományt (több oszlop és sor) a Input X Range.
Több független változó kiválasztásakor kevésbé valószínű, hogy olyan erős korrelációt talál, mert nagyon sok változó van.
Azonban az Excel regressziós elemzése segíthet olyan összefüggések megtalálásában egy vagy több olyan változóval, amelyek létezéséről nem is sejti, hogy pusztán az adatok kézi áttekintésével.