A T-teszt egy módszer annak eldöntésére, hogy vannak-e statisztikailag szignifikáns különbségek az adatkészletek között, a Student-féle t-eloszlás segítségével. Az Excel T-tesztje egy kétmintás T-teszt, amely két minta átlagait hasonlítja össze. Ez a cikk elmagyarázza, mit jelent a statisztikai szignifikancia, és bemutatja, hogyan kell elvégezni a T-tesztet Excelben.
A cikkben található utasítások az Excel 2019, 2016, 2013, 2010, 2007; Excel Microsoft 365-höz és Excel Online-hoz.
Mi a statisztikai szignifikancia?
Képzeld el, hogy tudni szeretnéd, hogy a két kocka közül melyik ad jobb pontszámot. Dobsz az első kockával, és kapsz egy 2-t; dobsz a második kockával, és kapsz egy 6-ost. Ez azt jelenti, hogy a második kocka általában magasabb pontszámot ad? Ha azt válaszolta, hogy „Természetesen nem”, akkor már ismeri a statisztikai szignifikanciát. Tudod, hogy a különbséget a pontszám véletlenszerű változása okozta, minden alkalommal, amikor egy kockával dobnak. Mivel a minta nagyon kicsi volt (csak egy tekercs), nem mutatott semmi jelentőset.
Most képzeld el, hogy minden kockával hatszor dobsz:
- Az első kocka 3, 6, 6, 4, 3, 3-at dob; Átlag=4,17
- A második kocka 5, 6, 2, 5, 2, 4-et dob; Átlag=4,00
Ez most azt bizonyítja, hogy az első kocka magasabb pontszámot ad, mint a második? Valószínűleg nem. Egy kis minta, ahol az átlagok között viszonylag kis különbség van, valószínűsíti, hogy a különbség továbbra is véletlenszerű eltérésekből adódik. A kockadobások számának növekedésével egyre nehezebb józan ésszel válaszolni arra a kérdésre, hogy a pontszámok közötti különbség véletlenszerű variáció eredménye, vagy az egyik nagyobb valószínűséggel ad magasabb pontszámot, mint a másik?
A szignifikancia annak a valószínűsége, hogy a minták között megfigyelt különbség véletlenszerű eltérésekből adódik. A szignifikanciát gyakran alfa-szintnek vagy egyszerűen α-nak nevezik. A konfidenciaszint vagy egyszerűen 'c' annak a valószínűsége, hogy a minták közötti különbség nem véletlenszerű variációból adódik; más szóval, hogy különbség van a mögöttes populációk között. Ezért: c=1 – α
Az 'α' értéket tetszőleges szintre állíthatjuk, hogy biztosak lehessünk abban, hogy fontosak vagyunk. Nagyon gyakran használjuk az α=5%-ot (95%-os megbízhatóság), de ha igazán biztosak akarunk lenni abban, hogy az eltéréseket nem véletlenszerű variáció okozza, akkor magasabb megbízhatósági szintet alkalmazhatunk, α=1% vagy akár α=0,1 értékkel. %.
Különféle statisztikai teszteket használnak a szignifikancia kiszámítására különböző helyzetekben. A T-próbák segítségével megállapítható, hogy két populáció átlaga különbözik-e, az F-próbákat pedig annak meghatározására, hogy a szórások különböznek-e.
Miért teszteljük a statisztikai szignifikanciát?
A különböző dolgok összehasonlításakor szignifikanciatesztet kell használnunk annak meghatározására, hogy az egyik jobb-e a másiknál. Ez sok mezőre vonatkozik, például:
- Az üzleti életben az embereknek össze kell hasonlítaniuk a különböző termékeket és marketing módszereket.
- A sportban az embereknek össze kell hasonlítaniuk a különböző felszereléseket, technikákat és versenyzőket.
- A műszaki területen az embereknek össze kell hasonlítaniuk a különböző terveket és paraméterbeállításokat.
Ha azt szeretné tesztelni, hogy valami jobban teljesít-e, mint valami más, bármely területen, tesztelnie kell a statisztikai szignifikanciát.
Mi az a hallgatói T-eloszlás?
A Student t-eloszlása hasonló a normál (vagy Gauss-) eloszláshoz. Mindkettő harang alakú eloszlás, a legtöbb eredmény közel van az átlaghoz, de néhány ritka esemény mindkét irányban meglehetősen távol esik az átlagtól, ezeket az eloszlás farkának nevezik.
A Student t-eloszlásának pontos alakja a minta méretétől függ. 30-nál nagyobb minták esetén nagyon hasonló a normál eloszláshoz. A minta méretének csökkenésével a farok nagyobb lesz, ami a kis mintán alapuló következtetések megnövekedett bizonytalanságát jelzi.
Hogyan végezzünk T-tesztet Excelben
Mielőtt T-tesztet alkalmazhat annak megállapítására, hogy van-e statisztikailag szignifikáns különbség a két minta átlaga között, először el kell végeznie egy F-tesztet. Ennek az az oka, hogy a T-teszthez különböző számításokat hajtanak végre attól függően, hogy van-e szignifikáns eltérés az eltérések között.
Az elemzés végrehajtásához engedélyezni kell az Analysis Toolpak bővítményt.
Az elemző eszközcsomag-bővítmény ellenőrzése és betöltése
Az Elemző eszközcsomag ellenőrzéséhez és aktiválásához kövesse az alábbi lépéseket:
- Válassza ki a FILE lapot. >Select Options.
-
A Beállítások párbeszédpanelen válassza ki a Add-Ins lehetőséget a bal oldali fülek közül.
-
Az ablak alján válassza ki a Kezelés legördülő menüt, majd válassza az Excel-bővítmények lehetőséget. Válassza a Go.
- Győződjön meg arról, hogy az Analysis Toolpak melletti jelölőnégyzet be van jelölve, majd válassza az OK.
- Az elemző eszközcsomag aktív, és készen áll az F- és T-tesztek alkalmazására.
F-teszt és T-teszt végrehajtása Excelben
-
Írjon be két adatkészletet egy táblázatba. Ebben az esetben egy hét alatt két termék értékesítését vesszük figyelembe. Az egyes termékek átlagos napi értékesítési értékét is kiszámítja a szórással együtt.
-
Válassza ki a Data lapot > Data Analysis
-
Válassza ki a F-Test Two-Sample for Variances elemet a listából, majd válassza az OK. lehetőséget.
Az F-teszt nagyon érzékeny a nem normális jelenségekre. Ezért lehet, hogy biztonságosabb a Welch-teszt használata, de ez az Excelben nehezebb.
-
Válassza ki az 1. változó tartományát és a 2. változó tartományát; állítsa be az Alfát (0,05 95%-os biztonságot ad); válasszon ki egy cellát a kimenet bal felső sarkába, figyelembe véve, hogy ez 3 oszlopot és 10 sort tölt ki. Válassza a OK. lehetőséget.
Az 1. változó tartományához a legnagyobb szórással (vagy szórással) rendelkező mintát kell kiválasztani.
-
Nézze meg az F-teszt eredményeit, hogy megállapítsa, van-e szignifikáns különbség az eltérések között. Az eredmények három fontos értéket adnak:
- F: Az eltérések aránya.
- P(F<=f) one-tail: Annak a valószínűsége, hogy az 1. változónak valójában nincs nagyobb szórása, mint a 2. változóé. általában 0,05, akkor nincs szignifikáns különbség az eltérések között.
- F Kritikus egyfarkú: F értéke, amely ahhoz szükséges, hogy P(F<=f)=α legyen. Ha ez az érték nagyobb, mint F, ez azt is jelzi, hogy nincs jelentős különbség az eltérések között.
A P(F<=f) kiszámítható az FDIST függvénnyel is, amelynek bemenetei az F és az egyes minták szabadsági fokai. A szabadságfok egyszerűen a mintában lévő megfigyelések száma mínusz egy.
-
Most, hogy tudja, hogy van-e különbség az eltérések között, kiválaszthatja a megfelelő T-tesztet. Válassza a Data lapot > Data Analysis, majd válassza a t-Test: Two-Sample Assuming Equal Variancesvagy t-teszt: kétmintás egyenlőtlen eltéréseket feltételezve
-
Függetlenül attól, hogy melyik opciót választotta az előző lépésben, ugyanaz a párbeszédpanel jelenik meg, ahol megadhatja az elemzés részleteit. Kezdésként válassza ki a Variable 1 Range és Variable 2 Range. mintákat tartalmazó tartományokat
- Feltéve, hogy tesztelni szeretné, hogy nincs-e különbség az átlagok között, állítsa a Hypothesized Mean Difference értéket nullára.
- Állítsa be az Alpha szignifikanciaszintet (0,05 95%-os biztonságot ad), és válasszon ki egy cellát a kimenet bal felső sarkába, figyelembe véve, hogy ez 3 oszlopot és 14 sort tölt ki. Válassza a OK. lehetőséget.
-
Tekintse át az eredményeket, hogy eldöntse, van-e jelentős különbség az átlagok között.
Akárcsak az F-tesztnél, ha a p-érték, ebben az esetben P(T<=t), nagyobb, mint az alfa, akkor nincs jelentős különbség. Ebben az esetben azonban két p-érték van megadva, az egyik az egyfarkú teszthez, a másik a kétfarkú teszthez. Ebben az esetben használja a kétvégű értéket, mivel bármelyik nagyobb átlaggal rendelkező változó szignifikáns különbség lenne.