Hogyan végezzünk T-tesztet Excelben

👤 Szerző Abigail Brown 📧 brown@technologyhumans.com.
⏱ Public 2024-01-07 19:03.
🖍 Utoljára módosítva 2025-06-01 07:16.

A T-teszt egy módszer annak eldöntésére, hogy vannak-e statisztikailag szignifikáns különbségek az adatkészletek között, a Student-féle t-eloszlás segítségével. Az Excel T-tesztje egy kétmintás T-teszt, amely két minta átlagait hasonlítja össze. Ez a cikk elmagyarázza, mit jelent a statisztikai szignifikancia, és bemutatja, hogyan kell elvégezni a T-tesztet Excelben.

A cikkben található utasítások az Excel 2019, 2016, 2013, 2010, 2007; Excel Microsoft 365-höz és Excel Online-hoz.

Mi a statisztikai szignifikancia?

Képzeld el, hogy tudni szeretnéd, hogy a két kocka közül melyik ad jobb pontszámot. Dobsz az első kockával, és kapsz egy 2-t; dobsz a második kockával, és kapsz egy 6-ost. Ez azt jelenti, hogy a második kocka általában magasabb pontszámot ad? Ha azt válaszolta, hogy „Természetesen nem”, akkor már ismeri a statisztikai szignifikanciát. Tudod, hogy a különbséget a pontszám véletlenszerű változása okozta, minden alkalommal, amikor egy kockával dobnak. Mivel a minta nagyon kicsi volt (csak egy tekercs), nem mutatott semmi jelentőset.

Most képzeld el, hogy minden kockával hatszor dobsz:

Az első kocka 3, 6, 6, 4, 3, 3-at dob; Átlag=4,17
A második kocka 5, 6, 2, 5, 2, 4-et dob; Átlag=4,00

Ez most azt bizonyítja, hogy az első kocka magasabb pontszámot ad, mint a második? Valószínűleg nem. Egy kis minta, ahol az átlagok között viszonylag kis különbség van, valószínűsíti, hogy a különbség továbbra is véletlenszerű eltérésekből adódik. A kockadobások számának növekedésével egyre nehezebb józan ésszel válaszolni arra a kérdésre, hogy a pontszámok közötti különbség véletlenszerű variáció eredménye, vagy az egyik nagyobb valószínűséggel ad magasabb pontszámot, mint a másik?

A szignifikancia annak a valószínűsége, hogy a minták között megfigyelt különbség véletlenszerű eltérésekből adódik. A szignifikanciát gyakran alfa-szintnek vagy egyszerűen α-nak nevezik. A konfidenciaszint vagy egyszerűen 'c' annak a valószínűsége, hogy a minták közötti különbség nem véletlenszerű variációból adódik; más szóval, hogy különbség van a mögöttes populációk között. Ezért: c=1 - α

Az 'α' értéket tetszőleges szintre állíthatjuk, hogy biztosak lehessünk abban, hogy fontosak vagyunk. Nagyon gyakran használjuk az α=5%-ot (95%-os megbízhatóság), de ha igazán biztosak akarunk lenni abban, hogy az eltéréseket nem véletlenszerű variáció okozza, akkor magasabb megbízhatósági szintet alkalmazhatunk, α=1% vagy akár α=0,1 értékkel. %.

Különféle statisztikai teszteket használnak a szignifikancia kiszámítására különböző helyzetekben. A T-próbák segítségével megállapítható, hogy két populáció átlaga különbözik-e, az F-próbákat pedig annak meghatározására, hogy a szórások különböznek-e.

Miért teszteljük a statisztikai szignifikanciát?

A különböző dolgok összehasonlításakor szignifikanciatesztet kell használnunk annak meghatározására, hogy az egyik jobb-e a másiknál. Ez sok mezőre vonatkozik, például:

Az üzleti életben az embereknek össze kell hasonlítaniuk a különböző termékeket és marketing módszereket.
A sportban az embereknek össze kell hasonlítaniuk a különböző felszereléseket, technikákat és versenyzőket.
A műszaki területen az embereknek össze kell hasonlítaniuk a különböző terveket és paraméterbeállításokat.

Ha azt szeretné tesztelni, hogy valami jobban teljesít-e, mint valami más, bármely területen, tesztelnie kell a statisztikai szignifikanciát.

Mi az a hallgatói T-eloszlás?

A Student t-eloszlása hasonló a normál (vagy Gauss-) eloszláshoz. Mindkettő harang alakú eloszlás, a legtöbb eredmény közel van az átlaghoz, de néhány ritka esemény mindkét irányban meglehetősen távol esik az átlagtól, ezeket az eloszlás farkának nevezik.

A Student t-eloszlásának pontos alakja a minta méretétől függ. 30-nál nagyobb minták esetén nagyon hasonló a normál eloszláshoz. A minta méretének csökkenésével a farok nagyobb lesz, ami a kis mintán alapuló következtetések megnövekedett bizonytalanságát jelzi.

Hogyan végezzünk T-tesztet Excelben

Mielőtt T-tesztet alkalmazhat annak megállapítására, hogy van-e statisztikailag szignifikáns különbség a két minta átlaga között, először el kell végeznie egy F-tesztet. Ennek az az oka, hogy a T-teszthez különböző számításokat hajtanak végre attól függően, hogy van-e szignifikáns eltérés az eltérések között.

Az elemzés végrehajtásához engedélyezni kell az Analysis Toolpak bővítményt.

Az elemző eszközcsomag-bővítmény ellenőrzése és betöltése

Az Elemző eszközcsomag ellenőrzéséhez és aktiválásához kövesse az alábbi lépéseket:

Válassza ki a FILE lapot. >Select Options.
A Beállítások párbeszédpanelen válassza ki a Add-Ins lehetőséget a bal oldali fülek közül.
Az ablak alján válassza ki a Kezelés legördülő menüt, majd válassza az Excel-bővítmények lehetőséget. Válassza a Go.

Image
Győződjön meg arról, hogy az Analysis Toolpak melletti jelölőnégyzet be van jelölve, majd válassza az OK.
Az elemző eszközcsomag aktív, és készen áll az F- és T-tesztek alkalmazására.

F-teszt és T-teszt végrehajtása Excelben

Írjon be két adatkészletet egy táblázatba. Ebben az esetben egy hét alatt két termék értékesítését vesszük figyelembe. Az egyes termékek átlagos napi értékesítési értékét is kiszámítja a szórással együtt.

Image
Válassza ki a Data lapot > Data Analysis

Image
Válassza ki a F-Test Two-Sample for Variances elemet a listából, majd válassza az OK. lehetőséget.

Image

Az F-teszt nagyon érzékeny a nem normális jelenségekre. Ezért lehet, hogy biztonságosabb a Welch-teszt használata, de ez az Excelben nehezebb.
Válassza ki az 1. változó tartományát és a 2. változó tartományát; állítsa be az Alfát (0,05 95%-os biztonságot ad); válasszon ki egy cellát a kimenet bal felső sarkába, figyelembe véve, hogy ez 3 oszlopot és 10 sort tölt ki. Válassza a OK. lehetőséget.

Image

Az 1. változó tartományához a legnagyobb szórással (vagy szórással) rendelkező mintát kell kiválasztani.
Nézze meg az F-teszt eredményeit, hogy megállapítsa, van-e szignifikáns különbség az eltérések között. Az eredmények három fontos értéket adnak:
- F: Az eltérések aránya.
- P(F<=f) one-tail: Annak a valószínűsége, hogy az 1. változónak valójában nincs nagyobb szórása, mint a 2. változóé. általában 0,05, akkor nincs szignifikáns különbség az eltérések között.
- F Kritikus egyfarkú: F értéke, amely ahhoz szükséges, hogy P(F<=f)=α legyen. Ha ez az érték nagyobb, mint F, ez azt is jelzi, hogy nincs jelentős különbség az eltérések között.
A P(F<=f) kiszámítható az FDIST függvénnyel is, amelynek bemenetei az F és az egyes minták szabadsági fokai. A szabadságfok egyszerűen a mintában lévő megfigyelések száma mínusz egy.
Most, hogy tudja, hogy van-e különbség az eltérések között, kiválaszthatja a megfelelő T-tesztet. Válassza a Data lapot > Data Analysis, majd válassza a t-Test: Two-Sample Assuming Equal Variancesvagy t-teszt: kétmintás egyenlőtlen eltéréseket feltételezve

Image
Függetlenül attól, hogy melyik opciót választotta az előző lépésben, ugyanaz a párbeszédpanel jelenik meg, ahol megadhatja az elemzés részleteit. Kezdésként válassza ki a Variable 1 Range és Variable 2 Range. mintákat tartalmazó tartományokat

Image
Feltéve, hogy tesztelni szeretné, hogy nincs-e különbség az átlagok között, állítsa a Hypothesized Mean Difference értéket nullára.
Állítsa be az Alpha szignifikanciaszintet (0,05 95%-os biztonságot ad), és válasszon ki egy cellát a kimenet bal felső sarkába, figyelembe véve, hogy ez 3 oszlopot és 14 sort tölt ki. Válassza a OK. lehetőséget.
Tekintse át az eredményeket, hogy eldöntse, van-e jelentős különbség az átlagok között.

Akárcsak az F-tesztnél, ha a p-érték, ebben az esetben P(T<=t), nagyobb, mint az alfa, akkor nincs jelentős különbség. Ebben az esetben azonban két p-érték van megadva, az egyik az egyfarkú teszthez, a másik a kétfarkú teszthez. Ebben az esetben használja a kétvégű értéket, mivel bármelyik nagyobb átlaggal rendelkező változó szignifikáns különbség lenne.