Hogyan végezzünk T-tesztet Excelben

Tartalomjegyzék:

Hogyan végezzünk T-tesztet Excelben
Hogyan végezzünk T-tesztet Excelben
Anonim

A T-teszt egy módszer annak eldöntésére, hogy vannak-e statisztikailag szignifikáns különbségek az adatkészletek között, a Student-féle t-eloszlás segítségével. Az Excel T-tesztje egy kétmintás T-teszt, amely két minta átlagait hasonlítja össze. Ez a cikk elmagyarázza, mit jelent a statisztikai szignifikancia, és bemutatja, hogyan kell elvégezni a T-tesztet Excelben.

A cikkben található utasítások az Excel 2019, 2016, 2013, 2010, 2007; Excel Microsoft 365-höz és Excel Online-hoz.

Image
Image

Mi a statisztikai szignifikancia?

Képzeld el, hogy tudni szeretnéd, hogy a két kocka közül melyik ad jobb pontszámot. Dobsz az első kockával, és kapsz egy 2-t; dobsz a második kockával, és kapsz egy 6-ost. Ez azt jelenti, hogy a második kocka általában magasabb pontszámot ad? Ha azt válaszolta, hogy „Természetesen nem”, akkor már ismeri a statisztikai szignifikanciát. Tudod, hogy a különbséget a pontszám véletlenszerű változása okozta, minden alkalommal, amikor egy kockával dobnak. Mivel a minta nagyon kicsi volt (csak egy tekercs), nem mutatott semmi jelentőset.

Most képzeld el, hogy minden kockával hatszor dobsz:

  • Az első kocka 3, 6, 6, 4, 3, 3-at dob; Átlag=4,17
  • A második kocka 5, 6, 2, 5, 2, 4-et dob; Átlag=4,00

Ez most azt bizonyítja, hogy az első kocka magasabb pontszámot ad, mint a második? Valószínűleg nem. Egy kis minta, ahol az átlagok között viszonylag kis különbség van, valószínűsíti, hogy a különbség továbbra is véletlenszerű eltérésekből adódik. A kockadobások számának növekedésével egyre nehezebb józan ésszel válaszolni arra a kérdésre, hogy a pontszámok közötti különbség véletlenszerű variáció eredménye, vagy az egyik nagyobb valószínűséggel ad magasabb pontszámot, mint a másik?

A szignifikancia annak a valószínűsége, hogy a minták között megfigyelt különbség véletlenszerű eltérésekből adódik. A szignifikanciát gyakran alfa-szintnek vagy egyszerűen α-nak nevezik. A konfidenciaszint vagy egyszerűen 'c' annak a valószínűsége, hogy a minták közötti különbség nem véletlenszerű variációból adódik; más szóval, hogy különbség van a mögöttes populációk között. Ezért: c=1 – α

Az 'α' értéket tetszőleges szintre állíthatjuk, hogy biztosak lehessünk abban, hogy fontosak vagyunk. Nagyon gyakran használjuk az α=5%-ot (95%-os megbízhatóság), de ha igazán biztosak akarunk lenni abban, hogy az eltéréseket nem véletlenszerű variáció okozza, akkor magasabb megbízhatósági szintet alkalmazhatunk, α=1% vagy akár α=0,1 értékkel. %.

Különféle statisztikai teszteket használnak a szignifikancia kiszámítására különböző helyzetekben. A T-próbák segítségével megállapítható, hogy két populáció átlaga különbözik-e, az F-próbákat pedig annak meghatározására, hogy a szórások különböznek-e.

Miért teszteljük a statisztikai szignifikanciát?

A különböző dolgok összehasonlításakor szignifikanciatesztet kell használnunk annak meghatározására, hogy az egyik jobb-e a másiknál. Ez sok mezőre vonatkozik, például:

  • Az üzleti életben az embereknek össze kell hasonlítaniuk a különböző termékeket és marketing módszereket.
  • A sportban az embereknek össze kell hasonlítaniuk a különböző felszereléseket, technikákat és versenyzőket.
  • A műszaki területen az embereknek össze kell hasonlítaniuk a különböző terveket és paraméterbeállításokat.

Ha azt szeretné tesztelni, hogy valami jobban teljesít-e, mint valami más, bármely területen, tesztelnie kell a statisztikai szignifikanciát.

Mi az a hallgatói T-eloszlás?

A Student t-eloszlása hasonló a normál (vagy Gauss-) eloszláshoz. Mindkettő harang alakú eloszlás, a legtöbb eredmény közel van az átlaghoz, de néhány ritka esemény mindkét irányban meglehetősen távol esik az átlagtól, ezeket az eloszlás farkának nevezik.

A Student t-eloszlásának pontos alakja a minta méretétől függ. 30-nál nagyobb minták esetén nagyon hasonló a normál eloszláshoz. A minta méretének csökkenésével a farok nagyobb lesz, ami a kis mintán alapuló következtetések megnövekedett bizonytalanságát jelzi.

Hogyan végezzünk T-tesztet Excelben

Mielőtt T-tesztet alkalmazhat annak megállapítására, hogy van-e statisztikailag szignifikáns különbség a két minta átlaga között, először el kell végeznie egy F-tesztet. Ennek az az oka, hogy a T-teszthez különböző számításokat hajtanak végre attól függően, hogy van-e szignifikáns eltérés az eltérések között.

Az elemzés végrehajtásához engedélyezni kell az Analysis Toolpak bővítményt.

Az elemző eszközcsomag-bővítmény ellenőrzése és betöltése

Az Elemző eszközcsomag ellenőrzéséhez és aktiválásához kövesse az alábbi lépéseket:

  1. Válassza ki a FILE lapot. >Select Options.
  2. A Beállítások párbeszédpanelen válassza ki a Add-Ins lehetőséget a bal oldali fülek közül.

  3. Az ablak alján válassza ki a Kezelés legördülő menüt, majd válassza az Excel-bővítmények lehetőséget. Válassza a Go.

    Image
    Image
  4. Győződjön meg arról, hogy az Analysis Toolpak melletti jelölőnégyzet be van jelölve, majd válassza az OK.
  5. Az elemző eszközcsomag aktív, és készen áll az F- és T-tesztek alkalmazására.

F-teszt és T-teszt végrehajtása Excelben

  1. Írjon be két adatkészletet egy táblázatba. Ebben az esetben egy hét alatt két termék értékesítését vesszük figyelembe. Az egyes termékek átlagos napi értékesítési értékét is kiszámítja a szórással együtt.

    Image
    Image
  2. Válassza ki a Data lapot > Data Analysis

    Image
    Image
  3. Válassza ki a F-Test Two-Sample for Variances elemet a listából, majd válassza az OK. lehetőséget.

    Image
    Image

    Az F-teszt nagyon érzékeny a nem normális jelenségekre. Ezért lehet, hogy biztonságosabb a Welch-teszt használata, de ez az Excelben nehezebb.

  4. Válassza ki az 1. változó tartományát és a 2. változó tartományát; állítsa be az Alfát (0,05 95%-os biztonságot ad); válasszon ki egy cellát a kimenet bal felső sarkába, figyelembe véve, hogy ez 3 oszlopot és 10 sort tölt ki. Válassza a OK. lehetőséget.

    Image
    Image

    Az 1. változó tartományához a legnagyobb szórással (vagy szórással) rendelkező mintát kell kiválasztani.

  5. Nézze meg az F-teszt eredményeit, hogy megállapítsa, van-e szignifikáns különbség az eltérések között. Az eredmények három fontos értéket adnak:

    • F: Az eltérések aránya.
    • P(F<=f) one-tail: Annak a valószínűsége, hogy az 1. változónak valójában nincs nagyobb szórása, mint a 2. változóé. általában 0,05, akkor nincs szignifikáns különbség az eltérések között.
    • F Kritikus egyfarkú: F értéke, amely ahhoz szükséges, hogy P(F<=f)=α legyen. Ha ez az érték nagyobb, mint F, ez azt is jelzi, hogy nincs jelentős különbség az eltérések között.

    A P(F<=f) kiszámítható az FDIST függvénnyel is, amelynek bemenetei az F és az egyes minták szabadsági fokai. A szabadságfok egyszerűen a mintában lévő megfigyelések száma mínusz egy.

  6. Most, hogy tudja, hogy van-e különbség az eltérések között, kiválaszthatja a megfelelő T-tesztet. Válassza a Data lapot > Data Analysis, majd válassza a t-Test: Two-Sample Assuming Equal Variancesvagy t-teszt: kétmintás egyenlőtlen eltéréseket feltételezve

    Image
    Image
  7. Függetlenül attól, hogy melyik opciót választotta az előző lépésben, ugyanaz a párbeszédpanel jelenik meg, ahol megadhatja az elemzés részleteit. Kezdésként válassza ki a Variable 1 Range és Variable 2 Range. mintákat tartalmazó tartományokat

    Image
    Image
  8. Feltéve, hogy tesztelni szeretné, hogy nincs-e különbség az átlagok között, állítsa a Hypothesized Mean Difference értéket nullára.
  9. Állítsa be az Alpha szignifikanciaszintet (0,05 95%-os biztonságot ad), és válasszon ki egy cellát a kimenet bal felső sarkába, figyelembe véve, hogy ez 3 oszlopot és 14 sort tölt ki. Válassza a OK. lehetőséget.
  10. Tekintse át az eredményeket, hogy eldöntse, van-e jelentős különbség az átlagok között.

    Akárcsak az F-tesztnél, ha a p-érték, ebben az esetben P(T<=t), nagyobb, mint az alfa, akkor nincs jelentős különbség. Ebben az esetben azonban két p-érték van megadva, az egyik az egyfarkú teszthez, a másik a kétfarkú teszthez. Ebben az esetben használja a kétvégű értéket, mivel bármelyik nagyobb átlaggal rendelkező változó szignifikáns különbség lenne.

Ajánlott: