Jak provést základní analýzu dat v aplikaci Excel

Jak provést základní analýzu dat v aplikaci Excel

Většinu času při spouštění statistik chcete použít statistický software. Tyto nástroje jsou vytvořeny pro provádění podobných výpočtů t -testy, chí-kvadrát testy, korelace atd. Excel není určen pro analýzu dat. To ale neznamená, že to nemůžete udělat.





Statistické funkce Excelu bohužel nejsou vždy intuitivní. A obvykle vám poskytnou esoterické výsledky. Takže místo použití statistických funkcí použijeme doplněk statistik go-to Excel: Analýza dat Toolpak.





Toolpak, navzdory svému docela nešťastnému hláskování, obsahuje širokou škálu užitečných statistických funkcí. Podívejme se, co můžeme dělat se statistikami Excelu.





Přidání nástroje Excel Data Analysis Toolpak

Zatímco ty umět dělat statistiky bez nástroje pro analýzu dat, je to s ním mnohem jednodušší. Chcete -li nainstalovat Toolpak v aplikaci Excel 2016, přejděte na Soubor> Možnosti> Doplňky .

Klikněte Jít vedle položky „Spravovat: Doplňky aplikace Excel“.



Ve výsledném okně zaškrtněte políčko vedle Nástroj pro analýzu a potom klikněte na OK .

Pokud jste správně přidali nástroj pro analýzu dat do Excelu, zobrazí se Analýza dat tlačítko v Data karta, seskupená do Analýza sekce:





Pokud chcete ještě větší výkon, nezapomeňte se podívat na další doplňky Excelu.

Popisné statistiky v Excelu

Bez ohledu na to, jaký statistický test používáte, pravděpodobně budete chtít nejprve získat popisnou statistiku aplikace Excel. Získáte tak informace o prostředcích, mediánech, rozptylech, standardní odchylce a chybě, zakřivení, šikmosti a řadě dalších čísel.





Spouštění popisných statistik v aplikaci Excel je snadné. Klikněte Analýza dat na kartě Data vyberte Deskriptivní statistika, a vyberte svůj vstupní rozsah. Klikněte na šipku vedle pole vstupního rozsahu, kliknutím a přetažením vyberte data a stiskněte Vstupte (nebo klikněte na odpovídající šipku dolů), jako v GIF níže.

Poté nezapomeňte sdělit Excelu, zda mají vaše data popisky, zda chcete výstup v novém listu nebo na stejném listu a zda chcete souhrnnou statistiku a další možnosti.

Poté zasáhněte OK a získáte popisné statistiky:

Studentský t-test v Excelu

The t -test je jedním z nejzákladnějších statistických testů a v aplikaci Excel je snadné jej vypočítat pomocí nástroje Toolpak. Klikněte na Analýza dat tlačítko a přejděte dolů, dokud neuvidíte t -testovací možnosti.

Máte tři možnosti:

  • t-Test: Párovaný dva vzorky pro prostředky by měly být použity, když byla vaše měření nebo pozorování spárována. Tuto možnost použijte, když jste provedli dvě měření stejných subjektů, například měření krevního tlaku před a po zásahu.
  • t-Test: Dva vzorky za předpokladu rovných odchylek Měly by být použity, pokud jsou vaše měření nezávislá (což obvykle znamená, že byla provedena na dvou různých skupinách subjektů). Za chvíli probereme část „stejných odchylek“.
  • t-Test: Dva vzorky za předpokladu nerovných odchylek je také pro nezávislá měření, ale používá se, když jsou vaše odchylky nerovnoměrné.

Chcete-li otestovat, zda jsou odchylky vašich dvou vzorků stejné, budete muset spustit F-test. Nalézt F-Test Dva vzorky pro varianty v seznamu Nástroje pro analýzu jej vyberte a klikněte na OK .

Zadejte své dvě datové sady do polí vstupního rozsahu. Ponechte hodnotu alfa na 0,05, pokud nemáte důvod ji měnit - pokud nevíte, co to znamená, prostě odejděte. Nakonec klikněte OK .

Excel vám poskytne výsledky v novém listu (pokud jste nevybrali Rozsah výstupu a buňka ve vašem aktuálním listu):

Tady se díváte na hodnotu P. Pokud je menší než 0,05, máte nerovnoměrné odchylky . Takže spustit t -test, měli byste použít možnost nestejných odchylek.

Spustit a t -test, vyberte příslušný test z okna Analysis Tools a vyberte obě sady dat stejným způsobem jako pro F-test. Ponechte hodnotu alfa na 0,05 a stiskněte OK .

Výsledky zahrnují vše, co potřebujete pro a t -test: průměr, stupně volnosti (df), t statistika a hodnoty P pro testy s jednou i dvěma ocasy. Pokud je hodnota P menší než 0,05, jsou tyto dva vzorky výrazně odlišné.

Pokud si nejste jisti, zda použít jednostranný nebo dvoustranný t -test, podívejte se toto vysvětlení od UCLA .

ANOVA v Excelu

Nástroj Excel Data Analysis Toolpak nabízí tři typy analýzy rozptylu (ANOVA). Bohužel vám to nedává možnost spustit potřebné navazující testy jako Tukey nebo Bonferroni. Můžete však zjistit, zda existuje vztah mezi několika různými proměnnými.

Zde jsou tři testy ANOVA v Excelu:

  • ANOVA: Jediný faktor analyzuje rozptyl s jednou závislou proměnnou a jednou nezávislou proměnnou. Je vhodnější použít více t -testy, pokud máte více než dvě skupiny.
  • ANOVA: Dvoufaktorový s replikací je podobný spárovanému t -test; zahrnuje více měření na jednotlivých předmětech. Část dvoufaktorového testu ukazuje, že existují dvě nezávislé proměnné.
  • ANOVA: Dvoufaktorový bez replikace zahrnuje dvě nezávislé proměnné, ale žádná replikace v měření.

Zde projdeme jednofaktorovou analýzu. V našem příkladu se podíváme na tři sady čísel označené jako „Intervence 1“, „Intervence 2“ a „Intervence 3“. Chcete -li spustit ANOVA, klikněte na Analýza dat , poté vyberte ANOVA: Jediný faktor .

Vyberte vstupní rozsah a nezapomeňte sdělit Excelu, zda jsou vaše skupiny ve sloupcích nebo řádcích. Také jsem zde vybral „Štítky v prvním řádku“, aby se ve výsledcích zobrazovaly názvy skupin.

Po zasažení OK , získáme následující výsledky:

Všimněte si, že hodnota P je menší než 0,05, takže máme významný výsledek. To znamená, že mezi alespoň dvěma skupinami v testu je významný rozdíl. Ale protože Excel neposkytuje testy k určení který skupiny se liší, nejlepší, co můžete udělat, je podívat se na průměry zobrazené v souhrnu. V našem příkladu Intervence 3 vypadá, že je pravděpodobně ten, který se liší.

To není statisticky zdravé. Ale pokud chcete jen zjistit, zda je v tom rozdíl, a zjistit, která skupina to pravděpodobně způsobuje, bude to fungovat.

Dvoufaktorová ANOVA je složitější. Pokud se chcete dozvědět více o tom, kdy použít dvoufaktorovou metodu, viz toto video ze serveru Sophia.org a ' bez replikace ' a ' s replikací 'příklady ze skutečné statistiky.

Korelace v Excelu

Výpočet korelace v aplikaci Excel je mnohem jednodušší než t -test nebo ANOVA. Použijte Analýza dat tlačítko otevřete okno Analysis Tools a vyberte Korelace .

Vyberte svůj vstupní rozsah, identifikujte své skupiny jako sloupce nebo řádky a řekněte Excelu, zda máte štítky. Poté zasáhněte OK .

Nezískáte žádná měřítka významnosti, ale můžete vidět, jak každá skupina souvisí s ostatními. Hodnota jedna je absolutní korelace, což znamená, že hodnoty jsou naprosto stejné. Čím blíže je jedna korelační hodnota, tím silnější je korelace.

Regrese v Excelu

Regrese je jedním z nejpoužívanějších statistických testů v průmyslu a Excel má pro tento výpočet neuvěřitelně moc. Zde v Excelu spustíme rychlou vícenásobnou regresi. Pokud nejste obeznámeni s regresí, podívejte se Průvodce HBR k používání regrese pro podnikání .

Řekněme, že naší závislou proměnnou je krevní tlak a našimi dvěma nezávislými proměnnými je hmotnost a příjem soli. Chceme zjistit, který je lepší prediktor krevního tlaku (nebo jestli jsou oba dobří).

Klikněte Analýza dat a vyberte Regrese . Při vyplňování polí vstupního rozsahu tentokrát musíte být opatrní. The Vstupní rozsah Y pole by mělo obsahovat vaši jedinou závislou proměnnou. The Vstup X Rozsah box může obsahovat více nezávislých proměnných. Pro jednoduchou regresi si nedělejte starosti se zbytkem (i když nezapomeňte sdělit Excelu, pokud jste vybrali popisky).

Náš výpočet vypadá takto:

Po zasažení OK , získáte velký seznam výsledků. Zde jsem zdůraznil hodnotu P pro hmotnost i příjem soli:

Jak vidíte, hodnota P pro hmotnost je větší než 0,05, takže tam neexistuje žádný významný vztah. Hodnota P pro sůl je však nižší než 0,05, což naznačuje, že je dobrým prediktorem krevního tlaku.

Pokud plánujete prezentovat regresní data, nezapomeňte, že do scatterplot v aplikaci Excel můžete přidat regresní řádek. To je skvělá vizuální pomůcka pro tuto analýzu.

Statistiky aplikace Excel: Překvapivě schopné

Zatímco Excel není známý svou statistickou silou, ve skutečnosti obsahuje některé opravdu užitečné funkce, jako například nástroj PowerQuery , což je užitečné pro úkoly, jako je kombinace datových sad. (Zjistěte, jak vygenerovat první skript Microsoft Power Query.) K dispozici je také doplněk statistik nástroje Data Analysis Toolpak, který skutečně přináší některé z nejlepších funkcí Excelu. Doufám, že jste se naučili, jak používat Toolpak, a že si nyní můžete hrát sami a zjistit, jak využívat více jeho funkcí.

hodinky Apple série 3 vs 6

Díky tomu budete mít nyní své opasky na dosah díky našim článkům o pomocí funkce Excel's Goal Seek pro další křupání dat a hledání hodnot pomocí vlookup . V určitém okamžiku se také možná budete chtít naučit importovat data aplikace Excel do Pythonu.

Podíl Podíl tweet E-mailem Vymažte tyto soubory a složky systému Windows, abyste uvolnili místo na disku

Potřebujete uvolnit místo na disku v počítači se systémem Windows? Zde jsou soubory a složky systému Windows, které lze bezpečně odstranit, aby se uvolnilo místo na disku.

Číst dále
Související témata
  • Produktivita
  • Tabulkový procesor
  • Microsoft Excel
O autorovi Pak Albright(506 článků zveřejněno)

Dann je poradce pro strategii obsahu a marketing, který pomáhá společnostem vytvářet poptávku a potenciální zákazníky. Píše také o strategickém a obsahovém marketingu na dannalbright.com.

Více od Danna Albrighta

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné elektronické knihy a exkluzivní nabídky!

Kliknutím sem se přihlásíte k odběru