Sommario:
- Le statistiche descrittive sono dirette
- Le medie non sono così semplici a volte
- Le deviazioni standard descrivono la dispersione
- Un'osservazione è un'osservazione
- Un campione è un sottoinsieme di valori
- Le statistiche inferenziali sono interessanti ma complicate
- Le funzioni di distribuzione della probabilità non sempre confondono
- I parametri non sono così complicati
- L'asimmetria e la curtosi descrivono la forma di una distribuzione di probabilità
- Gli intervalli di confidenza sembrano inizialmente complicati, ma sono utili
Video: 13 STRUMENTI PER L'ANALISI DEI COMPETITOR GRATUITI 2024
Excel è uno strumento meraviglioso quando devi usare le statistiche. Se non sei mai stato esposto alle statistiche a scuola o è passato un decennio o due da quando eri, lascia che questi suggerimenti ti aiutino a utilizzare alcuni degli strumenti statistici forniti da Excel.
Le statistiche descrittive sono dirette
La prima cosa che dovresti sapere è che alcune analisi statistiche e alcune misure statistiche sono dannatamente semplici. Le statistiche descrittive, che includono cose come le tabelle incrociate della tabella pivot, così come alcune delle funzioni statistiche, hanno senso anche per qualcuno che non è tutto ciò che è quantitativo.
Le medie non sono così semplici a volte
Quando qualcuno usa il termine media, ciò a cui si riferisce di solito è la misurazione media più comune, che è significare. Capire che il termine media è impreciso rende molte delle funzionalità statistiche di Excel più comprensibili.
Per rendere questa discussione più concreta, supponi di osservare un piccolo insieme di valori: 1, 2, 3, 4 e 5. Come forse saprai, la media in questo piccolo insieme di valori è 3. Puoi calcolare la media sommando tutti i numeri nel set (1 + 2 + 3 + 4 + 5) e poi dividendo questa somma (15) per il numero totale di valori nel set (5).
Il valore mediano è il valore che separa i valori più grandi dai valori più piccoli. Nel set di dati 1, 2, 3, 4 e 5, la mediana è 3. Il valore 3 separa i valori più grandi (4 e 5) dai valori più piccoli (1 e 2).
Non è necessario comprendere misurazioni medie diverse, ma è necessario ricordare che il termine media è piuttosto impreciso.
Le deviazioni standard descrivono la dispersione
La formula per la deviazione standard e la logica sono abbastanza facili da capire.
Una deviazione standard descrive come i valori di un set di dati variano attorno alla media. La cosa buona delle misure statistiche come una deviazione standard, spesso ottieni informazioni approfondite sulle caratteristiche dei dati che stai guardando. Un'altra cosa è che con questi due bit di dati puoi spesso trarre inferenze sui dati osservando i campioni.
Un'osservazione è un'osservazione
L'osservazione è uno dei termini che incontrerai se leggi qualcosa sulle statistiche. Un'osservazione è solo un'osservazione. Un modo per definire il termine osservazione è il seguente: ogni volta che assegni un valore a una delle tue variabili casuali, crei un'osservazione.
Un campione è un sottoinsieme di valori
Un campione è una raccolta di osservazioni da una popolazione. Ad esempio, se crei un set di dati che registra la temperatura elevata giornaliera nel tuo quartiere, la tua piccola raccolta di osservazioni è un esempio.
In confronto, un campione non è una popolazione. Una popolazione include tutte le possibili osservazioni.
Le statistiche inferenziali sono interessanti ma complicate
Se si guarda un campione di valori da una popolazione e il campione è rappresentativo e sufficientemente ampio, è possibile trarre conclusioni sulla popolazione in base alle caratteristiche del campione.
Le statistiche inferenziali, sebbene molto potenti, possiedono due qualità che è necessario conoscere:
-
Problemi di precisione
-
Curva di apprendimento ripida
Le funzioni di distribuzione della probabilità non sempre confondono
P distribuzione della robustezza la funzione sembra piuttosto complicata; ma puoi effettivamente capire intuitivamente cosa sia una funzione di distribuzione di probabilità con un paio di esempi utili.
Una distribuzione comune di cui si sente parlare nelle classi statistiche, ad esempio, è una distribuzione T. Una distribuzione T è essenzialmente una distribuzione normale tranne che con code più pesanti e più grasse.
Una funzione di distribuzione di probabilità comune è una distribuzione uniforme. In una distribuzione uniforme , ogni evento ha la stessa probabilità di accadimento. La cosa unica di questa distribuzione è che tutto è dannatamente buono.
Un altro tipo comune di funzione di distribuzione di probabilità è la distribuzione normale, anche conosciuta come una curva campana o una distribuzione gaussiana.
Una distribuzione normale si verifica naturalmente in molte situazioni. Ad esempio, i quozienti di intelligenza (IQ) sono distribuiti normalmente.
I parametri non sono così complicati
Un parametro è un input per la funzione di distribuzione di probabilità. In altre parole, la formula o la funzione o l'equazione che descrive una curva di distribuzione di probabilità necessita di input. In statistica, quegli input sono chiamati parametri.
Alcune funzioni di distribuzione di probabilità necessitano solo di un singolo parametro semplice. Ad esempio, per lavorare con una distribuzione uniforme, tutto ciò di cui hai veramente bisogno è il numero di valori nel set di dati. Un dado a sei facce, per esempio, ha solo sei possibilità.
L'asimmetria e la curtosi descrivono la forma di una distribuzione di probabilità
Un paio di altri termini statistici utili da sapere sono l'asimmetria e la curtosi. Skewness quantifica la mancanza di simmetria in una distribuzione di probabilità. In una distribuzione perfettamente simmetrica, come la distribuzione normale, l'asimmetria è uguale a zero. Se una distribuzione di probabilità si appoggia a destra o a sinistra, tuttavia, l'asimmetria equivale a un valore diverso da zero e il valore quantifica la mancanza di simmetria.
Kurtosis quantifica la pesantezza delle code in una distribuzione. In una distribuzione normale, la curtosi è uguale a zero. La coda è la cosa che si estende a sinistra oa destra. Tuttavia, se una coda in una distribuzione è più pesante di una distribuzione normale, la curtosi è un numero positivo.Se le code in una distribuzione sono più magre rispetto a una distribuzione normale, la curtosi è un numero negativo.
Gli intervalli di confidenza sembrano inizialmente complicati, ma sono utili
Le probabilità spesso confondono le persone. Una cosa importante da capire sui livelli di confidenza è che sono collegati con il margine di errore.
Un'altra cosa importante da comprendere sui livelli di confidenza è che quanto più grande è la dimensione del campione, tanto più piccolo sarà il margine di errore che utilizzerà lo stesso livello di confidenza.
Come solo esempio, supponiamo che tu abbia alcuni dati di Google Analytics su due diversi annunci web che stai pubblicando per promuovere la tua piccola impresa e desideri sapere quale annuncio è più efficace. Puoi utilizzare la formula dell'intervallo di confidenza per capire per quanto tempo i tuoi annunci devono essere pubblicati prima che Google abbia raccolto dati sufficienti per farti sapere quale annuncio è davvero migliore.