Cos'è la statistica?

La statistica è un termine che deriva dalla parola latina "stato", che significa un gruppo di cifre utilizzate per rappresentare informazioni su un interesse umano. Si riferisce alla tecnica sviluppata allo scopo di raccogliere, rivedere, analizzare e trarre conclusioni da dati quantificati. I dati ottenuti vengono quindi utilizzati nel processo decisionale.

Analisti finanziari Analisti finanziari: cosa fanno utilizzano metodi statistici per analizzare, valutare e riassumere grandi volumi di dati in una forma matematica utile. La statistica è applicata in numerose discipline come economia, scienze sociali, produzione, psicologia, ecc.

Statistiche - Immagine di grafici e tabelle

Tipi di statistiche

Lo studio delle statistiche è raggruppato in due categorie principali. Includono statistiche descrittive e inferenziali.

1. Statistiche descrittive

Le statistiche descrittive descrivono le caratteristiche di base di una popolazione e come sono organizzati i dati. Ciò consente agli analisti di vedere le caratteristiche dei dati e di dare un senso a tali dati. Ad esempio, supponiamo che un negozio di computer venda dispositivi elettronici e che su 1.000 dispositivi elettronici venduti, 300 siano laptop. Con questi dati, una descrizione dei dati sarebbe il 30% del campione rappresenta i laptop.

Esistono due tipi principali di statistiche descrittive che gli scienziati utilizzano e includono:

Misure di tendenza centrale

Tendenza centrale Tendenza centrale Tendenza centrale è un riepilogo descrittivo di un set di dati attraverso un singolo valore che riflette il centro della distribuzione dei dati. Insieme alle misure di variabilità comprendono la media, la mediana e il modo. Sono usati per mostrare le tendenze generali con i dati. La media viene utilizzata per mostrare la media di tutti i componenti di un set di dati, mentre la mediana rappresenta la metà dei dati come la mezza età degli studenti che vanno all'università. La modalità viene utilizzata per mostrare i dati più comuni in una popolazione, come l'età più comune degli studenti al primo anno di college.

Misure di diffusione

Le misure di diffusione mostrano quanto sia simile o diverso un insieme di valori e come si relazionano tra loro. Alcune delle statistiche utilizzate per descrivere la distribuzione dei dati includono intervallo, quartili, varianze, deviazione assoluta, distribuzione di frequenza e deviazione standard Deviazione standard Da un punto di vista statistico, la deviazione standard di un set di dati è una misura della grandezza delle deviazioni tra i valori delle osservazioni contenute.

Ad esempio, in una classe di 20 studenti, il punteggio medio per un elaborato di matematica può essere di 70 su 100 punti. Sebbene la media sia di 70 punti, ciò non significa che tutti gli studenti otterranno un punteggio di 70. Piuttosto, significa che i punteggi saranno distribuiti, sia sotto che sopra il punteggio medio. In questo caso, le misure di spread vengono utilizzate per mostrare come vengono distribuiti i punteggi.

2. Statistiche inferenziali

Le statistiche inferenziali utilizzano complessi calcoli matematici per inferire tendenze su una vasta popolazione. Quando si analizza una grande popolazione, è difficile analizzare ogni membro di quella popolazione uno per uno. Piuttosto, gli scienziati utilizzano statistiche inferenziali per determinare le relazioni tra le variabili in una popolazione campione e quindi utilizzano le informazioni per fare previsioni su come le variabili si riferiscono alla popolazione generale.

Ad esempio, se gli scienziati stanno analizzando il numero di uomini sposati in una popolazione di un milione di uomini, raccoglieranno un campione dalla popolazione di un milione di uomini, e quindi faranno generalizzazioni sull'intera popolazione sulla base delle informazioni ottenute dal campione.

Le due principali classificazioni delle statistiche inferenziali comprendono le seguenti:

Intervallo di fiducia

L'intervallo di confidenza Intervallo di confidenza Un intervallo di confidenza è una stima di un intervallo nelle statistiche che può contenere un parametro della popolazione. Il parametro della popolazione sconosciuta si trova attraverso un parametro campione calcolato dai dati campionati. Ad esempio, la media della popolazione μ viene trovata utilizzando la media campionaria x̅. viene calcolato dalle statistiche dei dati osservati che possono contenere il valore effettivo di un parametro di popolazione sconosciuto.

Controllo di un'ipotesi

Verifica delle ipotesi Verifica delle ipotesi La verifica delle ipotesi è un metodo di inferenza statistica. Viene utilizzato per verificare se un'affermazione relativa a un parametro della popolazione è corretta. Il test di ipotesi si verifica quando gli scienziati analizzano un campione di una popolazione e quindi utilizzano tali informazioni per fare un'affermazione sulla vasta popolazione a cui appartiene il campione.

Proprietà delle statistiche

Alcune delle potenziali caratteristiche che una statistica dovrebbe includere:

1. Completezza

La completezza si riferisce all'indicazione se i dati richiesti per soddisfare la richiesta di informazioni sono disponibili o meno nella risorsa dati. La completezza dei dati è necessaria per garantire l'accuratezza dei dati osservati.

2. Coerenza

La coerenza è vista in termini di uniformità o stabilità dei dati. Alcune delle statistiche utilizzate per misurare la coerenza includono deviazione standard, intervallo e varianza. Quando si misura la consistenza dei dati da un campione che è rappresentativo di un'ampia popolazione, di solito viene esaminato l'errore standard della media.

Inoltre, quando si utilizzano strumenti per raccogliere dati, la coerenza può essere misurata stimando l'affidabilità dei punteggi ottenuti.

3. Sufficienza

Una statistica è considerata sufficiente se non esistono altre statistiche che possono essere calcolate dal campione. Il concetto di sufficienza è comune nelle statistiche descrittive a causa della sua forte dipendenza dall'assunzione della forma di distribuzione dei dati.

4. imparzialità

Il bias delle statistiche è determinato dalla differenza tra il valore reale del parametro misurato e il valore atteso dello stimatore. Se la media della distribuzione campionaria e il valore atteso del parametro sono uguali, la statistica è considerata non distorta.

Letture correlate

Finance è il fornitore ufficiale della certificazione FMVA® Global Modeling & Valuation Analyst (FMVA) ™ Unisciti a oltre 350.600 studenti che lavorano per aziende come Amazon, JP Morgan e il programma di certificazione Ferrari, progettato per aiutare chiunque a diventare un analista finanziario di livello mondiale . Per continuare ad apprendere e far progredire la tua carriera, le risorse finanziarie aggiuntive di seguito saranno utili:

  • Teorema di Bayes Teorema di Bayes In statistica e teoria della probabilità, il teorema di Bayes (noto anche come regola di Bayes) è una formula matematica utilizzata per determinare il condizionale
  • Matrice di correlazione Matrice di correlazione Una matrice di correlazione è semplicemente una tabella che mostra i coefficienti di correlazione per diverse variabili. La matrice rappresenta la correlazione tra tutte le possibili coppie di valori in una tabella. È uno strumento potente per riassumere un ampio set di dati e per identificare e visualizzare i modelli nei dati forniti.
  • Legge dei grandi numeri Legge dei grandi numeri In statistica e teoria della probabilità, la legge dei grandi numeri è un teorema che descrive il risultato della ripetizione dello stesso esperimento un gran numero di
  • Regola della probabilità totale Regola della probabilità totale La regola della probabilità totale (nota anche come legge della probabilità totale) è una regola fondamentale nelle statistiche relative a condizionale e marginale

Raccomandato

Cos'è la deflazione?
Cos'è il fair value?
Cos'è l'analisi esterna?