Che cosa sono le statistiche non parametriche?

La statistica non parametrica è un metodo che effettua inferenze statistiche senza considerare alcuna distribuzione sottostante. Il metodo si adatta a una distribuzione normale senza presupposti. Abitualmente, l'approccio utilizza dati che sono spesso ordinali Dati ordinali Nelle statistiche, i dati ordinali sono il tipo di dati in cui i valori seguono un ordine naturale. Una delle caratteristiche più notevoli dei dati ordinali è perché si basa sulle classifiche piuttosto che sui numeri.

Statistiche non parametriche

Le statistiche non parametriche possono essere messe a confronto con le statistiche parametriche. Quest'ultimo approccio fa ipotesi esplicite sulla distribuzione dei dati osservati e stima i parametri della distribuzione utilizzando gli stessi dati.

Sommario

  • La statistica non parametrica è un metodo che ignora qualsiasi distribuzione sottostante quando si effettua l'inferenza statistica.
  • I metodi statistici non parametrici mirano a scoprire la distribuzione sottostante sconosciuta dei dati osservati, nonché a fare un'inferenza statistica in assenza della distribuzione sottostante.
  • Si consiglia ai ricercatori di considerare i punti deboli, i punti di forza e le potenziali insidie ​​delle statistiche non parametriche.

Comprensione delle statistiche non parametriche

Considera i dati con parametri sconosciuti µ (media) e σ2 (varianza). Mentre le statistiche parametriche presumono che i dati siano stati tratti da una distribuzione normale Distribuzione normale La distribuzione normale viene anche chiamata distribuzione gaussiana o Gauss. Questo tipo di distribuzione è ampiamente utilizzato nelle scienze naturali e sociali. Il, una statistica non parametrica non presuppone che i dati siano normalmente distribuiti o quantitativi. A questo proposito, le statistiche non parametriche stimerebbero la forma della distribuzione stessa, invece di stimare i singoli µ e σ2.

D'altra parte, le statistiche parametriche impiegherebbero la media campionaria e la deviazione standard campionaria per stimare i valori di µ e σ2, rispettivamente. La struttura del modello delle statistiche non parametriche viene dedotta dai dati osservati, in contrapposizione a un priori specificato . Il termine stesso non parametrico implica che il numero e la natura dei parametri siano flessibili e non che siano completamente privi di parametri.

Tipi di statistiche non parametriche

Esistono due tipi principali di metodi statistici non parametrici. Il primo metodo cerca di scoprire la distribuzione sconosciuta sottostante dei dati osservati, mentre il secondo metodo tenta di fare un'inferenza statistica ignorando la distribuzione sottostante.

Metodi e istogrammi del kernel Istogramma Un istogramma viene utilizzato per riepilogare dati discreti o continui. In altre parole, un istogramma fornisce un'interpretazione visiva dei dati numerici mostrando il numero di punti dati che rientrano in un intervallo di valori specificato (chiamato "bin"). Un istogramma è simile a un grafico a barre verticali. Tuttavia, un istogramma, sono comunemente usati per stimare i valori dei parametri nel primo approccio. Al contrario, quest'ultimo metodo prevede la verifica di ipotesi senza i valori effettivi dei dati, ma piuttosto in base all'ordinamento dei dati.

I test statistici non parametrici tendono ad essere più facili da applicare rispetto alle statistiche parametriche, data la mancanza di ipotesi sui parametri della popolazione. Le procedure matematiche standard per il test di ipotesi non fanno supposizioni sulle distribuzioni di probabilità, inclusi test t di distribuzione, test dei segni e inferenze su una singola popolazione.

Ad esempio, quando si verifica l'ipotesi che "vi sia una differenza nelle mediane", le due variabili casuali, X e Y, definiscono due distribuzioni continue tra il punto in cui viene eseguita l'ipotesi e i campioni accoppiati. Oltre ad avere un'applicabilità generale, il test manca anche del potere statistico di altri test, dato che funziona sotto poche ipotesi.

Esempi di statistiche non parametriche

Supponiamo che un ricercatore sia interessato a stimare il numero di bambini nati con ittero nello stato della California. È possibile eseguire un'analisi del set di dati prelevando un campione di 5.000 bambini. Una stima dell'intera popolazione di bambini portatori di ittero nati l'anno successivo è la misurazione derivata.

Per un secondo caso, considera due gruppi di ricercatori diversi. Sono interessati a sapere se il marketing globale o il marketing commerciale è associato alla velocità con cui un'azienda ottiene il posizionamento del marchio. Supponendo che la dimensione del campione sia scelta casualmente, la sua distribuzione relativa alla velocità con cui un'azienda realizza un posizionamento del marchio Posizionamento di mercato Posizionamento di mercato si riferisce alla capacità di influenzare la percezione del consumatore riguardo a un marchio o prodotto rispetto ai concorrenti. Si può presumere che l'obiettivo del mercato sia normale. Tuttavia, un esperimento che misura gli obiettivi strategici dell'azienda per affrontare le dinamiche di mercato (che determina anche il posizionamento del marchio) non può assumere una distribuzione normale.

L'idea principale alla base del fenomeno è che i dati selezionati casualmente possono contenere fattori come le dinamiche di mercato. All'altro estremo, se entrano in gioco fattori come il segmento di mercato e la concorrenza, è improbabile che gli obiettivi strategici dell'azienda abbiano un impatto sulla dimensione del campione. Un tale approccio è efficace quando i dati mancano di una chiara interpretazione numerica.

Ad esempio, i test per stabilire se i clienti preferiscono un determinato prodotto a causa del suo valore nutrizionale possono includere una classificazione delle sue metriche come fortemente d'accordo, d'accordo, indifferente, in disaccordo e fortemente in disaccordo. In un tale scenario, un metodo non parametrico è utile.

Takeaway chiave

L'utilizzo di approcci statistici non parametrici nella ricerca richiede una due diligence sui suoi punti deboli, punti di forza e potenziali insidie. È vero che per la distribuzione dei dati si ha un eccesso di curtosi o asimmetria; I test non parametrici basati sui ranghi risultano essere più potenti dei test parametrici.

Anche così, non tutti i casi in cui, se le ipotesi parametriche non sono soddisfatte, adottiamo statistiche non parametriche come metodi sostitutivi a causa del grado di fiducia relativamente basso ottenuto dalle statistiche precedenti.

Le statistiche non parametriche sono apprezzate perché possono essere applicate con facilità. I dati diventano più applicabili a vari test poiché i parametri non sono obbligatori. Ancora più importante, le statistiche possono essere utilizzate in assenza di informazioni vitali, come la media, la deviazione standard o la dimensione del campione. Le caratteristiche fanno sì che le statistiche non parametriche abbiano un ambito di applicazione più ampio rispetto alle statistiche parametriche.

Risorse addizionali

Finance è il fornitore ufficiale della certificazione CBCA ™ CBCA ™ globale Certified Banking & Credit Analyst (CBCA) ™ L'accreditamento Certified Banking & Credit Analyst (CBCA) ™ è uno standard globale per gli analisti del credito che copre finanza, contabilità, analisi del credito, analisi del flusso di cassa , modelli di alleanze, rimborsi di prestiti e altro ancora. programma di certificazione, progettato per aiutare chiunque a diventare un analista finanziario di livello mondiale. Per continuare a far avanzare la tua carriera, le risorse finanziarie aggiuntive di seguito saranno utili:

  • Concetti di statistica di base in finanza Concetti di statistica di base per la finanza Una solida comprensione delle statistiche è di fondamentale importanza per aiutarci a comprendere meglio la finanza. Inoltre, i concetti statistici possono aiutare gli investitori a monitorare
  • Verifica delle ipotesi Verifica delle ipotesi La verifica delle ipotesi è un metodo di inferenza statistica. Viene utilizzato per verificare se un'affermazione relativa a un parametro della popolazione è corretta. Controllo di un'ipotesi
  • Dati nominali Dati nominali Nelle statistiche, i dati nominali (noti anche come scala nominale) sono un tipo di dati utilizzati per etichettare le variabili senza fornire alcun valore quantitativo
  • Test non parametrici Test non parametrici Nelle statistiche, i test non parametrici sono metodi di analisi statistica che non richiedono una distribuzione per soddisfare i presupposti richiesti per essere analizzati

Raccomandato

Calcolatore di inflazione
Che cos'è il reddito netto al netto delle imposte (NIAT)?
Cos'è il profitto contro il contante?