Qual è il coefficiente di determinazione?

Il coefficiente di determinazione (R² o r-quadrato) è una misura statistica in un modello di regressione che determina la proporzione di varianza nella variabile dipendente che può essere spiegata dalla variabile indipendente Variabile indipendente Una variabile indipendente è un input, un'ipotesi o un driver che viene modificato per valutare il suo impatto su una variabile dipendente (il risultato). . In altre parole, il coefficiente di determinazione indica quanto bene i dati si adattano al modello (la bontà dell'adattamento).

Coefficiente di determinazione

Sebbene il coefficiente di determinazione fornisca alcune informazioni utili riguardo al modello di regressione, non si dovrebbe fare affidamento esclusivamente sulla misura nella valutazione di un modello statistico. Non rivela informazioni sulla relazione di causalità tra le variabili indipendenti e dipendenti Variabile dipendente Una variabile dipendente è quella che cambierà a seconda del valore di un'altra variabile, chiamata variabile indipendente. e non indica la correttezza del modello di regressione. Pertanto, l'utente dovrebbe sempre trarre conclusioni sul modello analizzando il coefficiente di determinazione insieme ad altre variabili in un modello statistico.

Il coefficiente di determinazione può assumere qualsiasi valore compreso tra 0 e 1. Inoltre, la metrica statistica è spesso espressa in percentuale.

Interpretazione del coefficiente di determinazione (R²)

L'interpretazione più comune del coefficiente di determinazione è il modo in cui il modello di regressione si adatta ai dati osservati. Ad esempio, un coefficiente di determinazione del 60% mostra che il 60% dei dati si adatta al modello di regressione. Generalmente, un coefficiente più alto indica una migliore vestibilità per il modello.

Tuttavia, non è sempre vero che un r quadrato elevato sia positivo per il modello di regressione. La qualità del coefficiente dipende da diversi fattori, incluse le unità di misura delle variabili, la natura delle variabili impiegate nel modello e la trasformazione dei dati applicata. Pertanto, a volte, un coefficiente elevato può indicare problemi con il modello di regressione.

Nessuna regola universale disciplina come incorporare il coefficiente di determinazione nella valutazione di un modello. Il contesto in cui si basa la previsione o l'esperimento è estremamente importante e, in diversi scenari, le intuizioni della metrica statistica possono variare.

Calcolo del coefficiente

Matematicamente, il coefficiente di determinazione può essere trovato utilizzando la seguente formula:

Formula

Dove:

  • Regressione SS - la somma dei quadrati dovuta alla regressione (somma dei quadrati spiegata)
  • SS totale - la somma totale dei quadrati

Sebbene i termini "somma totale dei quadrati" e "somma dei quadrati dovuta alla regressione" sembrino confusi, i significati delle variabili sono semplici.

La somma totale dei quadrati misura la variazione dei dati osservati (dati utilizzati nei modelli di regressione). La somma dei quadrati dovuta alla regressione misura quanto bene il modello di regressione rappresenta i dati utilizzati per la modellazione.

Più risorse

Finance è il fornitore ufficiale della certificazione FMVA® Global Modeling & Valuation Analyst (FMVA) ™ Unisciti a oltre 350.600 studenti che lavorano per aziende come Amazon, JP Morgan e il programma di certificazione Ferrari, progettato per aiutare chiunque a diventare un analista finanziario di livello mondiale . Per continuare ad apprendere e far progredire la tua carriera, le risorse finanziarie aggiuntive di seguito saranno utili:

  • Concetti di statistica di base in finanza Concetti di statistica di base per la finanza Una solida comprensione delle statistiche è di fondamentale importanza per aiutarci a comprendere meglio la finanza. Inoltre, i concetti statistici possono aiutare gli investitori a monitorare
  • Distribuzione binomiale Distribuzione binomiale La distribuzione binomiale è una distribuzione di probabilità comune che modella la probabilità di ottenere uno dei due risultati sotto un dato numero di parametri
  • Teorema del limite centrale Teorema del limite centrale Il teorema del limite centrale afferma che la media campionaria di una variabile casuale assumerà una distribuzione quasi normale o normale se la dimensione del campione è grande
  • Analisi di regressione Analisi di regressione L'analisi di regressione è un insieme di metodi statistici utilizzati per la stima delle relazioni tra una variabile dipendente e una o più variabili indipendenti. Può essere utilizzato per valutare la forza della relazione tra le variabili e per modellare la relazione futura tra di loro.

Raccomandato

Cosa sono le quote di importazione?
Cos'è la liquidità?
Cos'è un paradiso fiscale?