Cos'è l'R-quadrato aggiustato?

L'R-quadrato aggiustato è una versione modificata dell'R-quadrato che tiene conto dei predittori che non sono significativi in ​​un modello di regressione. In altre parole, l'R-quadrato corretto mostra se l'aggiunta di predittori aggiuntivi migliora o meno un modello di regressione. Per comprendere l'R-quadrato aggiustato, è necessaria una comprensione dell'R-quadrato.

Sommario:

  • L'R-quadrato aggiustato è una versione modificata dell'R-quadrato che si adatta ai predittori che non sono significativi in ​​un modello di regressione.
  • Rispetto a un modello con variabili di input aggiuntive, un R-quadrato aggiustato inferiore indica che le variabili di input aggiuntive non aggiungono valore al modello.
  • Rispetto a un modello con variabili di input aggiuntive, un R-quadrato corretto più alto indica che le variabili di input aggiuntive stanno aggiungendo valore al modello.

Cos'è l'R quadrato?

L'R-quadrato, chiamato anche coefficiente di determinazione Coefficiente di determinazione Un coefficiente di determinazione (R² o r-quadrato) è una misura statistica in un modello di regressione che determina la proporzione di varianza nel dipendente, viene utilizzato per spiegare il grado di quali variabili di input (variabili predittive) spiegano la variazione delle variabili di output (variabili predette). Va da 0 a 1. Ad esempio, se R quadrato è 0,9, indica che il 90% della variazione nelle variabili di output è spiegato dalle variabili di input. In generale, un R quadrato più alto indica una migliore vestibilità per il modello. Considera il seguente diagramma:

R quadrato rettificato

La linea blu si riferisce alla linea di migliore adattamento e mostra la relazione tra le variabili. La linea viene calcolata tramite analisi di regressione Analisi di regressione L'analisi di regressione è un insieme di metodi statistici utilizzati per la stima delle relazioni tra una variabile dipendente e una o più variabili indipendenti. Può essere utilizzato per valutare la forza della relazione tra le variabili e per modellare la relazione futura tra di loro. e viene tracciato dove le distanze verticali (linee tratteggiate blu) dei punti gialli rispetto alla linea di migliore adattamento sono ridotte al minimo.

I punti gialli si riferiscono al grafico delle variabili di input e output. La variabile di input viene tracciata sull'asse x mentre la variabile di output viene tracciata sull'asse y. Ad esempio, il grafico sopra è costituito dal seguente set di dati:

R quadrato rettificato - Dati del grafico

Le linee tratteggiate blu si riferiscono alla distanza del grafico delle variabili di input e output dalla linea di adattamento migliore. L'R-quadrato è derivato dalla distanza di tutti i punti gialli dalla linea di migliore adattamento (la linea blu). Ad esempio, il diagramma seguente illustrerebbe un R quadrato di 1:

R quadrato 1

Problemi con l'R quadrato

R-quadrato presenta un problema intrinseco: variabili di input aggiuntive faranno sì che l'R-quadrato rimanga lo stesso o aumenterà (questo è dovuto al modo in cui viene calcolato matematicamente l'R-quadrato). Pertanto, anche se le variabili di input aggiuntive non mostrano alcuna relazione con le variabili di output, l'R-quadrato aumenterà. Di seguito viene fornito un esempio che spiega tale evento.

Capire l'R-quadrato aggiustato

Essenzialmente, l'R-quadrato aggiustato controlla se variabili di input aggiuntive stanno contribuendo al modello. Considera un esempio utilizzando i dati raccolti da un proprietario di pizza, come mostrato di seguito:

Dati di esempio

Supponiamo che il proprietario della pizza esegua due regressioni:

Regressione 1: prezzo dell'impasto (variabile di input), prezzo della pizza (variabile di output)

La regressione 1 produce un R quadrato di 0,9557 e un R quadrato aggiustato di 0,9493.

Regressione 2: temperatura (variabile di input 1), prezzo dell'impasto (variabile di input 2), prezzo della pizza (variabile di output)

La regressione 2 produce un R quadrato di 0,9573 e un R quadrato aggiustato di 0,9431.

Sebbene la temperatura non debba esercitare alcun potere predittivo sul prezzo di una pizza, l'R quadrato è passato da 0,9557 (Regressione 1) a 0,9573 (Regressione 2). Una persona può credere che la regressione 2 abbia un potere predittivo maggiore poiché l'R-quadrato è più alto. Anche se la variabile di ingresso della temperatura è inutile per prevedere il prezzo di una pizza, ha aumentato l'R quadrato. Qui, entra in gioco l'R-quadrato corretto.

L'R-quadrato aggiustato controlla se le variabili di input aggiuntive stanno contribuendo al modello. L'R-quadrato aggiustato nella regressione 1 era 0,9493 rispetto all'R-quadrato aggiustato nella regressione 2 di 0,9493. Pertanto, l'R-quadrato corretto è in grado di identificare che la variabile di input della temperatura non è utile per spiegare la variabile di output (il prezzo di una pizza). In tal caso, l'R-quadrato corretto indicherebbe il creatore del modello a utilizzare la regressione 1 anziché la regressione 2.

Esempio di R quadrato rettificato

Considera due modelli:

  • Il modello 1 utilizza le variabili di input X1, X2 e X3 per prevedere Y1.
  • Il modello 2 utilizza le variabili di input X1 e X2 per prevedere Y1.

Quale modello dovrebbe essere utilizzato? Di seguito vengono fornite le informazioni relative a entrambi i modelli:

Esempio

Confrontando l'R-quadrato tra il Modello 1 e il Modello 2, l'R-quadrato prevede che il Modello 1 sia un modello migliore in quanto ha un maggiore potere esplicativo (0,5923 nel Modello 1 contro 0,5612 nel Modello 2).

Confrontando l'R-quadrato tra il Modello 1 e il Modello 2, l'R-quadrato aggiustato prevede che la variabile di input X3 contribuisca a spiegare la variabile di output Y1 (0,4231 nel Modello 1 contro 0,3512 nel Modello 2).

Come tale, dovrebbe essere utilizzato il Modello 1, poiché la variabile di input X3 aggiuntiva contribuisce a spiegare la variabile di output Y1.

Risorse addizionali

Finance offre la certificazione FMVA® Financial Modeling & Valuation Analyst (FMVA) ™ Unisciti a oltre 350.600 studenti che lavorano per aziende come Amazon, JP Morgan e il programma di certificazione Ferrari per coloro che desiderano portare la propria carriera a un livello superiore. Per continuare ad apprendere e far progredire la tua carriera, saranno utili le seguenti risorse finanziarie:

  • Concetti di statistica di base per la finanza Concetti di statistica di base per la finanza Una solida comprensione delle statistiche è di fondamentale importanza per aiutarci a comprendere meglio la finanza. Inoltre, i concetti statistici possono aiutare gli investitori a monitorare
  • Metodo alto-basso vs. analisi di regressione Metodo alto-basso vs. analisi di regressione Il metodo alto-basso e l'analisi di regressione sono i due principali metodi di stima dei costi utilizzati per stimare gli importi dei costi fissi e variabili. Di solito, i manager devono suddividere i costi misti nelle loro componenti fisse e variabili per prevedere e pianificare il futuro.
  • Variabile indipendente Variabile indipendente Una variabile indipendente è un input, un'ipotesi o un fattore determinante che viene modificato per valutare il suo impatto su una variabile dipendente (il risultato).
  • Tipi di analisi finanziaria Tipi di analisi finanziaria L'analisi finanziaria implica l'utilizzo di dati finanziari per valutare le prestazioni di un'azienda e formulare raccomandazioni su come migliorarle in futuro. Gli analisti finanziari svolgono principalmente il loro lavoro in Excel, utilizzando un foglio di calcolo per analizzare i dati storici e fare proiezioni Tipi di analisi finanziaria

Raccomandato

Cos'è una chiamata di margine?
Cosa sono le capacità analitiche?
Qual è il valore attuale delle opportunità di crescita?