Che cos'è la regressione lineare multipla?

La regressione lineare multipla si riferisce a una tecnica statistica utilizzata per prevedere il risultato di una variabile in base al valore di due o più variabili. A volte è noto semplicemente come regressione multipla ed è un'estensione della regressione lineare. La variabile che vogliamo prevedere è nota come variabile dipendente, mentre le variabili che usiamo per prevedere il valore della variabile dipendente Variabile dipendente Una variabile dipendente è quella che cambierà a seconda del valore di un'altra variabile, chiamata variabile indipendente. sono note come variabili indipendenti o esplicative.

Regressione lineare multiplaFigura 1: previsioni del modello di regressione lineare multipla per singole osservazioni (fonte)

Sommario

  • La regressione lineare multipla si riferisce a una tecnica statistica che utilizza due o più variabili indipendenti per prevedere il risultato di una variabile dipendente.
  • La tecnica consente agli analisti di determinare la variazione del modello e il contributo relativo di ciascuna variabile indipendente nella varianza totale.
  • La regressione multipla può assumere due forme, ovvero regressione lineare e regressione non lineare.

Formula di regressione lineare multipla

Regressione lineare multipla - Formula

Dove:

  • yi è la variabile dipendente o prevedibile
  • β0 è l'intercetta y, cioè il valore di y quando sia xi che x2 sono 0.
  • β1 e β2 sono i coefficienti di regressione che rappresentano la variazione di y rispetto a una variazione di un'unità in xi1 e xi2 , rispettivamente.
  • βp è il coefficiente di pendenza per ogni variabile indipendente
  • ϵ è il termine di errore casuale (residuo) del modello.

Comprensione della regressione lineare multipla

La regressione lineare semplice consente agli statistici di prevedere il valore di una variabile utilizzando le informazioni disponibili su un'altra variabile. La regressione lineare tenta di stabilire la relazione tra le due variabili lungo una linea retta.

La regressione multipla è un tipo di regressione in cui la variabile dipendente mostra una relazione lineare con due o più variabili indipendenti. Può anche essere non lineare , in cui le variabili dipendenti e indipendenti Variabile indipendente Una variabile indipendente è un input, un'ipotesi o un driver che viene modificato per valutare il suo impatto su una variabile dipendente (il risultato). non seguire una linea retta.

Sia la regressione lineare che quella non lineare tracciano una risposta particolare utilizzando due o più variabili graficamente. Tuttavia, la regressione non lineare è solitamente difficile da eseguire, poiché viene creata da ipotesi derivate da tentativi ed errori.

Presupposti di regressione lineare multipla

La regressione lineare multipla si basa sui seguenti presupposti:

1. Una relazione lineare tra le variabili dipendenti e indipendenti

La prima ipotesi di regressione lineare multipla è che esiste una relazione lineare tra la variabile dipendente e ciascuna delle variabili indipendenti. Il modo migliore per verificare le relazioni lineari è creare grafici a dispersione e quindi ispezionare visivamente i grafici a dispersione per verificarne la linearità. Se la relazione visualizzata nel grafico a dispersione non è lineare, l'analista dovrà eseguire una regressione non lineare o trasformare i dati utilizzando un software statistico, come SPSS.

2. Le variabili indipendenti non sono altamente correlate tra loro

I dati non dovrebbero mostrare la multicollinearità, che si verifica quando le variabili indipendenti (variabili esplicative) sono altamente correlate tra loro. Quando le variabili indipendenti mostrano multicollinearità, ci saranno problemi nel capire la variabile specifica che contribuisce alla varianza nella variabile dipendente. Il metodo migliore per verificare l'ipotesi è il metodo del fattore di inflazione della varianza.

3. La varianza dei residui è costante

La regressione lineare multipla presuppone che la quantità di errore nei residui sia simile in ogni punto del modello lineare. Questo scenario è noto come omoschedasticità. Durante l'analisi dei dati, l'analista deve tracciare i residui standardizzati rispetto ai valori previsti per determinare se i punti sono distribuiti equamente tra tutti i valori delle variabili indipendenti. Per verificare l'ipotesi, i dati possono essere tracciati su un grafico a dispersione o utilizzando un software statistico per produrre un grafico a dispersione che include l'intero modello.

4. Indipendenza di osservazione

Il modello presuppone che le osservazioni debbano essere indipendenti l'una dall'altra. In poche parole, il modello assume che i valori dei residui siano indipendenti. Per verificare questa ipotesi, utilizziamo la statistica di Durbin Watson.

Il test mostrerà valori da 0 a 4, dove un valore da 0 a 2 mostra un'autocorrelazione positiva, mentre i valori da 2 a 4 mostrano un'autocorrelazione negativa. Il punto medio, cioè un valore di 2, mostra che non c'è autocorrelazione.

5. Normalità multivariata

La normalità multivariata si verifica quando i residui sono normalmente distribuiti. Per verificare questa ipotesi, guarda come sono distribuiti i valori dei residui. Può anche essere testato utilizzando due metodi principali, ovvero un istogramma con una curva normale sovrapposta o il metodo del grafico di probabilità normale.

Più risorse

Finance offre la certificazione CBCA ™ Certified Banking & Credit Analyst (CBCA) ™ L'accreditamento Certified Banking & Credit Analyst (CBCA) ™ è uno standard globale per gli analisti del credito che copre finanza, contabilità, analisi del credito, analisi del flusso di cassa, modelli di covenant, prestito rimborsi e altro ancora. programma di certificazione per coloro che desiderano portare la propria carriera a un livello superiore. Per continuare ad apprendere e sviluppare la tua knowledge base, esplora le ulteriori risorse finanziarie pertinenti di seguito:

  • Metodi di previsione Metodi di previsione Principali metodi di previsione. In questo articolo, spiegheremo quattro tipi di metodi di previsione dei ricavi che gli analisti finanziari utilizzano per prevedere i ricavi futuri.
  • Distribuzione di Poisson Distribuzione di Poisson La distribuzione di Poisson è uno strumento utilizzato nelle statistiche della teoria della probabilità per prevedere l'entità della variazione da un tasso medio
  • Variabile casuale Variabile casuale Una variabile casuale (variabile stocastica) è un tipo di variabile nelle statistiche i cui valori possibili dipendono dai risultati di un certo fenomeno casuale
  • Analisi di regressione Analisi di regressione L'analisi di regressione è un insieme di metodi statistici utilizzati per la stima delle relazioni tra una variabile dipendente e una o più variabili indipendenti. Può essere utilizzato per valutare la forza della relazione tra le variabili e per modellare la relazione futura tra di loro.

Raccomandato

Cos'è la funzione di probabilità F.TEST?
Che cos'è il rapporto Avviso al lettore?
Modello di decalcolo delle imposte sulle vendite