Cos'è LASSO?

LASSO, abbreviazione di Least Absolute Shrinkage and Selection Operator, è una formula statistica il cui scopo principale è la selezione delle caratteristiche e la regolarizzazione dei modelli di dati. Il metodo è stato introdotto per la prima volta nel 1996 dal professor Robert Tibshirani di statistica. LASSO introduce parametri alla somma di un modello, dandogli un limite superiore che funge da vincolo per la somma per includere parametri assoluti all'interno di un intervallo consentito.

lazo

Il metodo LASSO regolarizza i parametri del modello riducendo i coefficienti di regressione, riducendone alcuni a zero. La fase di selezione delle caratteristiche avviene dopo il restringimento, dove ogni valore diverso da zero viene selezionato per essere utilizzato nel modello. Questo metodo è significativo per ridurre al minimo gli errori di previsione comuni nei modelli statistici Analisi quantitativa L'analisi quantitativa è il processo di raccolta e valutazione di dati misurabili e verificabili quali ricavi, quota di mercato e salari al fine di comprendere il comportamento e le prestazioni di un attività commerciale. Nell'era della tecnologia dei dati, l'analisi quantitativa è considerata l'approccio preferito per prendere decisioni informate. .

LASSO offre modelli con elevata precisione di previsione. La precisione aumenta poiché il metodo include il restringimento dei coefficienti, che in cambio riduce la varianza e minimizza il bias. Funziona al meglio quando il numero di osservazioni è basso e il numero di caratteristiche è alto. Si basa molto sul parametro λ, che è il fattore di controllo della contrazione. Più grande diventa λ, quindi più coefficienti sono forzati a essere zero.

Quando λ è uguale a zero, il modello diventa la regressione dei minimi quadrati ordinari. Di conseguenza, quando λ aumenta, la varianza diminuisce in modo significativo e aumenta anche la distorsione nel risultato. Lazo è anche uno strumento utile per eliminare tutte le variabili irrilevanti e che non sono correlate alla variabile di risposta.

LASSO nei modelli lineari statistici

Un modello statistico è una rappresentazione matematica reale di un problema. Il modello dovrebbe esprimere il problema il più fedelmente possibile al mondo reale rendendolo semplice e di facile comprensione. Un modello è composto da variabili esplicative e di risposta.

La variabile esplicativa è una variabile indipendente che è a discrezione del ricercatore. Le variabili indipendenti sono gli input nel modello che possono essere misurati dal ricercatore per determinare il loro effetto sui risultati del modello.

La variabile di risposta è una variabile dipendente Variabile dipendente Una variabile dipendente è quella che cambierà a seconda del valore di un'altra variabile, chiamata variabile indipendente. che costituisce l'obiettivo principale dell'esperimento. Costituisce il risultato dell'esperimento, che può essere un unico risultato nel caso di modelli univariati o, nel caso di modelli multivariati, più risultati.

LASSO costituisce parte integrante del processo di costruzione del modello, in particolare utilizzando la selezione delle caratteristiche. La fase di selezione delle caratteristiche aiuta nella selezione delle variabili esplicative, che sono le variabili indipendenti e, quindi, le variabili di input nel modello.

Le variabili di input sono elementi importanti che determinano l'output del modello e che aiutano nella misurazione del loro effetto sulle variabili di risposta. La scelta delle giuste variabili determina l'accuratezza del modello. La fase di selezione delle caratteristiche del LASSO aiuta nella corretta selezione delle variabili.

Stima con LASSO

I modelli statistici si basano su LASSO per un'accurata selezione e regolarizzazione delle variabili. Nella regressione lineare Analisi della regressione L'analisi della regressione è un insieme di metodi statistici utilizzati per la stima delle relazioni tra una variabile dipendente e una o più variabili indipendenti. Può essere utilizzato per valutare la forza della relazione tra le variabili e per modellare la relazione futura tra di loro. , ad esempio, LASSO introduce un limite superiore per la somma dei quadrati, minimizzando così gli errori presenti nel modello. Lo stimatore LASSO dipende dal parametro λ.

Il parametro λ controlla la forza del ritiro, dove un aumento di λ si traduce in un aumento del ritiro. Il limite superiore della somma di tutti i coefficienti è inversamente proporzionale al parametro λ. Quando il limite superiore aumenta di valore, il parametro λ diminuisce. Quando il limite superiore diminuisce, il parametro λ aumenta simultaneamente.

Man mano che il limite superiore aumenta verso l'infinito, il parametro λ si avvicina a zero, convertendo quindi l'esperimento in un Minimi quadrati ordinari, dove il parametro λ è sempre uguale a zero. Quando i coefficienti del limite superiore si avvicinano allo zero, il valore del parametro λ aumenta verso l'infinito.

Geometria LASSO

LASSO forma una forma a diamante nel grafico per la sua regione di vincolo, come mostrato nell'immagine sotto. La forma a diamante include angoli, a differenza della forma circolare formata dalla regressione della cresta. La vicinanza del primo punto all'angolo mostra che il modello viene fornito con un coefficiente, che è uguale a zero.

La regione dei vincoli di regressione della cresta forma una forma circolare che non include angoli simili a quella formata dalla regione dei vincoli LASSO quando viene tracciata. I coefficienti di regressione della cresta possono quindi non essere uguali a zero.

LASSO ponderato

Weighted LASSO è il risultato di un ricercatore che ha penalizzato isolatamente i coefficienti di regressione. Ciò significa che invece di penalizzare un parametro comune λ a tutti i coefficienti, i coefficienti vengono penalizzati individualmente, utilizzando parametri differenti.

I pesi possono essere determinati utilizzando un algoritmo LASSO per assegnare i pesi in modo appropriato per una modellazione accurata. Analoga ponderazione dei coefficienti di regressione è la cooperativa LASSO, dove i coefficienti sono penalizzati in gruppi ritenuti simili.

Risorse addizionali

Finance è il fornitore ufficiale della certificazione CBCA ™ Certified Banking & Credit Analyst (CBCA) ™ L'accreditamento Certified Banking & Credit Analyst (CBCA) ™ è uno standard globale per gli analisti del credito che copre finanza, contabilità, analisi del credito, analisi del flusso di cassa, modelli di alleanze, rimborsi di prestiti e altro ancora. programma di certificazione, progettato per trasformare chiunque in un analista finanziario di livello mondiale.

Per continuare ad apprendere e sviluppare la tua conoscenza dell'analisi finanziaria, consigliamo vivamente le risorse finanziarie aggiuntive riportate di seguito:

  • Metodi di previsione Metodi di previsione Principali metodi di previsione. In questo articolo, spiegheremo quattro tipi di metodi di previsione dei ricavi che gli analisti finanziari utilizzano per prevedere i ricavi futuri.
  • Variabile indipendente Variabile indipendente Una variabile indipendente è un input, un'ipotesi o un fattore determinante che viene modificato per valutare il suo impatto su una variabile dipendente (il risultato).
  • Regressione multipla lineare Regressione lineare multipla La regressione lineare multipla si riferisce a una tecnica statistica utilizzata per prevedere il risultato di una variabile dipendente in base al valore delle variabili indipendenti
  • Analisi dello scenario Analisi dello scenario L'analisi dello scenario è una tecnica utilizzata per analizzare le decisioni speculando vari possibili risultati negli investimenti finanziari. Nella modellazione finanziaria, questo

Raccomandato

Crackstreams è stato chiuso?
2022
Il centro di comando MC è sicuro?
2022
Taliesin sta lasciando il ruolo critico?
2022