Prendiamo due variabili sul FTSEMIB, Intesa ed UC ad esempio, e sviluppiamo la teoria (correlazione, VaR, probabilità etc..etc..)
Secondo me con esempi concreti capiamo meglio.
Insomma, devi partire dall'inizio ed ampliare.
A che ci servono queste copule?
O, perchè su NfA sostieni che Li ha sbagliato a usare una gaussiana piuttosto che usare una t student (magari si potrebbe fare un esempio con i nostri bond)
Insomma, basta che ci fai esempi concreti e che possiamo capire.
Prima di fare esempi concreti bisogna dare qualche rudimento di teoria. I formalismi sono alquanto complicati (mi ricordo un infernale libro di Nelsen al riguardo), cercherò nei limiti di fornire l'
intuition behind.
Detta in maniera rozza, una copula è una distribuzione multivariata di probabilità. E' quindi una funzione che, come prima caratteristica di rilievo restituisce una misura di probabilità di un evento congiunto. Chiaro? No ovviamente, anche perché prima bisogna spiegare cosa si intende per "evento congiunto". Ad esempio, un evento congiunto è: il rendimento di Unicredito domani èmaggiore del 3% e quello di Intesa èminore del 2%. Questo evento o scenario che dir si voglia ha una probabilità, ed è esattamente ciò che la copula esprime. Fin qui, a ben vedere, non c'è niente di nuovo. Anche una distribuzione Normale multivariata fornisce la stessa informazione. Vero ma con una importante differenza: se la distribuzione congiunta è una Normale multivariata implicitamente affermiamo che anche le distribuzione marginali di Intesa e Unicredito, singolarmente considerate, devono essere Normali. Questa, all'atto pratico, può essere una forte limitazione. Intesa infatti potrebbe avere una dinamica diffusiva con salti esponenziali, mentre Unicredito potrebbe evolvere secondo un processo
variance-gamma: in sintesi, le loro distribuzioni potrebbero essere (e, nei fatti, spessissimo lo sono) differenti. Ma se le loro specifiche distribuzioni appartengono a famiglie differenti, come si può ricavare o anche solo rappresentare la struttura di correlazione fra Intesa e Unicredito? Non certo tramite una Normale multivariata, giacchè, come si è appena detto, l'ipotesi è che né Intesa né Unicredito siano a loro volta Normali. Ecco, la copula torna utile a questo punto. C'è infatti un teorema che afferma:
a prescindere dalle distribuzioni marginali di Unicredito e Intesa, è possibile trovare una funzione copula che sia la distribuzione di probabilità congiunta di Unicredito e Intesa (e con questa bella enunciazione ci siamo condannati a essere inseguiti dal fantasma di Sklar per l'eternità ma fa niente). Quindi utilizzare l'approccio delle copule fornisce la massima flessibilità, dato che:
1) consente di trattare separatemente e specificamente le distribuzioni individuali (le marginali) delle serie, modellandole nel modo più opprtuno e che comunque fitta meglio i dati empirici;
2) permette di occuparsi della struttura di correlazione tra di esse in un secondo tempo, facendo salvi i risultati al punto 1).
Questo il quadro teorico (de' noantri...). Sul piano pratico esistono delle notevoli difficoltà. In primo luogo, ad ogni step della procedura descritta sopra bisogna eseguire verifiche di fitting, cercando il miglior modello sia per le marginali che per la copula. Insomma, è un problema di inferenza statistica: alla fine, quando si smanetta con dati empirici, si finisce sempre là. Ora basta spiegarlo a Taleb e poi siamo a posto
Sfortunatamente esistono N famiglie di copule:
ellittiche,
archimedee ma qui il discorso si fa troppo tecnico e quindi lascerò perdere. Mi limito a dire che, mentre nel caso di copule ellittiche le procedure ordinarie di stima ML si applicano in modo egregio (agevole" non mi sentirei di dirlo), nel caso delle copule archimedee,
quando le serie sono più di due, la faccenda si complica non poco. Nel pdf che ho postato nel primo messaggio troverete un po' d'informazioni al riguardo.
Come viene impattato il VaR dalle copule?
Semplice: attraverso la struttura di correlazione implicata dalla copula. Se la copula è stata selezionata in modo efficiente e descrive bene i dati empirici, la correlazione viene stimata in modo più robusto e dunque il VaR di un portafoglio viene calcolato più precisamente (speriamo che Embrechts non parli italiano e non capiti mai da queste parti).
Perché Li ha sbagliato a usare una copula gaussiana?
Non mi permetterei mai di affermare una cosa del genere. Mi permetto invece di affermarne una forse anche più grave: non si è mai posto seriamente il problema. Sono tuttora convinto che, da buon matematico, appena ha intravisto qualche forma chiusa si sia gettato a capofitto per arrivare il prima possibile e in modo elegante a qualche risultato "pubblicabile". Il punto è che non si è posto manco per sbaglio il problema di capire se i dati (ammesso e non concesso di avere dati attendibili, cosa non scontata quando si parla di default probability) rigettassero o accettassero l'ipotesi di gaussianità. Esattamente come avrebbe fatto la maggior parte dei matematici puri, niente di nuovo sotto il sole
Il mio commento su NFA era più che altro una
boutade , anche se non del tutto. Cerco di spiegarmi, e spero di farlo in fretta perché mi si stanno chiudendo gli occhi! Le copule non si limitano a separare il problema della stima delle "marginali" dalla struttura di correlazione: forniscono anche alcune misure di correlazione molto più robuste rispetto alla Pearson's correlation, che è quella più comunemente conosciuta e, ahimè, quasi universalmente usata. Una di queste misure, la più interessante a mio avviso a fini di risk management (e non solo), è la
tail dependence, che deve essere intesa (Andrew Patton tappati le orecchie please) come una misura di correlazione di coda: ossia, è una stima di quanto eventi estremi di Intesa e San Paolo siano tra loro dipendenti. Bene, la copula gaussiana sfortunatamente per costruzione ha una tail dependence nulla. Il che è come dire: escludiamo a priori che Intesa e Unicredito possano crashare domani tutt'e due oppure che il debito di Eni e di E.ON non venga ripagato. Siamo d'accordo che queste due tipi di eventi congiunti sono invece relativamente probabili? O che comunque imporre che la loro probabilità sia zero è un po' troppo cogente? Eppure una copula gaussiana questo tipo di scenario semplicemente non lo contempla. Descrive sì la correlazione tra le due serie, ma solo "in media", non "sulle code". Quindi, ragionavo su NFA, se il buon Li avesse deciso di utilizzare una copula t di Student, che non soffre di questo problema strutturale, magari avrebbe ottenuto stime di probabilità di eventi estremi un po' più realistiche e chissà, magari Lehman sarebbe ancora qua
Vabbè, questa è davvero una battuta, anzi una favola. E con questa vi saluto.
Buona notte a tutti.
TB