Copule (non nel senso dell'italiano medio)

TheBear

Nuovo Utente
Registrato
5/12/11
Messaggi
238
Punti reazioni
7
Cominciamo da qui:

http://tesi.cab.unipd.it/385/1/zilio.pdf

Ho dato una rapida occhiata, mi sembra tutto chiaro e ben svolto. Il relatore poi è il prof. Orsi, il che è una garanzia.

Appena trovo due minuti cerco di esplicare ed ampliare, voi nel frattempo studiate.

P.S. Regalino per Cren: la tesi postata sopra è piena zeppa di codici R
 
Grande!!!!!!

Aggiungo, per la felicità di grandi e piccini (Cren), applicazioni "pratiche" ed un paio di introduzioni al concetto.

TB se ti serve materiale didattico chiedi..
 

Allegati

  • r_qt0503ita_g.pdf
    157,8 KB · Visite: 1.095
  • discussione copula Li.pdf
    204,6 KB · Visite: 1.001
  • Romano.pdf
    262,8 KB · Visite: 3.689
Ciao a tutti (tutti, al massimo saremo in tre). In questo momento sono veramente sott'acqua qui a lavoro, e l'argomento è enorme. Forse la cosa migliore è che formuliate domande specifiche sul tema e io provo a rispondere (sottolineo "provo", ho una certa età e mi arrugginisco anch'io).

A più tardi.

TB
 
Ciao a tutti (tutti, al massimo saremo in tre). In questo momento sono veramente sott'acqua qui a lavoro, e l'argomento è enorme. Forse la cosa migliore è che formuliate domande specifiche sul tema e io provo a rispondere (sottolineo "provo", ho una certa età e mi arrugginisco anch'io).

A più tardi.

TB

Prendiamo due variabili sul FTSEMIB, Intesa ed UC ad esempio, e sviluppiamo la teoria (correlazione, VaR, probabilità etc..etc..)

Secondo me con esempi concreti capiamo meglio.

Insomma, devi partire dall'inizio ed ampliare.

A che ci servono queste copule?

O, perchè su NfA sostieni che Li ha sbagliato a usare una gaussiana piuttosto che usare una t student (magari si potrebbe fare un esempio con i nostri bond)

Insomma, basta che ci fai esempi concreti e che possiamo capire.:)
 
Prendiamo due variabili sul FTSEMIB, Intesa ed UC ad esempio, e sviluppiamo la teoria (correlazione, VaR, probabilità etc..etc..)

Secondo me con esempi concreti capiamo meglio.

Insomma, devi partire dall'inizio ed ampliare.

A che ci servono queste copule?

O, perchè su NfA sostieni che Li ha sbagliato a usare una gaussiana piuttosto che usare una t student (magari si potrebbe fare un esempio con i nostri bond)

Insomma, basta che ci fai esempi concreti e che possiamo capire.:)

Prima di fare esempi concreti bisogna dare qualche rudimento di teoria. I formalismi sono alquanto complicati (mi ricordo un infernale libro di Nelsen al riguardo), cercherò nei limiti di fornire l'intuition behind.
Detta in maniera rozza, una copula è una distribuzione multivariata di probabilità. E' quindi una funzione che, come prima caratteristica di rilievo restituisce una misura di probabilità di un evento congiunto. Chiaro? No ovviamente, anche perché prima bisogna spiegare cosa si intende per "evento congiunto". Ad esempio, un evento congiunto è: il rendimento di Unicredito domani èmaggiore del 3% e quello di Intesa èminore del 2%. Questo evento o scenario che dir si voglia ha una probabilità, ed è esattamente ciò che la copula esprime. Fin qui, a ben vedere, non c'è niente di nuovo. Anche una distribuzione Normale multivariata fornisce la stessa informazione. Vero ma con una importante differenza: se la distribuzione congiunta è una Normale multivariata implicitamente affermiamo che anche le distribuzione marginali di Intesa e Unicredito, singolarmente considerate, devono essere Normali. Questa, all'atto pratico, può essere una forte limitazione. Intesa infatti potrebbe avere una dinamica diffusiva con salti esponenziali, mentre Unicredito potrebbe evolvere secondo un processo variance-gamma: in sintesi, le loro distribuzioni potrebbero essere (e, nei fatti, spessissimo lo sono) differenti. Ma se le loro specifiche distribuzioni appartengono a famiglie differenti, come si può ricavare o anche solo rappresentare la struttura di correlazione fra Intesa e Unicredito? Non certo tramite una Normale multivariata, giacchè, come si è appena detto, l'ipotesi è che né Intesa né Unicredito siano a loro volta Normali. Ecco, la copula torna utile a questo punto. C'è infatti un teorema che afferma: a prescindere dalle distribuzioni marginali di Unicredito e Intesa, è possibile trovare una funzione copula che sia la distribuzione di probabilità congiunta di Unicredito e Intesa (e con questa bella enunciazione ci siamo condannati a essere inseguiti dal fantasma di Sklar per l'eternità ma fa niente). Quindi utilizzare l'approccio delle copule fornisce la massima flessibilità, dato che:
1) consente di trattare separatemente e specificamente le distribuzioni individuali (le marginali) delle serie, modellandole nel modo più opprtuno e che comunque fitta meglio i dati empirici;
2) permette di occuparsi della struttura di correlazione tra di esse in un secondo tempo, facendo salvi i risultati al punto 1).

Questo il quadro teorico (de' noantri...). Sul piano pratico esistono delle notevoli difficoltà. In primo luogo, ad ogni step della procedura descritta sopra bisogna eseguire verifiche di fitting, cercando il miglior modello sia per le marginali che per la copula. Insomma, è un problema di inferenza statistica: alla fine, quando si smanetta con dati empirici, si finisce sempre là. Ora basta spiegarlo a Taleb e poi siamo a posto :D
Sfortunatamente esistono N famiglie di copule: ellittiche, archimedee ma qui il discorso si fa troppo tecnico e quindi lascerò perdere. Mi limito a dire che, mentre nel caso di copule ellittiche le procedure ordinarie di stima ML si applicano in modo egregio (agevole" non mi sentirei di dirlo), nel caso delle copule archimedee, quando le serie sono più di due, la faccenda si complica non poco. Nel pdf che ho postato nel primo messaggio troverete un po' d'informazioni al riguardo.

Come viene impattato il VaR dalle copule?
Semplice: attraverso la struttura di correlazione implicata dalla copula. Se la copula è stata selezionata in modo efficiente e descrive bene i dati empirici, la correlazione viene stimata in modo più robusto e dunque il VaR di un portafoglio viene calcolato più precisamente (speriamo che Embrechts non parli italiano e non capiti mai da queste parti).

Perché Li ha sbagliato a usare una copula gaussiana?
Non mi permetterei mai di affermare una cosa del genere. Mi permetto invece di affermarne una forse anche più grave: non si è mai posto seriamente il problema. Sono tuttora convinto che, da buon matematico, appena ha intravisto qualche forma chiusa si sia gettato a capofitto per arrivare il prima possibile e in modo elegante a qualche risultato "pubblicabile". Il punto è che non si è posto manco per sbaglio il problema di capire se i dati (ammesso e non concesso di avere dati attendibili, cosa non scontata quando si parla di default probability) rigettassero o accettassero l'ipotesi di gaussianità. Esattamente come avrebbe fatto la maggior parte dei matematici puri, niente di nuovo sotto il sole :)
Il mio commento su NFA era più che altro una boutade , anche se non del tutto. Cerco di spiegarmi, e spero di farlo in fretta perché mi si stanno chiudendo gli occhi! Le copule non si limitano a separare il problema della stima delle "marginali" dalla struttura di correlazione: forniscono anche alcune misure di correlazione molto più robuste rispetto alla Pearson's correlation, che è quella più comunemente conosciuta e, ahimè, quasi universalmente usata. Una di queste misure, la più interessante a mio avviso a fini di risk management (e non solo), è la tail dependence, che deve essere intesa (Andrew Patton tappati le orecchie please) come una misura di correlazione di coda: ossia, è una stima di quanto eventi estremi di Intesa e San Paolo siano tra loro dipendenti. Bene, la copula gaussiana sfortunatamente per costruzione ha una tail dependence nulla. Il che è come dire: escludiamo a priori che Intesa e Unicredito possano crashare domani tutt'e due oppure che il debito di Eni e di E.ON non venga ripagato. Siamo d'accordo che queste due tipi di eventi congiunti sono invece relativamente probabili? O che comunque imporre che la loro probabilità sia zero è un po' troppo cogente? Eppure una copula gaussiana questo tipo di scenario semplicemente non lo contempla. Descrive sì la correlazione tra le due serie, ma solo "in media", non "sulle code". Quindi, ragionavo su NFA, se il buon Li avesse deciso di utilizzare una copula t di Student, che non soffre di questo problema strutturale, magari avrebbe ottenuto stime di probabilità di eventi estremi un po' più realistiche e chissà, magari Lehman sarebbe ancora qua :) :) :) Vabbè, questa è davvero una battuta, anzi una favola. E con questa vi saluto.

Buona notte a tutti.

TB
 
'Azz..!

L'orsetto s'è lanciato :D

Sintetico:
  1. avete la probabilità che si verifichi l'evento "a" a = Pr[X = a] e la probabilità che si verifichi l'evento "b" b = Pr[X = b];
  2. calcolate la correlazione tra i due eventi a e b;
  3. trovate i quantili della Normale standard che corrispondono a queste probabilità;
  4. mettete i due quantili e la matrice di correlazione in una Normale multivariata e graficate la funzione di ripartizione. Da questa ricavate la funzione di densità. Ricordo che in una Normale standard multivariata la matrice di correlazione è uguale alla matrice delle covarianze;
  5. dalla vostra superficie 3D all'intersezione degli assi adesso avete la probabilità congiunta che le due variabili aleatorie di cui al punto 1 cadano congiuntamente su determinati quantili. Poichè questi quantili sono associati univocamente alle probabilità a e b di partenza, avete che sull'asse verticale leggete la probabilità congiunta dei due eventi.
La metodologia appena descritta è essenziale per gestire il rischio di credito, dove il vero problema è capire qual è la probabilità di finire in fondo alla coda sinistra della p.d.f. di P&L, non tanto contenere la volatilità delle variazioni di prezzo, visto che questa si "spegne" via via che ci si avvicina alla scadenza (perpetue escluse).

Maggiore è la correlazione tra le variabili aleatorie incluse nella copula, più il "contorno" della superficie tende a decentrarsi rispetto ad un cerchio perfetto (correlazione nulla) per assumere forme ellittiche che evidenziano come i casi di movimenti congiunti siano più probabili.

Gaussian_copula_gaussian_marginals.png


WindowsLiveWriterWhatsaGaussianCopulavideocredit_9C55captured_Image.png

P.S.: la Normale multivariata è comoda perchè nel caso standard viene ad essere descritta interamente dalla sua matrice di correlazione, senza necessità di inferire alcun grado di libertà dai dati (se non la matrice di correlazione, appunto).
 
Ultima modifica:
In sostanza io ho capito che è una matrice di probabilità condizionate. Ci sono?
 
Domanda da ignorante, prendendo come esempio un thread aperto in AT;

nello spread trading, pearson non è un tantino fuori luogo?

Ovvero, meglio, non è assolutamente inutile (come la cointegrazione imho..)?

Potrebbe essere più indicato l'utilizzo di copule?
 
Pearson è una correlazione in media. E' fratello della Regressione Lineare e dell'R2.

Se tu dividessi i rendimenti dei titoli A e B per quantili e tu andassi a esaminare le code, li' troveresti troppi casi congiunti rispetto a Pearson.

Inoltre penso, la superficie non sarebbe simmetrica.
 
Cioè, riferendomi a quel 3d della sezione AT, io ragionerei così:

- divido i rendimenti giornalieri dei 2 titoli in classi, poniamo di ampiezza 0,5% per fissare un numero.

- calcolo quindi le due distribuzioni non condizionate.

- per ogni classe del titolo A calcolo la distribuzione condizionata di B
- per ogni classe di B calcolo la distribuzione condizionata di A

A questo punto dovrei poter calcolare il valore atteso della mia scommessa

:mmmm:
 
Domanda da ignorante, prendendo come esempio un thread aperto in AT;

nello spread trading, pearson non è un tantino fuori luogo?

Ovvero, meglio, non è assolutamente inutile (come la cointegrazione imho..)?

Potrebbe essere più indicato l'utilizzo di copule?

In generale, qualsiasi misura più robusta di correlazione dovrebbe essere preferita. Com'è noto, la Pearson's correlation esprime una correlazione lineare, che dunque va bene quanto più la distribuzione (congiunta) di due serie è simile a una Normale (bivariata). Se invece la distribuzione congiunta di due variabili è pesantemente non gaussiana, sarebbe più opportuno utilizzare la Spearman's correlation o la Kendall's Tau, che forniscono stime di correlazione efficienti, anche (es oprattutto ) in caso di marcata non gaussianità. O ancora meglio, se uno è preoccupato di eventi estremi (negativi) congiunti, potrebbe cercare un modo per utilizzare la tail dependence. Mi sfugge, al momento, come questo potrebbe essere fatto in tema di spread trading: ma suppongo che la mia idea di spread trading in sezione AT soffrirebbe di una tremenda solitudine. Mah, vedremo...
 
Cioè, riferendomi a quel 3d della sezione AT, io ragionerei così...
Devi definire la funzione di ripartizione dei due rendimenti separatamente.

Dopodichè ricavi i quantili della Normale standard che corrispondono alle probabilità cumulate (in pratica tu hai delle soglie e dici «Prob. cumulata di avere rendimenti tra 5% e -6% è 0.84, prob. cumulata di avere rendimenti tra 7% e 5% è 0.87» e via così...).

Stimi la correlazione tra i due strumenti con i soliti modelli.

Sbatti tutto in una Normale multivariata con coefficiente di correlazione quello stimato, dalla funzione di ripartizione ottieni la cumulata delle probabilità congiunte e da lì ricavi la densità di probabilità: ovvero «Qual è la probabilità che il primo strumento faccia -7% e il secondo -13%?».
 
Beh, ma non è uguale a quello che ho detto io, solo che io le conto fisicamente ed evito qualsiasi modello?

:mmmm::mmmm:
 
Beh, ma non è uguale a quello che ho detto io, solo che io le conto fisicamente ed evito qualsiasi modello?
Non sono sicuro che quello che hai scritto qui
- per ogni classe del titolo A calcolo la distribuzione condizionata di B
- per ogni classe di B calcolo la distribuzione condizionata di A
dal punto di vista formale sia corretto nel momento in cui parliamo di distribuzioni congiunte che sono incognite.

Probabilmente secondo un'accezione frequentista potrebbe essere la stessa cosa, ma queste sono complicazioni di natura teorica per rispondere alle quali non dispongo dei requisiti.

Dovresti chiedere a TheBear.
 
La metodologia appena descritta è essenziale per gestire il rischio di credito, dove il vero problema è capire qual è la probabilità di finire in fondo alla coda sinistra della p.d.f. di P&L, non tanto contenere la volatilità delle variazioni di prezzo, visto che questa si "spegne" via via che ci si avvicina alla scadenza (perpetue escluse).

Un grazie personale a Cren per essersi occupato in modo davvero egregio della parte "pratica", alleggerendo così le mie fatiche OK!

La parte in neretto è esattamente il motivo per cui, in troubled times, non vorrei avere fra le mani una copula gaussiana.

A dopo (che potrebbe anche voler dire dopo il 2047, naturalmente)
 
Ultima modifica:
Sto affrontando ora lo studio delle distribuzioni chi2, >T etc. Non sono quindi in grado di entrare in quel tipo di argomenti. ***

Diciamo che sto cercando intuitivamente di risolvere il problema.


A logica, ad es. la probabilità di osservare pèer Isp un rendimento < -7% sia 0,05%, mentre la probabilità di osservare per Eni r < -4% sia 0,1%.

Ma la prob. congiunta è >>0,05x0,1 = 0,005%. Sarà magari del 10% (Numeri a caso)

*** Quando ho finito mi dedico al tuo R. :)
 
Voi ciao.:)

Uhmmm...io perplessità su alcuni punta.

Esempia:

Crengi aguzzo quando risponde a Paolo:

"dal punto di vista formale sia corretto nel momento in cui parliamo di distribuzioni congiunte che sono incognite"


Paolo aguzzo quando salta passaggio teorico e punta a sodo.

Io chiede:

Se noi sa..e noi sa, che distribuzioni sono incognite, perchè no sfruttare strumenta a nostra disposizione per misurare similarità distributiva?

:)
 
A logica, ad es. la probabilità di osservare pèer Isp un rendimento < -7% sia 0,05%, mentre la probabilità di osservare per Eni r < -4% sia 0,1%.

Ma la prob. congiunta è >>0,05x0,1 = 0,005%. Sarà magari del 10% (Numeri a caso)
Esatto, la copula la usi proprio perchè non ti puoi limitare a fare il prodotto delle due probabilità, ma hai bisogno di uno strumento che tenga conto della loro correlazione.

Hai presente il calcolo delle probabilità? La probabilità congiunta di due eventi in prima battuta è

Pr(AB) = Pr(A|B)Pr(B)​

che diventa il semplice e inflazionato prodotto delle probabilità individuali se i due eventi sono disgiunti.

Siccome qui i due eventi verosimilmente disgiunti non sono, hai bisogno di stimare la probabilità condizionata Pr(A|B) e il modo più rapido per distribuzioni di probabilità continue è proprio standardizzare le marginali, calcolarti la correlazione e frullare tutto in una copula.
 
Esatto, la copula la usi proprio perchè non ti puoi limitare a fare il prodotto delle due probabilità, ma hai bisogno di uno strumento che tenga conto della loro correlazione.

Hai presente il calcolo delle probabilità? La probabilità congiunta di due eventi in prima battuta è

Pr(AB) = Pr(A|B)Pr(B)​

che diventa il semplice e inflazionato prodotto delle probabilità individuali se i due eventi sono disgiunti.

Siccome qui i due eventi verosimilmente disgiunti non sono, hai bisogno di stimare la probabilità condizionata e il modo più rapido per distribuzioni di probabilità continue è proprio standardizzare le marginali, calcolarti la correlazione e frullare tutto in una copula.

Copula prodotto copula base, Paolo no sbaglia del tutto.
 
Indietro