Machine Learning: la mia esperienza - Pagina 2
Stellantis va all’attacco, Tavares indica un futuro tutto elettrico e lancia l’Electrification Day
Stellantis ha solo pochi mesi di vita ma deve già correre per non restare indietro nella serrata corsa dei big dell'auto verso un futuro sempre più incentrato sull'elettrico. Lo sa …
Orcel supera lo scoglio assemblea, Unicredit nelle mani del banchiere d’oro. M&A e non solo, le sfide del nuovo ceo
Come da attese è stata un esito sul filo di lana quello relativo alla politica di remunerazione 2021 di Unicredit con il tanto discosso maxi-stipendio garantito al nuovo ceo Andrea …
Coinbase sbarca a Wall Street e fa subito la storia, infiamma Bitcoin e batte il Nasdaq. Solo 93 società S&P 500 hanno capitalizzazione maggiore
Lo sbarco di Coinbase sul Nasdaq, indubbiamente, ha fatto e continuerà a fare la storia del Bitcoin e delle criptovalute: per la prima volta in assoluto una piattaforma di trading …
Tutti gli articoli
Tutti gli articoli Tutte le notizie

  1. #11
    L'avatar di uuu
    Data Registrazione
    Mar 2004
    Messaggi
    2,045
    Mentioned
    0 Post(s)
    Quoted
    110 Post(s)
    Potenza rep
    0
    deep learning hai provato qualcosa?

  2. #12

    Data Registrazione
    Sep 2018
    Messaggi
    96
    Mentioned
    0 Post(s)
    Quoted
    62 Post(s)
    Potenza rep
    3752488
    Citazione Originariamente Scritto da amartya78 Visualizza Messaggio
    Ciao Lumio,

    intanto grazie del tuo contributo alla discussione. Specifico subito che nel mio caso utilizzo i metodi MC per fare ottimizzazione quindi come mezzo per costruirmi metodi ML, quindi da distinguere dalle simulazioni MC che invece sono un fine. Pertanto per esempio utilizzo MC per stimare i valore dei nodi di una Neural Network.
    Ritornando al tema sull'efficacia del ML io chiaramente ho dato la mia versione dei fatti basata sulla mia esperienza. Quindi non è escluso a priori che vi possa essere una applicazione ML efficace.

    Detto questo però mi permetto di suggerire quanto meno una Validazione. Per esempio io ritengo robusto un approccio back-forward (classico metodo di validazione di modelli predittivi) del seguente tipo prendi ca. 10 anni di serie storiche dividili in due parti 5 anni e 5 anni, nel primo set effettui il training della macchina (training set) quindi fissi il miglior set di valori ottenuti nel training e proietti per 5 anni. Infine calcoli il tasso di decadimento tra la performance ottenuta nel in-sample e quella nell'out-sample. Il miglior modello predittivo è quello che tra in-sample ed out- sample non mostra alcuna differenza nella performance. 5 anni sono tanti ma bisogna essere molto esigenti. Un altro approccio potrebbe essere che effettui il training set nei 5 anni e proietti anche ad un giorno, quindi esce l'ultimo giorno ed entra nel training set quello appena proiettato iterando il processo per tutti i giorni nei 5 anni successivi infine metti insieme le performance dei 5 anni così ottenuti. L'importante è non contaminare i dati out-sample cioè aggiustare la performance utilizzando quei dati.
    Ciò dovrebbe darti una idea se alla fine dell'arcobaleno c'è una pentola vuota o piena.
    Grazie a te, è bello e francamente inusuale avere un dibattito illuminato su tale argomento in un forum non esattamente sull'argomento. Riguardo il discorso io generalmente uso la cross-validation o training/test set (preferisco la cross a 10) per evitare quel tipo di problema. Comunque ora sto lavorando su un approccio model-free usando appunto il Q-Learning, però deep, cioè approssimando i valori Q con una rete neurale che tenta di approssimare la funzione, anche perchè sarebbe impossibile vista la dimensione dell'input. Interessante usare il Montecarlo per valutare il valore dei nodi di una NN, anche se non ho ben capito perchè, per sostituire la funzione di attivazione o per vedere l'output dei singoli nodi muovendo i valori dell'input? Davvero molto interessante comunque

  3. #13
    L'avatar di Paolo1956
    Data Registrazione
    Jun 2010
    Messaggi
    5,700
    Mentioned
    1 Post(s)
    Quoted
    1537 Post(s)
    Potenza rep
    42949683
    Sapete, io mi intendo poco di quelle cose (ML, NN), un po' di forecast e soprattutto sono un pratictioner e non un professionista.
    però vi metto in guardia su una cosa: si rilevano a volte delle proprietà (banalmente ad es. una autocorr. a lag 1) che magari durano anni e anni e poi all'improvviso Puff! scompaiono. Contro queste cose anche la cross-validation può fare poco....

    Secondo me, quando si scopre qualche regolarità bisognerebbe cercare sempre di comprenderne la ragione (che generalmente è inerente la struttura del mercato): se la capisci allora ci puoi fare affidamento, se non la capisci ti può sparire all'improvviso e tu resti come un allocco. Si potrebbero fare esempi in merito...

    Ciao

  4. #14

    Data Registrazione
    Sep 2008
    Messaggi
    9,046
    Mentioned
    12 Post(s)
    Quoted
    2476 Post(s)
    Potenza rep
    42949685
    Citazione Originariamente Scritto da lumio Visualizza Messaggio
    Grazie a te, è bello e francamente inusuale avere un dibattito illuminato su tale argomento in un forum non esattamente sull'argomento. Riguardo il discorso io generalmente uso la cross-validation o training/test set (preferisco la cross a 10) per evitare quel tipo di problema. Comunque ora sto lavorando su un approccio model-free usando appunto il Q-Learning, però deep, cioè approssimando i valori Q con una rete neurale che tenta di approssimare la funzione, anche perchè sarebbe impossibile vista la dimensione dell'input. Interessante usare il Montecarlo per valutare il valore dei nodi di una NN, anche se non ho ben capito perchè, per sostituire la funzione di attivazione o per vedere l'output dei singoli nodi muovendo i valori dell'input? Davvero molto interessante comunque
    Si chiaramente utilizza pure cross validation. L'importante, a mio avviso, è che il forward si lungo a sufficienza.

    Utilizzo MC esattamente come hai descritto nel 2° caso con l'unico accorgimento che quando estraggo la matrice di valori casuali dalla macchina questa la richiedo in modo tale che i valori siano distribuiti normalmente rispetto ad un valore centrale e che siano compresi entro un certo sigma. (questi due valori (media e sigma) ovviamente li fornisco io). Nel mio caso questo mi permette di effettuare contemporaneamente la sensitivity analysis, cioè mi vado subito a stimare quanto è sensibile il nodo rispetto a valori che si discostano un certo sigma dal valore centrale. Chiaramente questi sono accorgimenti che si sposano bene con il mio modello matematico. Sarebbe interessante che tu stimi il tasso di decadimento e lì che si palesa il primo momento dell'efficacia.
    Ultima modifica di amartya78; 17-01-19 alle 07:45

  5. #15

    Data Registrazione
    Sep 2008
    Messaggi
    9,046
    Mentioned
    12 Post(s)
    Quoted
    2476 Post(s)
    Potenza rep
    42949685
    Citazione Originariamente Scritto da Paolo1956 Visualizza Messaggio
    Sapete, io mi intendo poco di quelle cose (ML, NN), un po' di forecast e soprattutto sono un pratictioner e non un professionista.
    però vi metto in guardia su una cosa: si rilevano a volte delle proprietà (banalmente ad es. una autocorr. a lag 1) che magari durano anni e anni e poi all'improvviso Puff! scompaiono. Contro queste cose anche la cross-validation può fare poco....

    Secondo me, quando si scopre qualche regolarità bisognerebbe cercare sempre di comprenderne la ragione (che generalmente è inerente la struttura del mercato): se la capisci allora ci puoi fare affidamento, se non la capisci ti può sparire all'improvviso e tu resti come un allocco. Si potrebbero fare esempi in merito...

    Ciao
    Ciao Paolo,

    hai colto nel segno.

    Il back-forward è solo uno dei due indicatori, che io ritengo, fondamentali per la validazione per così dire predittiva (cioè il modello funziona in termini di predizione, poi bisogna successivamente vedere se funziona pure considerando costi di transazione e spread bid-ask e questo dipende molto dalla velocità di rotazione del capitale e dall'ampienza media in termini di variazione del capitale ad ogni rotazione),l'altro indicatore che sempre a mio avviso ti da luce verde è l'indipendenza del modello (quale esso sia) dall'asset class (stocks, etf, currency, options, oil, gold, agricultural commodities,........In tal caso la differenza di performance tra le varie asset class non deve dipendere dalla capacità predittiva del modello ma dalla volatilità implicita dell'asset class. Per esempio se con il modello fai un back-forward con uguale time-frame su un etf per esempio SPY e sul tasso di cambio euro/dollaro allora la differenza di ritorno tra le due asset class deve dipendere (o cmq dovrebbe dipendere) solo ed esclusivamente dalle due diverse volatilità implicite.
    Quindi valido un modello predittivo se e solo se esso si mostra indipendente dal tempo e dall'asset class. Sono condizioni fortissime e difficilissime da avere entrambe ma in quell'arena più competitiva del mondo che sono i mercati finanziari, per quanto mi riguarda, o ti butti a fare predizioni con qualcosa di robustissimo o è meglio comprarsi un etf beta 1.5 su SP500 e ti porti a casa il 15% l'anno senza fare nulla ma anche sopportando drawdown sino e più del 50% (vedi marzo 2009).

    Ma ritornando all'ultima tua considerazione, cioè la regolarità e la ragione che ci sta dietro, ecco io ritengo che sia questo quello che vada cercato. Non mi sono mai fidato di una cosa non spiegata. Io amo la logica voglio che ci sia un perchè. Generalmente tutte le volte che ho costruito un modello su una relazione logico-deduttiva successivamente questa relazione è stata validata dai dati.
    Ultima modifica di amartya78; 17-01-19 alle 07:43

  6. #16

    Data Registrazione
    Oct 2009
    Messaggi
    9,566
    Blog Entries
    61
    Mentioned
    15 Post(s)
    Quoted
    616 Post(s)
    Potenza rep
    42949684
    Citazione Originariamente Scritto da lumio Visualizza Messaggio
    ...io da 3 anni ormai lavoro su progetti di machine learning o legati ad esso. Posso affermare che anche in un contesto non competitivo, definire modelli o insiemi di modelli che abbiano capacità predittive significativamente superiori all'opinione di un esperto non è affatto banale anche se possibile. Da qualche mese ho iniziato a lavorare su un progetto di deep reinforcement learning applicato al mondo finanziario con un orientamento buy & hold.
    Ho utilizzato il metodo Montecarlo in passato, ma questo progetto utilizza più strumenti come reti neurali e q-learning. L'obiettivo è quello di "smazzarsi" il mercato azionario e trovare stock validi per la strategia B&H, una volta ricevuto un set di stocks con annesse probabilità sarei comunque io (e/o il team) a valutare se e come agire.
    Quindi state usando la rete come classificatore, non come regressore.

    Per curiosità, quali attributi usi e con che criteri hai definito la variabile dipendente (che suppongo a questo punto sia una serie binaria)?
    Ultima modifica di Cren; 17-01-19 alle 15:51

  7. #17
    L'avatar di PGiulia
    Data Registrazione
    Nov 2000
    Messaggi
    10,623
    Blog Entries
    1
    Mentioned
    19 Post(s)
    Quoted
    2024 Post(s)
    Potenza rep
    42949693
    Citazione Originariamente Scritto da Paolo1956 Visualizza Messaggio
    Sapete, io mi intendo poco di quelle cose (ML, NN), un po' di forecast e soprattutto sono un pratictioner e non un professionista.
    però vi metto in guardia su una cosa: si rilevano a volte delle proprietà (banalmente ad es. una autocorr. a lag 1) che magari durano anni e anni e poi all'improvviso Puff! scompaiono. Contro queste cose anche la cross-validation può fare poco....

    Secondo me, quando si scopre qualche regolarità bisognerebbe cercare sempre di comprenderne la ragione (che generalmente è inerente la struttura del mercato): se la capisci allora ci puoi fare affidamento, se non la capisci ti può sparire all'improvviso e tu resti come un allocco. Si potrebbero fare esempi in merito...

    Ciao
    Passano gli anni, e stiamo sempre allo stesso punto!

    Un paio di cosette, perché mi sto veramente affezionando a te:

    1) quel "puff", soprattutto se succede nel momento in cui vai a mercato, è one hundred percent overfitting. Non è il mercato che cambia (che peraltro sicuramente cambia).

    2) la chiave, come ho ripetuto per anni allo sfinimento, è cosa si da in pasto al mostro, anche quando il mostro è solo un classificatore. Il fatto simpatico è che quando si è capito cosa dargli in pasto, il mostro diventa praticamente inutile.

    3) è importante capire a chi si sta sfilando il portafoglio. Senza farsi troppe illusioni (!!!). Perché il mercato non è una punching ball. Il mercato quando si accorge di te ti mena di brutto. E fare stock picking B&H non cambia di una virgola quanto detto. Ma capire questo punto significa essersi già sporcati parecchio le mani.

    4) consiglierei a lumio una lettura completa del nostro thread, qualora fosse possibile!

    VVB!!!

    PGP

  8. #18

    Data Registrazione
    May 2015
    Messaggi
    443
    Mentioned
    1 Post(s)
    Quoted
    307 Post(s)
    Potenza rep
    6714021
    Citazione Originariamente Scritto da PGiulia Visualizza Messaggio
    3) è importante capire a chi si sta sfilando il portafoglio. Senza farsi troppe illusioni (!!!). Perché il mercato non è una punching ball. Il mercato quando si accorge di te ti mena di brutto. E fare stock picking B&H non cambia di una virgola quanto detto. Ma capire questo punto significa essersi già sporcati parecchio le mani.
    It's one hundred percent overfiSting.

  9. #19

    Data Registrazione
    Sep 2018
    Messaggi
    96
    Mentioned
    0 Post(s)
    Quoted
    62 Post(s)
    Potenza rep
    3752488
    Citazione Originariamente Scritto da Cren Visualizza Messaggio
    Quindi state usando la rete come classificatore, non come regressore.

    Per curiosità, quali attributi usi e con che criteri hai definito la variabile dipendente (che suppongo a questo punto sia una serie binaria)?
    Io la uso come regressore, approssimo Q appunto. L'input non è ancora ben definito, sto ancora modellando il codice che permetterà di fare un training modulare (dove posso cambiare facilmente il comportamento senza rifattorizzare tutto).

  10. #20

    Data Registrazione
    Sep 2018
    Messaggi
    96
    Mentioned
    0 Post(s)
    Quoted
    62 Post(s)
    Potenza rep
    3752488
    Citazione Originariamente Scritto da PGiulia Visualizza Messaggio
    Passano gli anni, e stiamo sempre allo stesso punto!

    Un paio di cosette, perché mi sto veramente affezionando a te:

    1) quel "puff", soprattutto se succede nel momento in cui vai a mercato, è one hundred percent overfitting. Non è il mercato che cambia (che peraltro sicuramente cambia).

    2) la chiave, come ho ripetuto per anni allo sfinimento, è cosa si da in pasto al mostro, anche quando il mostro è solo un classificatore. Il fatto simpatico è che quando si è capito cosa dargli in pasto, il mostro diventa praticamente inutile.

    3) è importante capire a chi si sta sfilando il portafoglio. Senza farsi troppe illusioni (!!!). Perché il mercato non è una punching ball. Il mercato quando si accorge di te ti mena di brutto. E fare stock picking B&H non cambia di una virgola quanto detto. Ma capire questo punto significa essersi già sporcati parecchio le mani.

    4) consiglierei a lumio una lettura completa del nostro thread, qualora fosse possibile!

    VVB!!!

    PGP
    Grazie @PGiulia, lo sto leggendo effettivamente ed è molto interessante, sono a pagina 16 ancora. Pian piano vi raggiungo.

Accedi