Data Mining

London Financial Studies

Descrierea programului

Citește Descrierea Oficială

Data Mining

London Financial Studies

Popularitatea tehnicilor de știință a datelor, cum ar fi data mining și învățarea în mașină, a crescut enorm în ultimii ani. Acestea prezintă soluții eficiente pentru a procesa și analiza cantitatea imensă de date disponibile managerilor de risc și analiștilor financiari.

Odată cu avansurile în domeniul procesării și procesării distribuite, este acum posibil să procesăm și să înțelegem o gamă largă de informații care pot fi colectate din mai multe surse de date diferite.

Acest program hands-on acoperă tehnicile cheie - inclusiv câteva aspecte ale învățării automate supravegheate și nesupravegheate - care pot fi folosite atunci când miniere date financiare. Programul se concentrează, de asemenea, pe tehnici avansate de știință a datelor, care devin utilizate pe scară largă pe piețele financiare pentru analiza textului și inteligența artificială: procesarea limbajului natural (NLP) și învățarea profundă (DL).

Programul este livrat în întregime prin ateliere și studii de caz. Participanții vor învăța cum să implementeze tehnici de prelucrare a limbajului natural prin construirea unui model de analiză a sentimentului pentru a analiza șiruri de text. În secțiunea de învățare profundă, participanții se vor concentra pe construirea și testarea unei rețele neuronale pentru a rezolva o problemă financiară cu ajutorul Python.

Cele mai multe exerciții și studii de caz sunt ilustrate în Python, permițându-vă să învățați cum să lucrați cu acest limbaj de programare flexibil.

Data: 21 - 23 noiembrie 2018

Locul desfășurării: centrul Londrei

Taxă: 1325 £ pe zi

S-ar putea să fiți eligibil pentru tarife preferențiale. Vă rugăm să ne contactați pentru a verifica dacă compania dvs. este membru al programului Global Client al LFS.


Cui este cursul pentru

  • Managerii de portofoliu
  • Managerii de risc
  • Profesioniștii doresc să introducă concepte de miniere a datelor în sarcinile zilnice
  • Dezvoltatorii IT
  • statisticienii
  • Analiști cuantificați
  • Ingineri financiari
  • Consultanți


obiective de invatare

  • Construiți o bază solidă de cunoștințe privind tehnicile și instrumentele de extragere a datelor, precum și aplicarea acestora în industria financiară
  • Obțineți experiență reală cu procesarea limbajului natural și învățarea profundă în domeniul finanțelor
  • Aflați cum să aplicați Python procesării și procesării datelor și să rezolvați probleme NLP și DL în lumea reală
  • Obțineți o înțelegere a algoritmilor rețelelor neuronale artificiale (ANN) și cum să le utilizați pentru a proiecta, construi și dezvolta modele DL


Cunoștințe anterioare

  • Noțiuni de bază privind statisticile
  • O bună cunoaștere a programului Excel
  • Nu sunt necesare cunoștințe anterioare despre Python


Cursul de curs

Ziua 1

Privire de ansamblu asupra Explorării Datelor

Stabilirea diferitelor componente ale minelor de date

  • Reguli de asociere
  • Clasificare vs. probleme de regresie
  • Analiza clusterizării

Vizualizarea datelor

  • Prezentare generală a soluțiilor de la terți (Tableau, QlikeTech, etc.) pentru vizualizarea seturilor mari de date. Studiile de caz vor fi elaborate folosind matplotlib-library și plotly (platformă on-line de colaborare open-source)
  • Baze de date grafice: aplicarea teoriei rețelei la analiza portofoliilor și introducerea în bazele de date grafice
  • Detectarea externă
  • Distanța de la Mahalanobis

regresiune

  • OLS (cele mai mici pătrate obișnuite)
  • Ridge regresie
  • Sparsity
  • lasou
  • Elastic net

Atelier de lucru: Elaborarea unui hedging optim al unui portofoliu de capitaluri mondiale în timp real, utilizând contracte futures. Portofoliul are o natură globală (100 acțiuni), dar este disponibil doar un set limitat de contracte futures

Analiza principală a componentelor (PCA)

  • Analiza principală a componentei structurii pe termen a ratelor dobânzilor și a volatilității implicite
  • Regresia principală a componentelor (PCR)
  • Parțialele cele mai mici pătrate (PLS)

Workshop: Utilizarea PCA pentru a reduce dimensiunile unui set mare de date de curbe istorice ale ratei dobânzii. Comportamentul complex al acestei curbe este împărțit pe scadențe diferite și această tehnică permite unui manager de risc să aibă o imagine mult mai bună asupra dinamicii curbelor ratei dobânzii

Clasificarea datelor - Regresie

Estimarea și clasificarea densității nucleului

  • Corelarea densității kernelului este o procedură de învățare nesupravegheată, care conduce la o familie simplă de proceduri pentru clasificarea non-parametrică

Studiu de caz: Utilizarea kernelurilor pentru a determina distribuția probabilităților pentru datele financiare

Clasificare - partea I

  • Naive Bayes: o tehnică directă și puternică pentru clasificarea datelor

Studiu de caz: elaborarea unui predictor Bayes pentru un set mare de date care conține diferite atribute ale băncilor din SUA. Clasificatorul Bayes va fi utilizat pentru a separa acele bănci care sunt susceptibile să nu reușească de cele care vor rămâne solide

Clasificare - Partea II

  • Tehnici robuste de exploatare a datelor
  • Regresie logistică

Studiu de caz: Aplicând log-regresia pe un set de date din lumea reală cu o dimensionalitate ridicată

Ziua a doua

Clasificarea datelor (cont.)

Clasificare - Partea a III-a

  • Clasificarea copacilor: modelarea CART duce la arbori de decizie practice ușor de folosit
  • Conceptul de arbori de decizie va fi extins cu tehnici precum Forest Random și Bagging

Studiu de caz: Concepte precum funcțiile de cost, nivelurile de impurități, tăierea copacilor și validarea încrucișată vor fi tratate în detaliu

  • K-învățarea celui mai apropiat vecin
  • Regresie logistică

Studiu de caz: Metodele de clasificare (K-Nearest și CART) vor fi puse în funcțiune pe diferiți indicatori tehnici (RSI, MACD, etc.) de seturi mari de date financiare din lumea reală. Aceasta va ilustra modul în care acești clasificatori pot fi utilizați pentru stocarea partițiilor în diferite găleți în funcție de puterea diferitelor atribute într-un mod rapid

Workshop: Instrumente de extragere a datelor

O introducere în Python - Un limbaj de programare puternic

Aplicabilitatea Python în domeniul analizei datelor va fi ilustrată prin exemple practice, cu accent pe învățarea în mașină utilizând pachetul "scikit-learn". Toate exemplele vor fi acoperite în Jupiter-notebook-uri. Delegații vor învăța cum să construiască rapoarte personalizate în Python

Ziua a treia

Procesarea limbajului natural

Extragerea valorii reale din posturile de social media, imagini, e-mail, PDF-uri și alte surse de date nestructurate reprezintă o mare provocare pentru întreprinderi.

Această secțiune este dedicată aplicării procesării limbajului natural (NLP) pentru extragerea valorii din datele nestructurate. Pot fi explorate mai multe exemple din lumea reală de examinare a datelor nestructurate în domeniul finanțelor - inclusiv analiza sentimentului știrilor financiare.

Workshop: Folosind pachetul NLTK de la Python la:

  • Explorați și tokenize un text folosind Tf-Idf și Count Vectors
  • Preziceți cuvintele dintr-un text: construirea unui predictor de cuvânt pornind de la un text; scriind un program care poate prezice cuvântul care urmează unui cuvânt dat
  • Înțelegeți sentimentul unui articol de știri pe un anumit stoc

Invatare profunda

Deep Learning ca subcâmp de învățare în mașină - algoritmi Artificial Neural Networks (ANN).

  • Introducere în învățarea profundă
  • Propagarea înainte
  • Metoda Word2vec
  • Rețele mai profunde și propagarea în față
  • Optimizarea rețelei neuronale cu propagare înapoi

Studiu de caz: Construirea unui model de învățare profundă cu Python (cu accent pe pachetele Keras și Tensorflow)

Această școală oferă programe în:
  • Engleză


Ultima actualizare August 9, 2018
Durata & Pret
Acest curs este Bazat în Campus
Start Date
Data începerii
Noem. 21, 2018
Apr. 10, 2019
Duration
Durata
3 zilele
Cu normă întreagă
Price
Preţ
3,975 GBP
£ 1325 pe zi
Locations
Regatul Unit - London, England
Data începerii : Noem. 21, 2018
Termen limită de aplicare Contactează şcoala
Data terminării Noem. 23, 2018
Data începerii : Apr. 10, 2019
Termen limită de aplicare Contactează şcoala
Data terminării Apr. 12, 2019
Dates
Noem. 21, 2018
Regatul Unit - London, England
Termen limită de aplicare Contactează şcoala
Data terminării Noem. 23, 2018
Apr. 10, 2019
Regatul Unit - London, England
Termen limită de aplicare Contactează şcoala
Data terminării Apr. 12, 2019
Videoclipuri

LFS Webcast series - Applying Data-Mining in Finance