O kurze 

Sú data scientisti čarodejníci keď tvrdia, že dokážu predpovedať budúcnosť? To rozhodne nie. :) Jednoducho vidia vo svojom okolí “funkciu” a odhadnú ju pomocou prediktívneho modelu. Napríklad, zozbierajú dáta o počasí a pomocou nich predpovedajú koľko ľudí sa rozhodne kúpiť si zmrzlinu v nasledujúci deň. 

V tomto kurze sa naučíte vytvárať prediktívne modely pomocou strojového učenia (machine learning)! Kurz sme nastavili tak, že po jeho absolvovaní budete vedieť všetko potrebné na vytváranie základných prediktívnych modelov. Ak teda dostanete k dispozícií vhodné dáta, dokážete vytvoriť atribúty, vybrať vhodný model a vyhodnotiť úspešnosť vášho modelu. 

Kurz končí záverečným projektom, na ktorom budete samostatne pracovať. Nasimulujeme si tak reálne prostredie a uistíme sa, že ste naozaj dosiahli požadovanú úroveň znalostí.


Čo je obsahom tohto kurzu?

Celý obsah kurzu má približne 50 hodín. Prostredie, v ktorom budete počas kurzu programovať sa nazýva Jupyter notebooky s Pythonom. Každá lekcia začína jednou alebo viacerými video-prednáškami. Následne na vás čaká Jupyter notebook, ktorý obsahuje praktické aplikovanie preberaného učiva, detailné popisy a úlohy pre vás, v ktorých môžete praktizovať naučené koncepty. Prácou v Jupyter notebookoch strávite približne 30-90 minút. Nižšie v tomto texte nájdete zoznam lekcií, ktoré na vás čakajú. 

Kurz taktiež obsahuje finálny projekt v trvaní približne 10 hodín, na ktorom budete samostatne pracovať. Vašou úlohou bude aplikovať všetko, čo ste sa naučili na dátach, ktoré si pre vás pripravili inštruktori. Na vaše riešenie vám samozrejme poskytneme aj detailnú spätnú väzbu. Riešeniami si teda prejdeme a poukážeme na všetky správne aj nesprávne časti riešení, aby ste svoje znalosti pred koncom kurzu ešte viac zlepšili!

 

Detailnejšie rozpísané na vás teda čaká:

  • viac ako 28 hodín detailne pripravených cvičení s technickou podporou,
  • viac ako 10 hodín na praktickom projekte so spätnou väzbou od inštruktorov, 
  • viac ako 13 hodín video technických lekcií

 

Zoznam lekcií, ktoré sa v kurze nachádzajú:

  • “Vitajte v programe!”: Na začiatku kurzu si povieme, čo vás v lekciách čaká a rovno začneme aj s učením! Uvedieme si základné princípy prediktívneho modelovania, o ktorých sa v kurze budeme učiť.
  • “Úvod do vytvárania atribútov”: Ešte pred tým, ako vytvoríme prediktívny model, naučíme sa ako vytvoriť zo surových dát takzvané atribúty, ktoré neskôr vložíme do prediktívneho modelu a na základe ktorých sa náš model bude učiť.
  • “Úvod do scikit-learn knižnice”: Predstavíme si knižnicu scikit-learn, ktorú budeme počas programu používať. Táto knižnica je dnes svetovým štandardom na vytváranie modelov strojového učenia.
  • “Numerické atribúty”: Pomocou rôznych techník sa naučíme ako vytvoriť numerické atribúty prostredníctvom zmeny škály pôvodných numerických dát. Taktiež si vysvetlíme aké problémy môžu spôsobiť extrémne hodnoty a naučíme sa ako tieto hodnoty odstraňujeme z dát.
  • “Kategorické atribúty”: Datasety častokrát obsahujú dáta v podobe krátkeho textu. Keďže prediktívne modely nedokážu s textovými dátami pracovať, ukážeme si ako môžeme text premeniť na čísla.
  • “Chýbajúce hodnoty”: Datasety občas nie sú kompletné. Ukážeme si ako efektívne a vedecky dokážeme vyriešiť problémy spojené s chýbajúcimi hodnotami tak, aby sme neuškodili nášmu prediktívnemu modelu.
  • “Atribúty času a dátumu”: Občas sa stáva, že máme k dispozícii vyjadrenie času udalosti (napríklad, kedy si zákazník zakúpil produkt). Ukážeme si, ako môžeme z týchto dát získať hodnotné atribúty. 
  • “Vyberanie atribútov”: Vytvorili sme už mnoho atribútov, a preto je potrebné z nich vybrať tie, ktoré sú pre prediktívny model hodnotné. Ukážeme si základné techniky filtrovania a vyberania atribútov, ktoré nám pomôžu pri vytváraní silného prediktívneho modelu.
  • “Evaluácia modelu a kompozitný kód”: Vytvoríme si náš prvý prediktívny model a povieme si o rôznych metrikách, pomocou ktorých hodnotíme jeho predpovede. Taktiež sa naučíme písať profesionálny kód, ktorý sa používa v reálnom svete.
  • “Rozhodovacie stromy a tuning hyperparametrov”: V tejto lekcii sa naučíte o modeli s názvom “rozhodovací strom”, ktorý dokáže predpovedať medzi dvoma cieľovými kategóriami. Na zlepšenie výkonnosti modelu sa naučíme kontrolovať nastavenia, takzvané hyperparametre. 
  • “Náhodný les a kNN algoritmus”: Keď sme sa už naučili ako funguje “rozhodovací strom”, môžeme na našich vedomostiach stavať a posunúť sa k modelu “náhodného lesa”. Toto už sú modely s ktorými sa bežne stretnete v praxi. Taktiež si ukážeme model s názvom kNN, ktorý na vytvorenie predpovedí využíva algoritmus “najbližších susedov”. 
  • “Lineárna regresia”: Touto lekciou prechádzame do oblasti lineárnych modelov.   Naučíme sa o jednom z najdôležitejších modelov s názvom lineárna regresia, pomocou ktorej vytvoríme predpovede a budeme pozorovať aký efekt majú vstupné dáta na vytvorenú predpoveď.
  • “Regularizované modely”: V tejto lekcii sa naučíme o 3 regularizovaných modeloch, ktoré sú variáciami lineárnej regresie: Lasso, Ridge a Elastic Net. Tieto modely sú veľmi užitočné, napríklad, v regulovaných prostrediach ako je bankovníctvo alebo poisťovníctvo.
  • “Logistická regresia”: Ďalším z lineárnych modelov je logistická regresia, ktorá dokáže predpovedať dve alebo viac cieľových kategórií. Ukážeme si tiež ako použiť výstupy z tohto modelu. Zhrnieme si aj predpoklady lineárnych modelov, ktoré nám môžu pomôcť zlepšiť výkonnosť. 
  • “Clustering-zhlukovanie”: V tejto lekcii sa naučíme o modeloch kMeans a DBSCAN, ktoré fungujú na princípe “zhlukovania dáta” s podobnými vlastnosťami a na základe týchto skupín produkujú predpovede.
  • “Redukcia dimenzionality a detekcia anomálií”: Vysvetlíme si ako fungujú algoritmy, ktoré redukujú dimenzionalitu vstupných dát pričom sa snažia ponechať čo najviac z pôvodnej informácie.
  • “Projekt: Je to na vás”: Nastal čas, kedy samostatne aplikujete, čo ste sa naučili a vytvoríte svoj vlastný projekt. Keď budete so svojím riešením spokojné, zašlete ho inštruktorom, ktorí vám poskytnú tipy, rady a spätnú väzbu.

 

Ukážka praktických materiálov

Cvičenia a praktická aplikácia naučených konceptov sú veľmi dôležitou súčasťou našich kurzov. Ku každej lekcii dostanete Jupyter notebook s cvičeniami, ktorý si môžete nechať a používať, napríklad, ako osobnú referenciu vo vašom (budúcom) zamestnaní. Ukážku našich materiálov nájdete pod týmto linkom.


Ako bude tento kurz prebiehať?

  • Po zápise na tento kurz obdržíte URL adresu, cez ktorú sa prekliknete na naše online školiace stredisko. Tu uvidíte registračný formulár, kde sa zaregistrujete pomocou svojej emailovej adresy. Akonáhle prebehne registrácia, budete mať k dispozícii všetky materiály, ktoré kurz obsahuje. 
  • Vaším ďalším krokom bude rezervácia telefonátu s inštruktorom. Uvidíte kalendár inštruktora a zarezervujete si deň a čas, ktorý vám vyhovuje. Do mailu obdržíte pozvánku na telefonát prostredníctvom Teams-u, ktorú vás poprosíme akceptovať. V pozvánke bude uvedený link, pomocou ktorého sa môžete na telefonát pripojiť. Na telefonáte “prelomíme ľady” a zoznámime sa :) Porozprávame sa o vašich predošlých skúsenostiach, čo od kurzu očakávate, ako by ste chceli kariérne rásť a dáme vám odporúčania.
  • Na našom online školiacom stredisku budete mať prístup ku všetkým video lekciám a praktickým materiálom, ktoré kurz obsahuje a inštruktor bude k dispozícií na vaše otázky na emaily. Štúdium lekcií si môžete čo najlepšie prispôsobiť vašim preferenciám a prechádzať nimi vlastným tempom. 
  • Program zavŕši veľký projekt, na ktorom budete samostatne pracovať. Keď budete so svojím riešením spokojné, pošlete ho inštruktorovi na vyhodnotenie. Dostanete detailnú spätnú väzbu, ktorou môžete svoje riešenie zlepšiť a úspešne tak dokončiť program.

 

Počas celého trvania kurzu budete mať k dispozícií komunitu na Discorde a neustálu podporu od inštruktorky, takže sa nemusíte cítiť osamelo počas štúdia. :) Môžete ju kontaktovať na [email protected] v prípade, že:

  • …vám nie je úplne jasná ktorákoľvek časť preberaného učiva
  • …potrebujete detailnejšie dovysvetliť určitý koncept preberaného učiva 
  • …pri práci v Jupyter notebookoch narazíte na problém, ktorý sa vám nedarí vyriešiť
  • …potrebujete kariérne poradenstvo (napr. skonzultovanie pracovnej pozície, o ktorú máte záujem)
  • …máte akékoľvek iné technické či netechnické otázky :) 


Technická podpora počas kurzu a akékoľvek otázky týkajúce sa preberaného učiva budú zodpovedané do dvoch pracovných dní. Vaše otázky z oblasti kariérneho poradenstva budú zodpovedané do troch pracovných dní.


Pre koho je tento kurz vhodný? 

Začnime pomyselným “strašiakom” - matematikou. Mnoho ľudí má z modelov strojového učenia a umelej inteligencie príliš veľký rešpekt. Majú pocit, že musia skvelo zvládať matematiku, aby tieto modely mohli pochopiť a používať. Túto obavu však vôbec nemusíte mať. :) Všetky metódy v kurze budú vysvetľované veľmi intuitívne a vizuálne. V kurze sa nachádza naozaj len minimum rôznych matematických zápisov a rovníc. Počas kurzu sa teda nazrieme “pod kapotu” rôznych modelov a metód a pochopíme ako fungujú aj bez komplexných matematických zápisov. Zároveň si však povieme o všetkých dôležitých predpokladoch, ktoré musíme splniť, aby sa v našom modeli niečo nepokazilo, a preto sa vôbec nebudete musieť báť tieto modely používať v budúcnosti aj v praxi!

 

Kurz je priamo vhodný pre absolventky kurzov “Analýza a spracovanie dát v Pythone” alebo “Women Data Academy”. Tento kurz je rozšírením vašich schopností o prediktívne modelovanie. V prípade, že ste tieto kurzy neabsolvovali, uistite sa, prosím, že spĺňate vstupné požiadavky.


Čo po kurze dokážem a čo si odnesiem?

V posledných rokoch firmy ponúkajú mnoho pozícií “data scientist”. Zvyčajnou požiadavkou je schopnosť aplikovať prediktívne modelovanie v Pythone. Presne túto schopnosť získate v tomto kurze. Kurz sme nastavili tak, že po jeho absolvovaní budete vedieť všetko potrebné na vytváranie prediktívnych modelov. Ak teda dostanete k dispozícií vhodné dáta, dokážete vytvoriť atribúty, vybrať vhodný model a vyhodnotiť úspešnosť vášho modelu. Absolventi tohto kurzu častokrát fungujú na pozícií “junior data scientist”, prípadne sú v roli “experimentátorov”. Experimentujú s rôznymi dátami vo firmách a vytvárajú jednoduché prototypy modelov strojového učenia. Ak sa nejaký z týchto experimentov vydarí, začnú spolupracovať so skúsenejšími data scientistmi na vytvorení kompletného produktu dátovej vedy z ich skorého prototypu.

 

Z kurzu si odnesiete:

  • Praktické skúsenosti s vytváraním modelov strojového učenia nad štrukturovanými dátami. Dokážete vhodne a správne pripraviť numerické a kategorické atribúty pre použitie v prediktívnych modeloch. Máte vedomosti o fungovaní algoritmov prediktívnych modelov a ovládate rôzne evaluačné techniky na základe použitého modelu. V prípade, že smerujete v budúcnosti do Data Science pozície, ktorá si vyžaduje aj prácu so spracovaním obrázkov a textu pomocou modelov strojového učenia, môžete priamo pokračovať do ďalšieho kurzu, ktorý danú tematiku pokrýva.
  • 20+ Jupyter notebookov, na ktorých si nielen prakticky vyskúšate jednotlivé koncepty, ale môžete ich používať ako osobnú referenciu vo vašom (budúcom) zamestnaní. 
  • (takmer) reálne skúsenosti s Python projektom strojového učenia. Vyskúšate si prácu na projekte, ktorý simuluje reálny dataset, s ktorým sa vo firme môžete stretnúť. Vašou úlohou bude samostatne vytvoriť model strojového učenia a vyhodnotiť jeho výkonnosť. Na vaše riešenia vám poskytneme kumulatívnu spätnú väzbu.


Čo je potrebné na absolvovanie kurzu?


  • Základná znalosť angličtiny (minimálne pasívna znalosť na úrovni čítania textu). Pri niektorých cvičeniach si budete dohľadávať informácie v dokumentáciách knižníc, ktoré sú v angličtine.
  • Stabilné internetové pripojenie. Pre sledovanie video lekcií či prácu na cvičeniach je internetové pripojenie neustále potrebné.
  • Aktualizovaný internetový prehliadač Google Chrome, Microsoft Edge alebo Mozilla Firefox.
  • (odporúčané) Google účet. S Jupyter notebookmi odporúčame pracovať v prostredí Google Colaboratory. V prípade, že Google účet nemáte a ani si ho nechcete zakladať, bude k dispozícii  alternatíva.


Aké sú vstupné požiadavky?

Pre úspešné absolvovanie kurzu sa, prosím, uistite, že spĺňate nasledujúce požiadavky:

  • zvládate prácu s Jupyter notebookmi,
  • dokážete pracovať s knižnicou pandas a spracovávať v nej dáta,
  • viete čo sú Numpy polia a zvládate základné operácie s nimi,
  • máte základný prehľad o svete data science a prístupoch zmeny dát na hodnotné informácie (opis, objavovanie, inferencia, prediktívne modelovanie),
  • zvládate stredoškolskú matematiku a základy deskriptívnej štatistiky (priemer, medián, modus, variabilita, atď.).

 

V prípade, že už máte skúsenosti so strojovým učením, odporúčame si pozorne prezrieť zoznam lekcií vyššie. Tento kurz je naším úvodným kurzom do sveta strojového učenia, a preto vyhodnoťte či pre vás naše pokročilejšie kurzy nebudú vhodnejšie. V prípade otázok, kontaktujte, prosím, priamo inštruktorov, radi s vami tieto úvahy rozoberú.

Video

Social proof: testimonials

Zuzana

absolentka kurzu Machine learning v Pythone

Kurz ohľadom machine learningu sa mi veľmi páčil. Bolo super, že je spracovaný formou videí, ale aj v písanej forme - takže sa dokážu z materiálov učiť aj audiovizuálne typy, aj tí, čo preferujú písaný text. Oceňujem doplnkové úlohy pri každej kapitole aj s riešením. Kurz mi veľmi pomohol a rozšíril obzory spracovania dát, čo už teraz využívam v práci. Odporúčam všetkymi desiatimi.