A tárgy célja a Bevezetés az adattudományba 1 tárgyban kevésbé tárgyalt adattudományi fogalmak, algoritmusok a korábban megszerzett matematikai ismeretekre épülő, gyakorlati megközelítésű megismertetése.
Az adatmanipulálás, prediktív analízis, megjelenítés lépései valódi adatokkal, elsősorban Python-csomagok (pandas, scikit- learn, matplotlib, ggplot) és R használatával, ismerkedés más adattudományi szoftverek használatával.
Bayes-hálók, Együttes módszerek osztályozásra (véletlen erdő, bagging, boosting), Klaszterezés (k-közép, hierarchikus, DBSCAN, EM algoritmus), Ajánlórendszerek, Dimenziócsökkentés (PCA) Asszociációs szabályok, Anomáliák (outlierek) detektálása. Nagyobb esettanulmányok, kitekintés.
Az adatmanipulálás, prediktív analízis, megjelenítés lépései valódi adatokkal, elsősorban Python-csomagok (pandas, scikit- learn, matplotlib, ggplot) és R használatával, ismerkedés más adattudományi szoftverek használatával.