BMETE95AM36

Nyomtatóbarát változatNyomtatóbarát változat
Tantárgy azonosító adatok
A tárgy címe: 
Bevezetés az adattudományba 1
A tárgy angol címe: 
Introduction to data science 1
A tárgy rövid címe: 
BevezetésAzAdattudományba1
3
0
1
v
Kredit: 
4
Ajánlott/Kötelező előtanulmányi rend
1.Követelménytárgy kódja: 
BMETE91AM43
1.Követelménytárgy (rövidített) címe: 
Informatika2
2.Követelménytárgy kódja: 
BMETE95AM31
2.Követelménytárgy (rövidített) címe: 
Statisztika1
A tantárgy felelős tanszéke: 
Sztochasztika Tanszék
A tantárgy felelős oktatója: 
Dr. Simon Károly
A tantárgy felelős oktatójának beosztása: 
egyetemi tanár
Akkreditációs adatok
Akkreditációra benyújtás időpontja: 
2015.02.16.
Akkreditációs bizottság döntési időpontja: 
2016.04.18.
Tematika
A tantárgy az alábbi témakörök ismeretére épít: 
Statisztika, ineáris algebra, Python programozás
A tantárgy szerepe a képzés céljának megvalósításában: 
TTK Matematika (BSc) képzés Adattudományi sávjának kötelező tárgya.
A tantárgy részletes tematikája magyarul és angolul: 

A tárgy célja az adattudomány alapfogalmainak a korábban megszerzett matematikai ismeretekre épülő, gyakorlati megközelítésű megismertetése. A hallgatók a kezdetektől teljes, a gyakorlati életből vett valós alkalmazási példákon keresztül az ismereteket megtapasztalva, egyfajta spirál
mentén egyre mélyebbre haladva precíz elméleti és egyúttal praktikus gyakorlati ismeretekhez jutnak. Az elméleti ismeretek ge rincét a gépi tanulás algoritmusai adják, a gyakorlati feladatok építenek a Python nyelv ismeretére.

Előadás: Történet, példák, esettanulmányok, az adattudományba sorolható diszciplínák. Ellenőrzött tanulás - Lineáris Modellek + modell validálás. Legkisebb négyzetek módszere. Lineáris Regresszió. Gradiens módszer, maximum-likelihood becslés. Polinomiális regresszió, logisztikus regresszió, Perceptron, Newton-módszer, Naive-Bayes. Általánosított lineáris modellek (Exponenciális család), tanulási/validációs/tesztelési halmaz, cross-validáció, Bias-Variance tradeoff, regularizáció, Precision-Recall, F1-score, ROC görbe. SVM, lineáris SVM, kernel trükk. Neurális hálók. Döntési fák. Véletlen erdők. Boosting. Nem Ellenőrzött tanulás. Klaszterezés. K-means klaszterezés. EM algoritmus. PCA, ICA. Nagyobb esettanulmányok, kitekintés.

Gyakorlat: Az adatmanipulálás, prediktív analízis, megjelenítés lépései valódi adatokkal (pl. kaggle) elsősorban Python-csomagok (pandas, scikit- learn, matplotlib, ggplot) és R használatával.

Követelmények szorgalmi időszakban: 
házi feladatok, részvétel a tanórákon
Követelmények vizsgaidőszakban: 
vizsga
Pótlási lehetőségek: 
TVSZ szerint
Konzultációs lehetőségek: 
TVSZ szerint
Jegyzet, tankönyv, felhasználható irodalom: 
legfrissebb online jegyzetek
A tárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
Kontakt óra: 
56
Félévközi felkészülés órákra: 
14
Felkészülés zárthelyire: 
0
Zárthelyik megírása: 
0
Házi feladat elkészítése: 
28
Kijelölt írásos tananyag elsajátítása (beszámoló): 
0
Egyéb elfoglaltság: 
0
Vizsgafelkészülés: 
22
Összesen: 
120
Ellenőrző adat: 
120
A tárgy tematikáját kidolgozta
Név: 
Dr. Simon Károly
Beosztás: 
egyetemi tanár
Munkahely (tanszék, kutatóintézet, stb.): 
Sztochasztika Tanszék
A tanszékvezető neve: 
Dr. Simon Károly
A tantárgy adatlapja PDF-ben: