Tantárgy azonosító adatok
1. A tárgy címe Bevezetés az adattudományba 2
2. A tárgy angol címe Introduction to Data Science 2
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 2 + 0 + 0 v Kredit 3
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1 BMETESZBsMBAT1-00 Bevezetés az adattudományba 1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Sztochasztika Tanszék
7. A tantárgy felelős oktatója Dr. Molontay Roland beosztása egyetemi docens
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2026.05.14. Akkreditációs bizottság döntési időpontja 2026.05.18.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
TTK Matematika BSc képzés Adattudományi sávjának kötelező tárgya
11. A tárgy részletes tematikája

A tárgy célja a Beveztés az adattudományba 1 tárgyban elsajátított ismeretek kiterjesztése, különösképpen az algoritmusok skálázhatósága és párhuzamosíthatósága, illetve az ott nem érintett mély tanulási módszerek megismerése, nagy méretű adahalmazok kezelése.

Előadás: Skálázhatóság. Grid-computing. Cloud. Online gépi tanulás. Inkrementális gépi tanulás. Nagyméretű adathalmazok kezelése, Elosztott adatbázisok, Hadoop, MapReduce. MapRaduce algoritmusai, bonyolultságelmélete. Hasonlóság, távolság. Alkalmazások: Reklámozás a Weben, ajánlórendszerek. Deep learning, mély neurális hálók, modern architektúrák, NLP, LLM alapok. A Python és R mellett egyéb széles körben használt szoftver megismerése, alkalmazása. Valós esettanulmányok meghívott előadókkal.

------------------------------------------------

Objective of the course: The aim of this course is to extend the knowledge acquired in the Introduction to Data Science 1 course, with a particular focus on the scalability and parallelization of algorithms, the introduction of deep learning methods not covered previously, and the management of large-scale datasets.

Lectures: Scalability. Grid computing. Cloud computing. Online machine learning. Incremental machine learning. Handling large-scale datasets. Distributed databases. Hadoop. MapReduce. MapReduce algorithms and their computational complexity. Similarity and distance measures. Applications: web advertising and recommender systems. Deep learning, deep neural networks, modern architectures, NLP, and the fundamentals of large language models (LLMs). Introduction to and application of widely used software tools beyond Python and R. Real-world case studies with invited guest speakers.

12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
Házi feladatok, órai munka vizsga-
időszakban
Szóbeli vizsga
13. Pótlási lehetőségek
A TVSZ szerint
14. Konzultációs lehetőségek
Az oktatóval egyeztetve
15. Jegyzet, tankönyv, felhasználható irodalom
legfrissebb online jegyzetek
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
28
16.2 Félévközi felkészülés órákra
17
16.3 Felkészülés zárthelyire
0
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
20
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
0
16.7 Egyéb elfoglaltság
0
16.8 Vizsgafelkészülés
25
16.9 Összesen
90
17. Ellenőrző adat Kredit * 30
90
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Dr. Molontay Roland
egyetemi docens
Sztochasztika Tanszék
A tanszékvezető
19. Neve aláírása
Dr. Ráth Balázs