Tantárgy azonosító adatok
1. A tárgy címe Nemparaméteres statisztika és információelmélet
2. A tárgy angol címe Nonparametric Statistics and Information Theory
3. Heti óraszámok (ea + gy + lab) és a félévvégi követelmény típusa 2 + 0 + 0 v Kredit 3
4. Ajánlott/kötelező előtanulmányi rend
vagy Tantárgy kód 1 Rövid cím 1 Tantárgy kód 2 Rövid cím 2 Tantárgy kód 3 Rövid cím 3
4.1
4.2
4.3
5. Kizáró tantárgyak
6. A tantárgy felelős tanszéke Sztochasztika Tanszék
7. A tantárgy felelős oktatója Dr. Kói Tamás beosztása egyetemi adjunktus
Akkreditációs adatok
8. Akkreditációra benyújtás időpontja 2024.05.03. Akkreditációs bizottság döntési időpontja 2024.05.15.
Tematika
9. A tantárgy az alábbi témakörök ismeretére épít
BSc level probability theory and statistics – BSc szintű valószínűségszámítás és statisztika
10. A tantárgy szerepe a képzés céljának megvalósításában (szak, kötelező, kötelezően választható, szabadon választható)
TTK Matematikus és Alkalamazott matematikus képzések kötelezően választható tárgya
11. A tárgy részletes tematikája

Általános leírás: A nemparametrikus statisztika olyan statisztikai megközelítéseket kínál, amelyek a lehető legkevesebb feltételezést teszik az adatokkal kapcsolatban. Ezek a módszerek a matematikai modellek széles körében hatékonyak. Különös hangsúlyt kapnak az információs mértékek. Alapvető jellegüket a statisztika és az adattömörítés problémáinak megoldásában való megjelenésükön keresztül mutatjuk be.  Bár a tananyag némileg elméleti jellegű, minden egyes téma hasznos lehet az olyan, inkább alkalmazott tudományágakban, mint a gépi tanulás és az adatbányászat. Az anyag elegáns és meggyőző bizonyításokat tartalmaz. 

Témakörök:

  • Regressziós probléma, univerzális konzisztencia, partícionáló regressziós függvény becslések., kernelbecslések, legközelebbi szomszéd becslések.
  • Mintafelismerés
  • Glivenko-Cantelli-tétel, Vapnik-Chervonenkis dimenzió
  • Univerzális sűrűségfüggvény becslés
  • Kullbach-Leibler-divergencia, entrópia, kölcsönös információ, stacionárius folyamat entrópiarátája
  • Zajmentes forráskódolás tétele, aritmetikai kódok, univerzális tömörítés
  • Nagy eltérés a típusok módszerével
  • Az információgeometria alapjai: I-projekció, lineáris és exponenciális eloszláscsaládok, Pitagorasz-azonosság, maximum likelihood becslés exponenciális családok esetén
  • Log-lineáris modellek és egyéb grafikus modellek
  • Iteratív algoritmusok

General description: Nonparametric statistics provides statistical approaches that make as few assumptions about the data as possible. These methods are effective across a broad range of mathematical models. Particular emphasis will be on information measures. Their fundamental nature is demonstrated through their appearances in the solutions of problems in statistics and data compression.  Although the course material is somewhat theoretical, each topic is helpful in more applied disciplines, such as machine learning and data mining. The material is elegant and contains compelling proofs.  

Topics:

  • Regression problem, universal consistency of the partitioning regression function estimates, kernel estimates, nearest neighbour estimates
  • Pattern recognition
  • Glivenko-Cantelli theorem, Vapnik–Chervonenkis dimension
  • Universal density estimation
  • Kullbach-Leibler divergence, entropy, mutual information, entropy rate of a stationary process
  • Noiseless source coding theorem, arithmetic codes, universal compression
  • Large deviation via the method of types
  • Basics of information geometry: I-projection, linear and exponential distribution families, Pythagorean identity, maximum likelihood estimation in case of exponential families
  • Log-linear models and other graphical models
  • Iterative algorithms
12. Követelmények, az osztályzat (aláírás) kialakításának módja
szorgalmi
időszakban
Regular submission of homework – házi feladatok rendszeres beadása vizsga-
időszakban
Succesful exam (sikeres vizsga)
13. Pótlási lehetőségek
70% of the homework will be taken into account – A házi feladatoknak a 70%-a lesz figyelembevéve
14. Konzultációs lehetőségek
Weekly during the lecturer's office hours and extra consultations before the exams – Heti rendszerességgel az oktató fogadó órájában illetve külön konzultáció a vizsgák előtt
15. Jegyzet, tankönyv, felhasználható irodalom
Csiszár and P.C. Shields (2004), "Information Theory and Statistics: A Tutorial", Foundations and Trends® in Communications and Information Theory: Vol. 1: No. 4, pp 417-528. http://dx.doi.org/10.1561/0100000004
Györfi, L., Kohler, M., Krzyżak, A., & Walk, H. (2002). A Distribution-Free Theory of Nonparametric Regression. Springer Series in Statistics. – Györfi L., Nonparametric statistics, lecture notes, http://www.cs.bme.hu/~gyorfi/booknonpar.pdf
Csiszár I, Körner J. Information Theory: Coding Theorems for Discrete Memoryless Systems. 2nd ed. Cambridge University Press; 2011.
Thomas M. Cover and Joy A. Thomas. 2006. Elements of Information Theory (Wiley Series in Telecommunications and Signal Processing). Wiley-Interscience, USA.
16. A tantárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
16.1 Kontakt óra
28
16.2 Félévközi felkészülés órákra
12
16.3 Felkészülés zárthelyire
0
16.4 Zárthelyik megírása
0
16.5 Házi feladat elkészítése
20
16.6 Kijelölt írásos tananyag elsajátítása (beszámoló)
0
16.7 Egyéb elfoglaltság
0
16.8 Vizsgafelkészülés
30
16.9 Összesen
90
17. Ellenőrző adat Kredit * 30
90
A tárgy tematikáját kidolgozta
18. Név beosztás Munkahely (tanszék, kutatóintézet, stb.)
Dr. Kói Tamás
egyetemi adjunktus
Sztochasztika Tanszék
A tanszékvezető
19. Neve aláírása
Dr. Simon Károly