BMETE959307

Nyomtatóbarát változatNyomtatóbarát változat
Tantárgy azonosító adatok
A tárgy címe: 
Statisztikai módszerek az adatbányászatban
A tárgy angol címe: 
Statistical methods in data mining
A tárgy rövid címe: 
Adatstatisztika
2
0
0
v
Kredit: 
3
Ajánlott/Kötelező előtanulmányi rend
1.Követelménytárgy kódja: 
BMETE951213
1.Követelménytárgy (rövidített) címe: 
Mat stat ea.
1.Köv.tárgyat kiváltó 1.tárgy kódja: 
BMETE951233
1.Köv.tárgyat kiváltó 1.tárgy (rövidített) címe: 
Mat stat gy.
A tantárgy felelős tanszéke: 
Sztochasztika Tanszék
A tantárgy felelős oktatója: 
Dr. Bolla Marianna
A tantárgy felelős oktatójának beosztása: 
egyetemi docens
Akkreditációs adatok
Akkreditációra benyújtás időpontja: 
2006.11.16.
Akkreditációs bizottság döntési időpontja: 
2006.12.19.
Tematika
A tantárgy az alábbi témakörök ismeretére épít: 
Paraméteres és nemparaméteres statisztikai módszerek, feltételes várható érték, gráfok, mátrixok.
A tantárgy szerepe a képzés céljának megvalósításában: 
Szabadon választható tárgy. A statisztika modern algoritmikus modelljeinek alkalmazása hálózatokra és nagyméretű diszkrét adatrendszerekre.
A tantárgy részletes tematikája magyarul és angolul: 

Napjaink nagyméretű, sokdimenziós adatrendszerei a klasszikus statisztikai módszerek keretein túlmutató vizsgálatokat igénye lnek. Bemutatjuk az erre a célra az utóbbi ötven évben kifejlesztett ún. algoritmikus modelleket: EM-algoritmus hiányos adatokra, ACE-algoritmus általánosított
regresszióra, Kaplan-Meier becslések cenzorált adatokra, jackknife és bootstrap algoritmusok újramintavételezésre. Regresszió és diszkriminanciaanalízis összekapcsolása a Gauss-Markov elmélet és Bayes-döntések alapján. Autokorrelációk vizsgálata idősorokban, ARMA- folyamatok. Paraméterbecslés, identifikáció.

Hálózatok struktúrájának feltárása nemparaméteres statisztikai módszerek és gráfok spektrális tulajdonságai segítségével. Többváltozós korrespondanciaanalízis és homogenitásvizsgálat többdimenziós kontingenciatáblákra, diszkrét változók varianciaanalízise, ran gstatisztikák. Gráfok és hipergráfok Laplace-mátrixa, k-vágások mérőszámainak becslése a sajátértékekkel. Spektrális gráfklaszterezés a Laplace-mátrix sajátvektoraival. Nagyméretű véletlen mátrixok kiugró sajátértékeinek ill. szinguláris értékeinek aszimptotikus viselkedése és eloszlásuk speciális esetekben. Véletlenített módszerek nagyméretű téglalapmátrixok szinguláris felbontására. Hatvány fokszámeloszlású véletlen gráfok statisztikus jellemzői.

A matematikai egzaktsággal tárgyalt elméleten túl szó lesz konkrét alkalmazási lehetőségekről az adatbányászatban (internetes, pénzügyi adatrendszerek, kommunális hálózatok, microarrayk, sejtek metabolikus rendszere).

Követelmények szorgalmi időszakban: 
szabadon feldolgozott cikk, órák látogatása
Követelmények vizsgaidőszakban: 
vizsga
Pótlási lehetőségek: 
vizsgaidőszak első hetében pótbeszámoló a feldolgozott cikkről
Konzultációs lehetőségek: 
hetente fogadóóra, vizsgák előtt külön konzultáció
Jegyzet, tankönyv, felhasználható irodalom: 
T. Hastie, R. Tibshirani, J. Friedman: The Elements of Statistical Learning. Data Mining... Springer, New York, 2001.
B. Bollobás: Random Graphs, 2nd ed., Cambridge University Press, 2001.
F. R. K. Chung: Spectral Graph theory, CBMS Series, No. 92, AMS Publ., 1997.
A tárgy elvégzéséhez átlagosan szükséges tanulmányi munka mennyisége órákban (a teljes szemeszterre számítva)
Kontakt óra: 
28
Félévközi felkészülés órákra: 
28
Felkészülés zárthelyire: 
0
Zárthelyik megírása: 
0
Házi feladat elkészítése: 
12
Kijelölt írásos tananyag elsajátítása (beszámoló): 
5
Egyéb elfoglaltság: 
0
Vizsgafelkészülés: 
17
Összesen: 
90
Ellenőrző adat: 
90
A tárgy tematikáját kidolgozta
Név: 
Dr. Bolla Marianna
Beosztás: 
egyetemi docens
Munkahely (tanszék, kutatóintézet, stb.): 
Sztochasztika Tanszék
A tanszékvezető neve: 
Dr. Tóth Bálint
A tantárgy adatlapja PDF-ben: