Objektumfelismerés és -szegmentáció mély tanulással

Nyomtatóbarát változatNyomtatóbarát változat
Típus: 
MSc diplomamunka téma - orvosi fizika
Félév: 
2018/19/1.
Témavezető: 
Név: 
Dr. Gyires-Tóth Bálint
Email cím: 
toth.b@tmit.bme.hu
Intézet/Tanszék/Cégnév: 
BME Távközlési és Médiainformatikai Tanszék
Beosztás: 
adjunktus
Konzulens: 
Név: 
Légrády Dávid
Email cím: 
legrady@reak.bme.hu
Intézet/Tanszék: 
NTI
Beosztás: 
egy. docens
Elvárások: 

angol nyelvtudás, önálló munkavégzés, statisztikai, gépi tanulási és programozási ismeretek (elsősorban Python)

Leírás: 

Az adatmennyiség robbanásszerű növekedésével, a grafikus processzorok folyamatos technológiai fejlődésével és a tudományterület új eredményeinek köszönhetően az elmúlt években a mély tanuló (deep learning) rendszerek a gépi tanulás alapú képfelismerés egyik leghatékonyabb eszközévé váltak. A képfelismerésen belül kiemelt szerepet kap az objektumok detektálása és szegmentálása, mely művelet célja az adott képen szereplő elemek megtalálása, elkülönítése körberajzolással vagy képpont-pontosan; továbbá kategorizálása.

Ma az objektumfelismerés és -szegmentáció egyik leghatékonyabb eszköze a konvolúciós neurális hálózatok (Convolutional Neural Network, CNN). A CNN a korábbi eljárásokban használt jellemző kinyeréssel szemben képes a jellemzőket magukból az adatokból megtanulni és egy lépésben modellezni. Ennek köszönhetően tudnak ezek az architektúrák minden korábbi módszernél nagyobb pontosságot elérni.

A hatékony objektumfelismeréshez az algoritmus mellett a megfelelő mennyiségű és minőségű tanító adatbázis tartalma és felépítése is kiemelten fontos.

 

A hallgató feladata a szakterülete irodalmának áttekintése, a szoftvereszközök és publikus objektum adatbázisok megismerése (pl. Pascal VOC 2012, MSRA Salient, ADE20K), napjaink legnagyobb pontosságot adó objektum detektáló algoritmusainak kipróbálása, továbbá felügyelet nélküli, részben felügyelt és felügyelt eljárások vizsgálata és esetleges kidolgozása tetszőleges (pl. kóros bőrelváltozásokat tartalmazó) képadatbázison történő objektumfelismerés és -szegmentáció céljából.