1. Áttekintés: Mitől optikai az optikai karakterfelismerés? Az OCR alapvető fajtái: dinamikus vagy kép-alapú, nyomtatott vagy kézírásos. Szöveg és ábra-típusok, írások, betűtípusok. Zajszűrés, binarizálás, a dokumentum felbontása. Egy konkrét feladat: matematikakönyvből LaTeX kód. Mit
lehet automatizálni, és mit nem?
2. Az alacsonyszintű képfeldolgozás alapjai. Zajszűrés, határkeresés, szinredukció, binarizálás, csontvázépítés, vektorizáció , lánckódolás. Poligonok, kritikus pontok. Iránykeresés, dőlésbecslés, zónákra bontás.
3. A szövegzóna elemzése: sorok, iniciálé. A latin alapú ábécék struktúrája. Alapvető font-osztályok. A binárisés az általános osztályozási feladat. Standard adatbázisok.
4. A jegyszámítás (feature extraction). A legfontosabb jegyosztályok, geometriai momentumok, Zernike momentumok. Szegmentálás és osztályozás mint egymást követő feladatok, típushibák. Adattömörítés, a legegyszerűbb nyelvmodellek.
5. Az osztályozók főbb típusai. Hasonlósági (nearest neighbor), ideghálózati (neural network), lineáris, határszélesítő (max margin), maxent, és
egyéb osztályozási módszerek.
6. A szegmentálási, osztályozási, és nyelvmodellezési problémák közös megoldása rejtett Markov modellekkel. Szavazás, tényező k integrálása, modellek integrálása.