A tantárgy az alábbi témakörök ismeretére épít:
matematikai és informatikai alapfogalmak (középiskolai szinten)
A tantárgy szerepe a képzés céljának megvalósításában:
TTK Kognitív MSc képzésének kötelezően választható tárgya
A tantárgy részletes tematikája magyarul és angolul:
A tárgy célja, hogy a hallgatók magabiztosan és önállóan képesek legyenek az empirikus kutatás során felmerülő alapvető adatfeldolgozási, adatrendezési és adatábrázolási problémák megoldására az R statisztikai szoftvercsomag segítségével. A hallgatók a félév végére egy saját adatfeldolgozási és ábrázolási projektet készítenek el.
A tárgy a következő kérdéskörökre összpontosít:
- hogyan jelenítsük meg az adatainkat, mit mondanak az ábrák az adatokról?
- hogyan olvassunk be adatokat különböző formátumokból?
- hogyan tudunk adattáblákat egyesíteni oszlopok, illetve sorok mentén?
- hogyan érdemes strukturálni az adatokat?
- hogyan tudjuk tisztítani az adatokat?
- hogyan számíthatunk új változókat?
- hogyan készíthetünk leíró statisztikákat az adatfelfedezés és az adatfeldolgozás során?
- hogyan tudjuk automatizálni az adatfeldolgozási lépéseket?
- hogyan készíthetünk saját függvényeket?
- hogyan segítheti az R programozás a reprodukálható kutatást?
Követelmények szorgalmi időszakban:
Saját adatprojekt beadása és bemutatása
Konzultációs lehetőségek:
Jegyzet, tankönyv, felhasználható irodalom:
Grolemund G & Wickham H: R for Data Science http://r4ds.had.co.nz/
Vignettes for the data.table R package https://github.com/Rdatatable/data.table/wiki/Getting-started
Peng RD & Matsui E: The Art of Data Science https://leanpub.com/artofdatascience