Történelemtudomány és informatika / projektmunka III. – Adatkezelés és -vizualizáció R nyelven

Az adatok hatékony kezelésének, elemzésének, vizualizálásának módszerei interdiszciplinárisak. Ezen a területen a történészeket egyedül az adataik történelmi relevanciája és a megválaszolandó kérdések különböztetik meg az egyéb tudományágak képviselőitól. Aki történészként adatokra kívánja építeni a kutatását, az nem spórolhatja meg a programozás alapszintű elsajátítását. Az R megtanulása bizonyos szempontból persze nagyobb erőfeszítést igényel, mint az interaktív felülettel rendelkező alkalmazások használata. Ez az időbefektetés azonban megtérül azáltal, hogy segítségével szinte bármit megtehetünk az adatainkkal.

A félév során megismerkedünk az R telepítésével, a változók, adattípusok, adatstruktúrák fogalmával, az algoritmusok felépítésével, a vezérlési szerkezetekkel, az R kiegészítő csomagjaival. A kurzus eredményeként a hallgatók képessé válnak a táblázatos adatok és az egymással relációs kapcsolatban lévő táblázatok manipulálására, az idősoros adatok kezelésére, az alapvető szövegbányászati feladatok végrehajtására, az adatok vizuális ábrázolására a fontosabb diagramtípusokkal, valamint általában véve az adatkezelési folyamatok automatizálására. (Az adatbázisokkal és a térinformatikával foglalkozó kurzusok zárásaként egy-egy órában kitérünk az R alkalmazási lehetőségeire azokon a területeken is.)

A következő félévben teljesítendő projektmunka célja a megszerzett ismeretek gyakorlatban való elmélyítése. Ennek során a hallgatóknak egy komplex, az adatgyűjtést, az adatok manipulációját és vizuális megjelenítését egyaránt magában foglaló feladatsort kell végrehajtaniuk. Az alapvetően önállóan, otthoni munkával teljesített feladatokat hétről hétre közösen átbeszéljük az órákon.