Cyfrowa humanisyka
Materiały do zajęć w semestrze letnim 2026
WPROWADZENIE: Rodzaje korposów, reprezentatywność, przygotowanie tekstu (czyszczenie, tokenizacja), metody statystyczne: częstości, n-gramy, kolokacje, konkordancje (KWIC), proste wizualizacje (chmura słów, wykres liniowy, bąbelkowy).
Korpusy wielojęzyczne
Korpusy born-digital archive / archiwistyka webu
Analiza korpusowa
Modele tematyczne, embeddingi, klasyfikacja i klasteryzacja, ewaluacja modeli oraz dobre praktyki replikowalności.
Analiza sieci (SNA): węzły, krawędzie, centralność, społeczności. Budowa grafów relacji osób, pojęć i źródeł.
Mapy narracyjne, dane przestrzenne, proste analizy w narzędziach GIS i publikacja interaktywnych historii.
Metody ilościowe i jakościowe w badaniach kultury: od korpusów po wizualizację wniosków dla szerokiej publiczności.
Bezpieczne użycie modeli AI, etyka i zgodność, podstawy bezpieczeństwa danych w projektach humanistycznych.