Analiza sentymentu internautów (PL i EN) wobec incydentu z Grzegorzem Braunem — instrukcja

Źródła komentarzy:

KOMENTARZE PL: https://www.youtube.com/shorts/GOiXx3o9pB8
KOMENTARZE EN: https://www.youtube.com/watch?v=ctdoDJKPBus

I. EKSTRAKCJA I OBRÓBKA TEKSTU

Krok 1. Pobranie komentarzy z YouTube

Narzędzie: YouTube Data Tools

Wejdź na: https://ytdt.digitalmethods.net
Wybierz moduł Video Comments.
Wklej URL filmu i wygeneruj plik CSV z komentarzami.
Zapisz plik lokalnie (osobno PL i EN).

Krok 2. Oczyszczenie danych (preprocessing)

Celem jest pozostawienie wyłącznie czystego tekstu komentarzy.

Prompt do oczyszczania:

„Z załączonego pliku wyciągnij jedynie kolumnę text zawierającą komentarze. Komentarze wyczyść dokładnie z emotikon, znaków specjalnych, linków i nazw użytkowników zaczynających się znakiem @. Wyczyszczone dane zapisz do pliku komentarze_clean_YouTube_Braun_PL.txt z kodowaniem UTF‑8.”

Powtórz to samo dla danych anglojęzycznych.

II. ANALIZA SENTYMENTU I EMOCJI

Narzędzia: LLM + Python, Voyant Tools, CLARIN‑PL (Hatespeech/Emotagger), COMMUNALYTICS

1) Analiza LLM + Python (modele BERT + emocje Plutchika)

Wgraj oczyszczony plik i użyj poniższego promptu:

„Wykonaj pełną analizę sentymentu i pełną analizę emocji dla dostarczonego przeze mnie pliku. Użyj do tego narzędzia Python. Do analizy sentymentu zastosuj model BERT (...). Do analizy emocji zastosuj klasyfikację ośmiu emocji wg koła Plutchika (...). Jeśli model BERT lub model emocji nie jest dostępny – wybierz najlepszą dostępną metodę i wykonaj analizę. Wynik przedstaw w formie:
– tabeli sentymentu (ilość i procent)
– klasyfikacji emocji (liczność i procent)
– listy przykładowych komentarzy dla każdej emocji.”

2) Voyant Tools

Wejdź na: https://voyant.digihum.pl

Wgraj plik z komentarzami
Załaduj listę stop‑words
Analizuj: chmurę słów, kontekst fraz, trendy, współwystępowania, @positie i @negative / ^@positive i ^@negative terminy

3) CLARIN‑PL – Hatespeech i Emotagger

Strona: https://services.clarin-pl.eu

Stwórz konto i zaloguj się.
Wejdź w zakładkę Korpusy.
Spakuj komentarze do ZIP.
Utwórz nowy korpus.
Uruchom moduły Hatespeech i Emotagger.

4) COMMUNALYTICS

Strona: https://edu.communalytic.org

Stwórz konto i zaloguj się
Wgraj surowe komenatrze z Youtube
Uruchom analizę sentymentu, toksyczności, statystyki językowe itp.

III. ANALIZA PORÓWNAWCZA (PL vs EN)

Porównanie sentymentu – różnice w tonie PL vs EN.
Porównanie emocji – dominujące emocje w obu grupach.
Analizę hejtu – z wykorzystaniem CLARIN i COMMUNALYTICS.
Wnioski końcowe – interpretacja różnic kulturowych i reakcji politycznych.