Analiza sentymentu internautów (PL i EN) wobec incydentu z Grzegorzem Braunem — instrukcja
Źródła komentarzy:
I. EKSTRAKCJA I OBRÓBKA TEKSTU
Krok 1. Pobranie komentarzy z YouTube
Narzędzie: YouTube Data Tools
- Wejdź na: https://ytdt.digitalmethods.net
- Wybierz moduł Video Comments.
- Wklej URL filmu i wygeneruj plik CSV z komentarzami.
- Zapisz plik lokalnie (osobno PL i EN).
Krok 2. Oczyszczenie danych (preprocessing)
Celem jest pozostawienie wyłącznie czystego tekstu komentarzy.
Prompt do oczyszczania:
„Z załączonego pliku wyciągnij jedynie kolumnę text zawierającą komentarze. Komentarze wyczyść dokładnie z emotikon, znaków specjalnych, linków i nazw użytkowników zaczynających się znakiem @. Wyczyszczone dane zapisz do pliku komentarze_clean_YouTube_Braun_PL.txt z kodowaniem UTF‑8.”
Powtórz to samo dla danych anglojęzycznych.
II. ANALIZA SENTYMENTU I EMOCJI
Narzędzia: LLM + Python, Voyant Tools, CLARIN‑PL (Hatespeech/Emotagger), COMMUNALYTICS
1) Analiza LLM + Python (modele BERT + emocje Plutchika)
Wgraj oczyszczony plik i użyj poniższego promptu:
„Wykonaj pełną analizę sentymentu i pełną analizę emocji dla dostarczonego przeze mnie pliku. Użyj do tego narzędzia Python. Do analizy sentymentu zastosuj model BERT (...). Do analizy emocji zastosuj klasyfikację ośmiu emocji wg koła Plutchika (...). Jeśli model BERT lub model emocji nie jest dostępny – wybierz najlepszą dostępną metodę i wykonaj analizę. Wynik przedstaw w formie:
– tabeli sentymentu (ilość i procent)
– klasyfikacji emocji (liczność i procent)
– listy przykładowych komentarzy dla każdej emocji.”
2) Voyant Tools
Wejdź na: https://voyant.digihum.pl
- Wgraj plik z komentarzami
- Załaduj listę stop‑words
- Analizuj: chmurę słów, kontekst fraz, trendy, współwystępowania, @positie i @negative / ^@positive i ^@negative terminy
3) CLARIN‑PL – Hatespeech i Emotagger
Strona: https://services.clarin-pl.eu
- Stwórz konto i zaloguj się.
- Wejdź w zakładkę Korpusy.
- Spakuj komentarze do ZIP.
- Utwórz nowy korpus.
- Uruchom moduły Hatespeech i Emotagger.
4) COMMUNALYTICS
Strona: https://edu.communalytic.org
- Stwórz konto i zaloguj się
- Wgraj surowe komenatrze z Youtube
- Uruchom analizę sentymentu, toksyczności, statystyki językowe itp.
III. ANALIZA PORÓWNAWCZA (PL vs EN)
- Porównanie sentymentu – różnice w tonie PL vs EN.
- Porównanie emocji – dominujące emocje w obu grupach.
- Analizę hejtu – z wykorzystaniem CLARIN i COMMUNALYTICS.
- Wnioski końcowe – interpretacja różnic kulturowych i reakcji politycznych.