Analiza sentymentu internautów (PL i EN) wobec incydentu z Grzegorzem Braunem — instrukcja

Źródła komentarzy:

I. EKSTRAKCJA I OBRÓBKA TEKSTU

Krok 1. Pobranie komentarzy z YouTube

Narzędzie: YouTube Data Tools

  1. Wejdź na: https://ytdt.digitalmethods.net
  2. Wybierz moduł Video Comments.
  3. Wklej URL filmu i wygeneruj plik CSV z komentarzami.
  4. Zapisz plik lokalnie (osobno PL i EN).

Krok 2. Oczyszczenie danych (preprocessing)

Celem jest pozostawienie wyłącznie czystego tekstu komentarzy.

Prompt do oczyszczania:

„Z załączonego pliku wyciągnij jedynie kolumnę text zawierającą komentarze. Komentarze wyczyść dokładnie z emotikon, znaków specjalnych, linków i nazw użytkowników zaczynających się znakiem @. Wyczyszczone dane zapisz do pliku komentarze_clean_YouTube_Braun_PL.txt z kodowaniem UTF‑8.”

Powtórz to samo dla danych anglojęzycznych.

II. ANALIZA SENTYMENTU I EMOCJI

Narzędzia: LLM + Python, Voyant Tools, CLARIN‑PL (Hatespeech/Emotagger), COMMUNALYTICS

1) Analiza LLM + Python (modele BERT + emocje Plutchika)

Wgraj oczyszczony plik i użyj poniższego promptu:

„Wykonaj pełną analizę sentymentu i pełną analizę emocji dla dostarczonego przeze mnie pliku. Użyj do tego narzędzia Python. Do analizy sentymentu zastosuj model BERT (...). Do analizy emocji zastosuj klasyfikację ośmiu emocji wg koła Plutchika (...). Jeśli model BERT lub model emocji nie jest dostępny – wybierz najlepszą dostępną metodę i wykonaj analizę. Wynik przedstaw w formie:
– tabeli sentymentu (ilość i procent)
– klasyfikacji emocji (liczność i procent)
– listy przykładowych komentarzy dla każdej emocji.”

2) Voyant Tools

Wejdź na: https://voyant.digihum.pl

3) CLARIN‑PL – Hatespeech i Emotagger

Strona: https://services.clarin-pl.eu

  1. Stwórz konto i zaloguj się.
  2. Wejdź w zakładkę Korpusy.
  3. Spakuj komentarze do ZIP.
  4. Utwórz nowy korpus.
  5. Uruchom moduły Hatespeech i Emotagger.

4) COMMUNALYTICS

Strona: https://edu.communalytic.org

III. ANALIZA PORÓWNAWCZA (PL vs EN)