Dumni z bycia Polakami - przeczytaj nowe wydanie Kwartalnika Coopernicus!
Artykuł - zdjęcie główne
Błędy językowe 2.0?

Chat GPT (Generative Pre-trained Transformer) to przełomowy model językowy napędzany sztuczną inteligencją, który potrafi tworzyć teksty, jakby były pisane przez człowieka. Stworzony przez OpenAI, organizację badawczą z siedzibą w USA, której założycielami są Elon Musk, Sam Altman i inni wizjonerzy, Chat GPT wykorzystuje zaawansowaną technologię GPT-4 do przetwarzania języka naturalnego. Misją OpenAI jest rozwijanie sztucznej inteligencji w sposób dostępny i bezpieczny dla całej ludzkości. Chat GPT działa, analizując, a także przetwarzając ogromne ilości tekstów, od artykułów oraz książek po strony internetowe, zdobywając dzięki temu szeroką wiedzę na różnorodne tematy. Kluczem do jego sukcesu jest mechanizm zwany transformerem, który umożliwia skuteczną analizę kontekstu i generowanie odpowiedzi, które są nie tylko spójne, ale także sensowne i trafne, nawet w przypadku skomplikowanych pytań.

W badaniu dr Rafała Mazura z Uniwersytetu Jagiellońskiego przeanalizowano poprawność językową tekstów generowanych przez ChatGPT, jednego z najnowocześniejszych modeli generatywnej SI. Celem było zbadanie możliwości i ograniczeń tej technologii, zwłaszcza w kontekście języka polskiego. Mazur wykorzystał darmową wersję ChatGPT opartego na modelu językowym GPT-3.5, aby wygenerować teksty na podstawie poleceń maturalnych z języka polskiego. Analiza obejmowała ocenę poprawności językowej wygenerowanych tekstów, z zastosowaniem typologii błędów Andrzeja Markowskiego, która obejmuje błędy gramatyczne, składniowe, leksykalne, słownikowe, frazeologiczne, słowotwórcze, fonetyczne, stylistyczne, ortograficzne i interpunkcyjne.

Poprawność Składniowa

Badanie wykazało, że ChatGPT ma największe problemy z poprawnym stosowaniem składni języka polskiego, co stanowiło 35% wszystkich błędów. Często pojawiały się błędy w łączliwości składniowej związków zgody i rządu oraz w formach orzeczeń i podmiotów. Przykłady błędów to:

  • „Jednym z tych utworów, które doskonale ilustrują tę problematykę, jest dramat „Antygona” Sofoklesa oraz poemat „Konrad Wallenrod” Adama Mickiewicza”.
  • „Natomiast poezja Adama Mickiewicza, zwłaszcza utwory „Dziady cz III” oraz „Konrad Wallenrod”, przedstawiają inną perspektywę na sprzeczności człowieka”
  • „Wielu pisarzy i poetów, poprzez swoje utwory literackie, starali się zgłębić tę skomplikowaną naturę człowiek”.

Błędy Leksykalne

Błędy leksykalne stanowiły 24% wszystkich błędów. ChatGPT często tworzy nietypowe połączenia wyrazowe i myli znaczenia słów. Przykłady obejmują:

  • „Makbet staje się namiętnie ambitny i gotów popełnić morderstwo, aby osiągnąć swoje cele”.
  • „Fragmenty Księgi Rodzaju i Apokalipsy św. Jana przedstawiają dylematy moralne, wybory i konsekwencje, które dotykają człowieka”.
  • „Rozważając człowieka jako istotę pełną sprzeczności, nie sposób nie odnieść się do postaci Makbeta, głównego bohatera tragedii Szekspira”.

Interpunkcja i Ortografia

Błędy interpunkcyjne stanowiły 22% wszystkich błędów. Częste były przypadki zbędnego użycia przecinków oraz niewłaściwego wydzielania wyrazów lub fraz przecinkami. Przykłady obejmują:

  • „W kontekście tych utworów literackich, warto odwołać się także do kontekstu filozoficznego i egzystencjalnego”.
  • „Podsumowując, zarówno w „Makbecie” Szekspira, jak i w „Konradzie Wallenrodzie” Mickiewicza, autorzy ukazują człowieka jako istotę pełną sprzeczności”.
źródło: Rafał Mazur, O POPRAWNOŚCI JĘZYKOWEJ TEKSTÓW GENEROWANYCH PRZEZ SI NA PRZYKŁADZIE CHATUGPT, https://journals.akademicka.pl/lv/article/view/5756/5360

Mimo zaawansowanej technologii, model ChatGPT nadal ma trudności z poprawnym posługiwaniem się językiem polskim. Przyszłość używania ChatGPT jest pełna obietnic i możliwości. W miarę jak technologia będzie się rozwijać, możemy spodziewać się coraz szerszego jej zastosowania w różnych dziedzinach życia. Już teraz ChatGPT znajduje zastosowanie w tworzeniu treści marketingowych, wspomaganiu obsługi klienta, generowaniu pomysłów na scenariusze filmowe, a nawet w pisaniu artykułów naukowych.

Błędy składniowe i leksykalne wynikają z braku głębokiego zrozumienia kontekstu i zasad gramatycznych. Problemy z interpunkcją mogą być spowodowane różnicami między językami. ChatGPT dobrze radzi sobie z tworzeniem wypowiedzi neutralnych stylistycznie, jednak powtarzające się frazy mogą sprawiać, że teksty są odbierane jako nienaturalne. Pomimo ograniczeń, sztuczna inteligencja jest użytecznym narzędziem, które może przyspieszyć proces tworzenia tekstów. Jednak zawsze wymaga dokładnej redakcji i korekty.

Bibliografia: 

Rafał Mazur, O POPRAWNOŚCI JĘZYKOWEJ TEKSTÓW GENEROWANYCH PRZEZ SI NA PRZYKŁADZIE CHATUGPT, https://journals.akademicka.pl/lv/article/view/5756/5360

Zuzanna Czernicka
Bio:
I am deeply immersed in the dynamic world of banking and FinTech. My focus encompasses critical areas such as foreign exchange, payments, and the cutting-edge landscape of FinTech regulation. My academic interests span a broad range of topics including electronic payments, Open Banking, blockchain impacts, the DeFi ecosystem, NFTs, ICOs, and tokenization. I am dedicated to understanding and analyzing the new regulatory frameworks shaping the FinTech world. Currently, I am writing my Bachelor's thesis on the robo-advisory services. This work reflects my commitment to understanding and contributing to the regulatory frameworks that are vital for the growth and governance of emerging financial technologies.
Dodaj komentarz