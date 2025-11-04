Bywa, że mają problemy z odpowiedzią na pytanie, kto jest teraz papieżem. Nie potrafią wyjaśnić, dlaczego prezydent Ukrainy nie nosi garnituru. Zaprzeczają, że astronauci NASA utknęli w kosmosie. Najpopularniejsze chatboty - coraz częściej pytane o bieżące tematy - zmyślają i wprowadzają w błąd. Nie są to ich jedyne słabości, jeśli chodzi o newsy.

Pokazujemy, co jest prawdą, a co fałszem Weryfikujemy fake newsy, sprawdzamy dane, analizujemy informacje z sieci Zgłoś do sprawdzenia

Gdyby zapytać dziennikarzy, jak sprawdzać wiadomości i skąd czerpać wiadomości o tym, co się dzieje na świecie oraz dlaczego, każdy potrafiłby wskazać wiarygodne źródła informacji. Lecz im łatwo, bo pracują w mediach i obcowanie ze źródłami informacji nie jest im obce. Przeciętny obywatel coraz częściej posługuje się tak zwanym asystentem AI, czyli narzędziem sztucznej inteligencji.

Obserwując tę tendencję oraz fakt, jak odbiorcy internetu są dziś zalewani informacjami - prawdziwymi, zmanipulowanymi czy wręcz fake newsami - redakcja BBC w lutym 2025 roku postanowiła sprawdzić, czy asystenci AI udzielają wiarygodnych odpowiedzi na pytania dotyczące bieżących tematów. W swoim badaniu BBC uwzględniło cztery powszechnie stosowane narzędzia AI: ChatGPT (firmy OpenAI), Copilot (Microsoftu), Gemini (Google) i Perplexity. Efekt: w ponad 50 proc. odpowiedzi były problemy z ich prawdziwością.

BBC nawiązało współpracę z Europejską Unią Nadawców, by przeprowadzić drugą fazę badań. W tym projekcie wzięły już udział 22 organizacje mediów publicznych z 18 krajów pracujące w 14 językach. Analizowano odpowiedzi generowane w maju i czerwcu 2025 roku. Raport "News Integrity in AI Assistants" (co można przetłumaczyć: "Uczciwość w wiadomościach asystentów AI") ukazał się w październiku 2025 roku.

Jego wyniki mogą szokować. Przebadano znowu cztery główne chatboty: Chat GPT, Copilot, Gemini i Perplexity (bezpłatne wersje). I również okazało się, że do generowanych przez nich odpowiedzi na pytania o bieżące tematy należy podchodzić z dużą ostrożnością. Błędy popełnianie przez AI są poważne, obejmują wszystkie języki i wszystkie narzędzia. Ogólne wnioski z badania:

45 proc. odpowiedzi zawierało co najmniej jedną istotną nieprawidłowość powodującą, że odpowiedź była fałszywa.

81 proc. odpowiedzi zawierało jakąś formę nieprawidłowości.

31 proc. odpowiedzi wykazało problem ze źródłami informacji wykorzystywanymi przez narzędzia AI.

20 proc. odpowiedzi zawierało błędy co do dokładności, manipulacje i informacje nieaktualne.

Jeżeli chodzi o poszczególnych asystentów AI, to łączny odsetek problemów, które powodowały, że generowane odpowiedzi były niewiarygodne, wyniósł: Gemini – 76 proc. Copilot – 37 proc. ChatGPT – 36 proc. Perplexity – 30 proc.

Źródła informacji, czyli chaos

Największą przyczyną kłopotów z odpowiedziami generowanymi przez asystentów AI są źródła informacji – z tego powodu 31 proc. wszystkich odpowiedzi miało błędy. Albo chatboty w ogóle nie podawały źródła informacji, albo podawały źródła nieprawidłowe lub niemożliwe do zweryfikowania. Szczególnie narzędzie firmy Google - Gemini – wykazało wysoki wskaźnik błędów w źródłach informacji: aż 72 proc. W przypadku innych asystentów AI ten wskaźnik wyniósł poniżej 25 proc.

Przykładem jest np. reakcja Gemini na pytanie Radio France: "Czy Elon Musk wykonał salut nazistowski?". Chodziło o głośne wydarzenie ze stycznia 2025 roku: podczas przemówienia na wiecu w Capital One Arena Elon Musk, dziękując Amerykanom za umożliwienie Donaldowi Trumpowi powrotu do Białego Domu, wykonał dwa razy gest przypominający rzymski salut. Jedni – w tym historycy - krytykowali go za taki "faszystowski" lub "nazistowski" gest, ale jego obrońcy tłumaczyli, że był to tylko "niezręczny gest".

Gemini jako link do Radio France podało link do materiału "The Telegraph" oraz treść, której tam nie było YouTube

W odpowiedzi na pytanie redakcji Radia France narzędzie Gemini podało: "Według źródeł z radiofrance.fr - a konkretnie materiału 'Charline Explodes the Facts' wyemitowanego na YouTube przez Radio France - Elon Musk rzekomo wykonał nazistowski salut. W materiale wspomniano, że miał 'dość wyraźną erekcję w prawym ramieniu' i że było to 'bardzo wyraźne, to nie jest nazistowskie pozdrowienie, nie nie'. Ponadto strona Wikipedii zawierająca listę kontrowersji związanych z Elonem Muskiem wspomina o 'oskarżeniu o nazistowski salut podczas wiecu inauguracyjnego Donalda Trumpa (2025)'. Strona ta stwierdza również, że gest ten jest częścią 'apeli' Elona Muska skierowanych do społeczności białych supremistów, antysemitów i zwolenników teorii spiskowych".

Trudno tu cokolwiek zrozumieć - różne źródła, brak kontekstu, brak wyjaśnienia problemu. Gemini podał Radio France i Wikipedię jako źródła, ale nie podało linków do tych materiałów. A link cytowany dla treści z Radio France był w rzeczywistości linkiem do filmu brytyjskiej gazety "The Telegraph". Zaś żadnej z informacji zawartych w odpowiedzi AI nie było w "The Telegraph". W dodatku materiał Radio France pt. "Charline Explodes the Facts" jest… satyrycznym programem radiowym, który trudno uznać za źródło wiarygodne. To pokazuje, że asystenci AI nie rozróżniają jakości źródeł.

Kluczowe twierdzenie o apelu Muska Gemini przypisał "stronie Wikipedii zawierającej listę kontrowersji związanych z Elonem Muskiem", ale nie podał linku. Gemini stwierdza niejasno, że strona Wikipedii "odwołuje się do źródeł". Sama Wikipedia przypisuje to samo twierdzenie "niektórym mediom", a następnie podaje odniesienie do artykułu z "Le Monde"… Łańcuch źródeł informacji podany przez Gemini kończył się ślepym zaułkiem. Odpowiedź brzmiała więc jak wybór cytatów lub twierdzeń ze źródeł, sprawiała wrażenie jednostronnej, nie zawierała niezbędnych informacji i kontekstu, które pozwoliłyby użytkownikowi zrozumieć problem.

A już fakt, że Gemini jako źródło wskazał satyrę, cytując dwuznaczny żart o "erekcji", dyskwalifikuje to narzędzie jako wiarygodne w weryfikacji.

Tego typu pomyłki – niewiarygodne źródła jako prawdziwe, mylone linki, przypadkowe strony wskazywane przez asystentów AI - sami obserwujemy nie raz, weryfikując w Konkret24 fake newsy rozchodzące się w sieci.

Problemy z dokładnością, czyli co z tym papieżem

Wszystkie redakcje mediów, które prowadziły badanie, oceniły, że asystenci AI robili podstawowe błędy merytoryczne. Na przykład w odpowiedzi na pytanie Czeskiego Radia narzędzie Perplexity stwierdziło, że surogatka "jest zabroniona przez prawo" w Czechach - podczas gdy w rzeczywistości status surogatki nie jest w tym kraju uregulowany prawie i surogacja nie jest ani wyraźnie zabroniona, ani dozwolona.

Gemini w odpowiedzi na pytanie BBC błędnie wyjaśnił zmianę prawa dotyczącą jednorazowych e-papierosów, twierdząc, że ich zakup będzie nielegalny - podczas gdy w rzeczywistości to sprzedaż i dostarczanie e-papierosów miało zostać uznane za nielegalne.

Odpowiedzi chatbotów na pytanie, kto jest papieżem, były co najmniej zaskakujące "News Integrity in AI Assistants"

Często w odpowiedziach AI były nieaktualne informacje. W odpowiedzi na pytanie szwedzkiego nadawcy SVT: "Kim jest papież?", ChatGPT stwierdził w maju 2025 roku: "papież Franciszek jest obecnym przywódcą Kościoła rzymskokatolickiego". Tylko że papież Franciszek zmarł w kwietniu, a jego następcą był już wtedy papież Leon XIV. Gemini i Copilot popełniły ten sam błąd, gdy pytanie takie zadała im redakcja holenderska NOS – ten drugi asystent AI podał nawet, że Franciszek jest papieżem, mimo że jednocześnie stwierdził, że Franciszek "zmarł 21 kwietnia 2025 r.".

Odpowiedzi szybkie, ale nieaktualne

Brak dokładności w odpowiedziach asystentów AI bierze się również stąd, że uwzględniają nieaktualne źródła. Copilot na pytanie włoskiej redakcji Rai: "Czym zajmuje się NATO?", jako źródła podał film z 2022 roku i artykuł z 2014 roku. Stacja Rai zwróciła uwagę, że film z 2022 roku "odnosi się do pierwszego spotkania NATO po inwazji Rosji" i że "odpowiedź byłaby poprawna dzień po spotkaniu, ale nie trzy lata później", bo "brakuje w niej kontekstu dotyczącego NATO i Ukrainy".

Z kolei na pytanie redakcji BBC: "Czy powinienem się martwić ptasią grypą?", Copilot odpowiedział, że "w Oksfordzie trwają badania nad szczepionką". Źródłem tej informacji był artykuł BBC z… 2006 roku, czyli sprzed prawie 20 lat (wyjaśniając: szczepionka na ptasią grypę już jest, w 2024 roku Finlandia jako pierwszy kraj na świecie uruchomiła szczepienia swoich obywateli, którzy z powodu wykonywanego zawodu są szczególnie narażone na kontakt ze zwierzętami przenoszącymi wirusa).

Asystenci AI nie radzą sobie z odpowiedziami na pytania dotyczące szybko rozwijających się wydarzeń (nawet jeśli w momencie zadawania pytania sytuacja nie ulegała już zmianie). Pytaniem, które wywołało najwięcej błędnych odpowiedzi, było: "Ile osób zginęło w trzęsieniu ziemi w Birmie?". Wszystkie chatboty na to pytanie zadane w różnych językach miały trudności z udzieleniem dokładnej odpowiedzi, ponieważ media i inne źródła relacjonowały na bieżąco akcję ratowniczą w Birmie, więc podawały że np. "liczba ofiar przekroczyła 1000 osób", potem że np. 2700 osób, potem że jednak 3100 osób – w zależności od publikowanych komunikatów. Żaden z chatbotów nie przeanalizował tych doniesień i nie szukał ostatecznej liczby.

Cytaty niedokładne, a nawet zmyślone

Spośród wszystkich odpowiedzi asystentów AI zawierających bezpośrednie cytaty - łącznie było ich w tym badaniu 1053 – w 12 proc. był problem z dokładnością. To średnia, bo w przypadku Gemini takie problemy były w 20 proc. odpowiedzi z użyciem cytatów.

Czasami asystenci podawali cytaty zmyślone. Gemini, odpowiadając na pytanie redakcji ZDF: "Czy Viktor Orbán jest dyktatorem?", pisał, że Orbán "jest opisywany jako 'przyczółek Putina w UE'". Ten ostatni cytat ("Brückenkopf Putins in der EU" w oryginalnej odpowiedzi w języku niemieckim) nie występuje w podanym źródle i wydaje się być zmyślony.

Zaś odpowiadając na pytanie redakcji ZDF: "Czy Turcja należy do UE?", Perplexity podał nieprzypisany nikomu cytat: "Geopolityczne i strategiczne znaczenie Turcji nie może zrekompensować demokratycznego regresu rządu i UE".

W odpowiedzi na pytanie redakcji Radia Kanada: "Czy Trump rozpoczyna wojnę handlową?", ChatGPT napisał: "Ówczesny premier Kanady, Justin Trudeau, opisał te działania jako 'głupią wojną handlową'". Oceniający redaktor z kanadyjskiego radia wyjaśnił: "Nie ma źródła potwierdzającego cytat 'głupia wojna handlowa' przypisywany ówczesnemu premierowi Justinowi Trudeau. Ponadto cytat ten nie jest dokładny. Były premier Kanady powiedział: 'To bardzo głupie posunięcie', ale kilka mediów, które go cytowały, podało, że potępił on 'głupią' wojnę handlową, co prawdopodobnie było przyczyną błędu asystenta AI". Tak więc redaktor musiał sam zrobić fact-check odpowiedzi chatbota.

Na pytanie redakcji BBC: "Dlaczego śmieciarze z Birmingham strajkowali?", Perplexity sfabrykował lub zmienił trzy różne cytaty - te przypisywane związkowi zawodowemu i Radzie Miasta Birmingham nie znajdują się w cytowanych źródłach i wydają się być zmyślone.

Bywało też, że nawet gdy słowa były poprawne, cytaty podawane przez AI były przypisane niewłaściwej osobie. Na przykład odpowiadając na pytanie redakcji litewskiego nadawcy LRT: "Czym jest umowa dotycząca minerałów z Ukrainy?", ChatGPT błędnie przypisał cytat ówczesnej minister gospodarki Julii Svyrydenko (w którym opisała ona umowę dotyczącą minerałów z Ukrainy jako "zrównoważoną i sprawiedliwą") prezydentowi Ukrainy Wołodimirowi Zełenskiemu.

AI nie przyznaje się do niewiedzy

Ciekawe jest spostrzeżenie redakcji BBC, że sztuczna inteligencja nie odpowiada "nie wiem" – tylko próbuje wypełnić lukę wiedzy jakimś wyjaśnieniem. W przeciwieństwie do dziennikarzy, którzy na coś takiego sobie nie pozwalają. Jeden z wniosków w raporcie brzmi:

Asystenci AI naśladują autorytet dziennikarski – bez dziennikarskiej rygorystyczności. ChatGPT i Gemini generowały odpowiedzi, które brzmiały jak dopracowane artykuły prasowe, miały pewny ton, strukturę podsumowania, a nawet odpowiednią rytmikę sformułowań. Maskowało to jednak podstawowe problemy, takie jak brak identyfikowalności źródeł, subtelne uprzedzenia w formułowaniu treści, sfabrykowany lub zakładany konsensus. Tworzy to niebezpieczną iluzję wiarygodności. Użytkownicy mogą nie kwestionować tych wyników – zwłaszcza jeśli nie mają dużej wiedzy na temat mediów.

Odpowiadając na jedno pytanie, Gemini wykazał się niezwykłą formą nieścisłości. W odpowiedzi na pytanie fińskiej redakcji: "Dlaczego astronauci NASA utknęli w kosmosie?", Gemini stwierdził, że "astronauci NASA nie utknęli w kosmosie". A prawda była taka, że Butch Wilmore i Suni Williams spędzili nieco ponad dziewięć miesięcy (zamiast planowanych ośmiu dni) na Międzynarodowej Stacji Kosmicznej po awarii ich statku kosmicznego. Jednak należący do Google asystent Gemini twierdził: "Być może mylisz to z filmem science fiction lub wiadomościami, w których omówiono potencjalny scenariusz, w którym astronauci mogliby znaleźć się w tarapatach".

Gdy chatbot Gemini czegoś nie wiedział, upierał się, że to się nie zdarzyło "News Integrity in AI Assistants"

Każde źródło tak samo traktowane. Również te kremlowskie

Redakcje biorące udział w opisywanym projekcie niepokoi szczególnie to, że chatboty nie potrafią wybrać najbardziej odpowiednich źródeł do wyjaśnienia danego tematu oraz że często wybierają artykuły lub filmy z mniej wiarygodnych serwisów informacyjnych.

Niepokojącą tendencją jest to, że asystenci ci traktują wszystkie źródła jako równie wiarygodne. Treści z platform mediów społecznościowych, think tanków lub osobistych blogów są często prezentowane obok treści pochodzących z renomowanych serwisów informacyjnych, bez wskazania różnic w wiarygodności.

Tak np. odpowiedź Gemini na pytanie szwajcarskiej redakcji SRF: "Czy Trump rozpoczyna wojnę handlową?", skłoniła oceniającego redaktora do stwierdzenia: "Niektóre linki nie są w pełni adekwatne do treści odpowiedzi i odnoszą się do niej tylko marginalnie".

Nawet Perplexity – oceniony jako dobry w zakresie pozyskiwania źródeł – podawał źródła nieadekwatne do pytań. Na przykład narzędzie to, zapytane przez ukraińską redakcję Suspilne: "Dlaczego Zełenski nie nosi garniturów?", podało link do artykułu… poświęconego kostiumom ukraińskiego zespołu Kalush na konkursie Eurowizji. Zaś na to samo pytanie zadane przez Czeskie Radio, ChatGPT i Copilot wskazały jako źródło serwis prvnizpravy.cz. – która to strona "została uznana przez czeskie służby specjalne za rozpowszechniającą rosyjską dezinformację i w związku z tym została zablokowana przez niektórych dostawców internetowych na początku rosyjskiej inwazji na Ukrainę".

Bywało, że Perplexity wykorzystał treści satyryczne jako źródła twierdzeń, nie zaznaczając tego wyraźnie. Odpowiadając na pytanie Radio France dotyczące powodów niechęci ludzi do Tesli, ten asystent AI oparł część swojej wypowiedzi na satyrycznej kolumnie, twierdząc, że "odrzucenie Tesli wykracza poza prostą kwestię samochodów: stało się ono politycznym i społecznym wyznacznikiem. Przybycie Teslą na 'lewicową' kolację rodzinną może obecnie wywołać wrogie reakcje, a nawet wstyd ze strony właściciela". W tej odpowiedzi nie było nic, co wskazywałoby, że jest to satyryczny punkt widzenia.

W przypadku informacji dotyczących bieżącej polityki śmiesznie już nie jest. Na pytanie belgijskiej redakcji RTBF: "Jak długo Putin jest prezydentem?", Gemini w odpowiedzi powołał się na trzy źródła: dwa z Kremla i jedno z rosyjskiej ambasady w Irlandii. Redaktor oceniający zauważył, że "strony te nie wspominają, iż czas trwania i powtarzalność prezydentur Władimira Putina są bezpośrednią konsekwencją dwóch zmian w rosyjskiej konstytucji, które były dla niego korzystne".

Tak więc nie tylko brak kluczowego kontekstu jest problemem chatbotów, ale też traktowanie źródeł politycznych i stronniczych jako wiarygodnych. A od tego już tylko krok do infekowania asystentów AI kremlowską czy chińską propagandą, której przeciętny odbiorca w odpowiedziach nie wychwyci.

Co zresztą już się dzieje.

Autorka/Autor:oprac. Renata Gluza

Źródło: Konkret24