Aplikácie umelej inteligencie mali faktické chyby v pätine odpovedí, zistil test BBC

11.02.2025 17:22

HNonline.sk

Zhruba pätina odpovedí vygenerovaných najznámejšími západnými aplikáciami umelej inteligencie obsahovala faktické chyby. Vyplýva to z testu, ktorého výsledky dnes zverejnila stanica BBC.

Tím stanice sa pýtal na informácie z článkov obsiahnutých na spravodajskom serveri BBC News. V teste použila chatovacie roboty ChatGPT, Copilot, Gemini a Perplexity.

V rámci testu tím BBC sprístupnil chatovacím robotom obsahy spravodajského servera BBC News a potom im položil otázky. Podľa zverejnených výsledkov malo nejakú formu vady 51 percent vygenerovaných odpovedí. Devätnásť percent odpovedí obsahovalo faktické chyby a 13 percent potom nepresné citácie z článkov na serveri BBC News.

V umelej inteligencii kriticky zaostávame za svetom

Medzi chybnými odpoveďami boli tvrdenia chatovacích robotov, že britský expremiér Rishi Sunak či bývala šéfka škótskej vlády Nicola Sturgeonová sú stále vo funkcii, hoci tomu v čase testu už tak nebolo.

V ďalšej odpovedi napríklad aplikácia AI mylne tvrdila, že britská zdravotnícka služba NHS odporúča elektronické cigarety ako nástroj na skončenie s fajčením.

Novinári BBC News hodnotili presnosť, nestrannosť a tiež vernosť odpovedí pôvodným zdrojom, stoja v hodnotení testu. "Chceli sme vedieť, či (platformy AI) poskytujú presne odpovede na otázky ohľadom správ; a či odpovede verne zodpovedajú správam z BBC News použitých ako zdroje," uviedol šéf tímu, ktorý sa zaoberá umelou inteligenciou v BBC, Pete Archer.

Podľa BBC výsledky testu ukazujú, že odpovede generované AI môžu byť často zavádzajúce. "Je ťažké nevnímať, ako rýchlo pokrivenie (informácií) zo strany AI môže podkopať už aj tak krehkú dôveru ľudí vo fakty a overené informácie," uviedla v komentári šéfka spravodajského servera BBC News Deborah Turnessová.

Čínsky chatbot, ktorý vystrašil americké firmy, ukázal nový trik. Ponúka už aj generátor obrázkov

Podľa testovacieho tímu je zásadné, aby informácie boli presné nezávisle od kanála, ktorý ich prenáša. "Nepresnosť z AI asistentov sa môže ľahko šíriť, kedy sú zdieľané na sociálnych sieťach," uviedol Archer.

Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií umelej inteligencie. Domnievajú sa však, že chatovacie roboty nemôžu v súčasnosti byť zdrojom presných správ. "Chceme, aby AI spoločnosti vypočuli naše obavy a konštruktívne s nami spolupracovali," stojí v záveroch testu. Podobný test chce BBC opakovať v blízkej budúcnosti.

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

Aplikácie umelej inteligencie mali faktické chyby v pätine odpovedí, zistil test BBC

Новости спорта

На турнире в Марселе под флагом России оказались имена Медведева и Хачанова

Shot: Чемпиона РФ по легкой атлетике Толстихина приговорили к 3,5 года за кражи

Мошенники оставили без квартиру актрису Елену Цорн

В Москве пройдут торги по приобретению земельного участка и здания на севере города

В Москве состоится Медиа Бизнес Саммит 2025