Aplikácie umelej inteligencie mali faktické chyby v pätine odpovedí, zistil test BBC
Zhruba pätina odpovedí vygenerovaných najznámejšími západnými aplikáciami umelej inteligencie obsahovala faktické chyby. Vyplýva to z testu, ktorého výsledky dnes zverejnila stanica BBC.
Tím stanice sa pýtal na informácie z článkov obsiahnutých na spravodajskom serveri BBC News. V teste použila chatovacie roboty ChatGPT, Copilot, Gemini a Perplexity.
V rámci testu tím BBC sprístupnil chatovacím robotom obsahy spravodajského servera BBC News a potom im položil otázky. Podľa zverejnených výsledkov malo nejakú formu vady 51 percent vygenerovaných odpovedí. Devätnásť percent odpovedí obsahovalo faktické chyby a 13 percent potom nepresné citácie z článkov na serveri BBC News.
Medzi chybnými odpoveďami boli tvrdenia chatovacích robotov, že britský expremiér Rishi Sunak či bývala šéfka škótskej vlády Nicola Sturgeonová sú stále vo funkcii, hoci tomu v čase testu už tak nebolo.
V ďalšej odpovedi napríklad aplikácia AI mylne tvrdila, že britská zdravotnícka služba NHS odporúča elektronické cigarety ako nástroj na skončenie s fajčením.
Novinári BBC News hodnotili presnosť, nestrannosť a tiež vernosť odpovedí pôvodným zdrojom, stoja v hodnotení testu. "Chceli sme vedieť, či (platformy AI) poskytujú presne odpovede na otázky ohľadom správ; a či odpovede verne zodpovedajú správam z BBC News použitých ako zdroje," uviedol šéf tímu, ktorý sa zaoberá umelou inteligenciou v BBC, Pete Archer.
Podľa BBC výsledky testu ukazujú, že odpovede generované AI môžu byť často zavádzajúce. "Je ťažké nevnímať, ako rýchlo pokrivenie (informácií) zo strany AI môže podkopať už aj tak krehkú dôveru ľudí vo fakty a overené informácie," uviedla v komentári šéfka spravodajského servera BBC News Deborah Turnessová.
Podľa testovacieho tímu je zásadné, aby informácie boli presné nezávisle od kanála, ktorý ich prenáša. "Nepresnosť z AI asistentov sa môže ľahko šíriť, kedy sú zdieľané na sociálnych sieťach," uviedol Archer.
Autori štúdie priznávajú, že výsledky ich výskumu neukazujú celkovú chybovosť odpovedí aplikácií umelej inteligencie. Domnievajú sa však, že chatovacie roboty nemôžu v súčasnosti byť zdrojom presných správ. "Chceme, aby AI spoločnosti vypočuli naše obavy a konštruktívne s nami spolupracovali," stojí v záveroch testu. Podobný test chce BBC opakovať v blízkej budúcnosti.