Исследователи из Университета штата Пенсильвания решают важнейшую задачу в сфере здравоохранения: эффективность и надежность медицинских обобщающих инструментов на базе ИИ. Эти инструменты предназначены для сжатия сложной информации о пациенте в краткие резюме, что позволяет упростить такие задачи, как создание электронных медицинских карт и обработка страховых заявлений. Несмотря на то что эти инструменты обещают повысить эффективность, в настоящее время они требуют значительного человеческого контроля, чтобы обеспечить точность и избежать потенциально вредной дезинформации. Эта проблема связана с отсутствием «верности» в существующих моделях ИИ, что означает, что они могут опускать, изменять или даже искажать ключевую информацию в создаваемых сводках. Для решения этой проблемы исследователи разработали фреймворк FaMeSumm (Faithfulness for Medical Summarization). Эта система направлена на повышение достоверности медицинских резюме, генерируемых ИИ. Анализируя существующие резюме, исследователи выявили различные типы ошибок, такие как пропущенные или измененные медицинские термины, фактические неточности и посторонняя информация, не присутствующая в оригинальном тексте. В FaMeSumm используется техника, называемая контрастным обучением. Она предполагает создание двух наборов резюме: «верные» резюме, которые точно отражают исходный текст, и «неверные» резюме, содержащие ошибки. Затем модель искусственного интеллекта обучается различать эти наборы, улучшая свою способность генерировать верные резюме. Система включает в себя знания медицинской терминологии из внешних источников, таких как графы знаний или человеческие аннотации. Это гарантирует, что модель ИИ понимает и точно обобщает специфические медицинские термины. Исследователи успешно протестировали FaMeSumm на основных языковых моделях, продемонстрировав его эффективность в создании точных резюме на основе различных медицинских данных.