Команда специалистов Microsoft разработала инструмент SpreadsheetLLM, который позволяет искусственному интеллекту (ИИ) работать с электронными таблицами. Исследование опубликовано на сайте arXiv.
Большие языковые модели (LLM), такие как ChatGPT, хорошо известны, но по мере их использования становятся очевидны пробелы в их возможностях. Одна из них — неспособность понимать электронные таблицы. Из-за своей уникальной структуры электронные таблицы остаются загадкой для LLM, что препятствует их использованию в качестве бизнес-инструмента.
В новом исследовании команда Microsoft создала инструмент, который преобразует электронную таблицу в формат, понятный для LLM. Он основан на концепции SheetCompressor — программном инструменте, который позволяет ИИ обрабатывать и анализировать данные в электронных таблицах.
SheetCompressor выполняет три основные функции: сжатие, перевод и агрегацию форматов данных. Сжатие осуществляется добавлением «якорей» — специальных маркеров, которые помогают LLM понять назначение таблицы. Затем строки и столбцы преобразуются в структурированную таблицу. Модули перевода удаляют пустые ячейки и повторяющиеся значения.
В процессе обработки таблица преобразуется в формат JSON, что позволяет агрегировать данные разных форматов. Дополнительно предусмотрены модули для обработки особых случаев, например, ячеек с похожими числовыми форматами.
В Подмосковных Люберцах росгвардейцы задержали подозреваемых в совершении кражи
В Подмосковных Люберцах росгвардейцы задержали подозреваемых в совершении кражи
22 октября в 11:00 состоится вебинар «Проблематика осуществления государственных закупок товаров, работ и услуг у субъектов малого предпринимательства (44-ФЗ)»
В Подмосковных Люберцах росгвардейцы задержали подозреваемых в совершении кражи
По мотивам арабских сказок. В Индии состоится премьера ледового шоу
Неделя родительской компетентности! Бесплатные онлайн-мероприятия, организованные в рамках Года семьи, будут посвящены психологическому здоровью детей и их родителей.
Диагностика и лечение. Обзор 10 частных медицинских клиник в Москве
В Подмосковных Люберцах росгвардейцы задержали подозреваемых в совершении кражи
22 октября в 11:00 состоится вебинар «Проблематика осуществления государственных закупок товаров, работ и услуг у субъектов малого предпринимательства (44-ФЗ)»
В Подмосковных Люберцах росгвардейцы задержали подозреваемых в совершении кражи
В Подмосковных Люберцах росгвардейцы задержали подозреваемых в совершении кражи
Финансовый эксперт Светлана Петрова: как решиться уйти с работы и начать свой бизнес
23 октября в 15:00 состоится очное мероприятие «Красота, да и только! Обновленный пул городских помещений под готовые бизнес идеи»
Неделя родительской компетентности! Бесплатные онлайн-мероприятия, организованные в рамках Года семьи, будут посвящены психологическому здоровью детей и их родителей.
Триумф «Астана Оперы». В Большом театре показали оперу «Абай»
22 октября в 11:00 состоится вебинар «Проблематика осуществления государственных закупок товаров, работ и услуг у субъектов малого предпринимательства (44-ФЗ)»
Спою бесплатно на ваших свадьбах: Вика Цыганова выступила в госпитале перед ранеными бойцами
Триумф «Астана Оперы». В Большом театре показали оперу «Абай»
Камамбер из Подмосковья получил золото на международном сырном конкурсе