Нейросети Яндекса помогут найти сведения о предках
В «Поиске по архивам» пользователям теперь доступны метрические книги из фондов Государственного исторического архива Чувашии. Это аналоги актов современного загса: в них до 1917 года в Российской империи делали записи о важных событиях в жизни конкретных людей, например, о заключении брака. Для работы с метрическими книгами сервис использует нейросети Яндекса: они считывают старые рукописи и преобразуют их в печатный текст.
На сервисе уже доступны первые 60 тыс. рукописных листов, предоставленных чувашским архивом. Это около 100 дел, каждое из которых содержит метрическую книгу одной и более церквей за год или несколько лет. В ближайшие два месяца в «Поиске по архивам» появятся в общей сложности 500 тыс. листов из фондов архива, а в течение года их количество достигнет 2 млн. Сервис опубликует не только метрические книги, но и ревизские сказки, а также духовные ведомости.
Такие сказки составляли по результатам переписей податного населения, а в ведомостях отмечали, кто из прихожан определённого храма исповедовался и причащался в прошедшем году.
Чувашия стала пятнадцатым регионом страны, с которым работает «Поиск по архивам».
Справочно
«Поиск по архивам» — запущенный в начале 2023 года сервис Яндекса, который помогает быстро находить упоминания людей, населённых пунктов и событий в расшифрованных нейросетью рукописных документах XVIII–XX веков. В базе сервиса представлено более 13 миллионов страниц исторических документов из архивов Москвы, Московской, Оренбургской, Вологодской, Иркутской, Астраханской и других областей, а также нескольких муниципальных архивов.
Для оцифровки исторических документов сервис использует технологию, основанную на оптическом распознавании символов. Нейросеть узнаёт неактуальные знаки, например, исчезнувшие из алфавита буквы, учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в понятный печатный текст.
Источник: cap.ru.