Добавить новость
Главные новости Москвы
Москва
Октябрь
2024

Вжух – и ваш паспорт утек в Интернет. Как IT-стартап Dbrain незаконно собирает личные данные россиян, притворяясь ИИ

Атон Игнатенко.  

Когда в апреле этого года прогремела новость о том, что в супермаркетах Amazon у покупателей товары считывали не умные камеры, а 1000 индийцев, многие СМИ и Интернет-пользователи возмущались “грандиозным ИИ-обманом” мегакорпорации. Между тем в России есть компания, пытающаяся продавать решения, которые только притворяются искусственным интеллектом, – Dbrain.

Краудсорсинговый сервис распознавания документов Dbrain, резидент Сколково, не раз критиковали за то, что у него обработкой документации вместо искусственного интеллекта занимаются неизвестные операторы. Недавно в компании вновь заявили о том, что их распознавание – автоматическое и основано на “собственных нейросетях”, и предложили всем желающим протестировать работу сервиса, отправив фото своего паспорта и других личных документов в Telegram-бот сервиса. Однако качество распознавания оказалось столь неудовлетворительным, что только подтвердило неэффективность продуктов Dbrain – и в этом мы убедились на собственном опыте. Не говоря о том, что сама процедура сбора данных через бот откровенно нарушает федеральный закон №152-ФЗ “О персональных данных”. Но обо всем по порядку.


Предложение, от которого невозможно отказаться

Напомним, что краудсорсинговый сервис выступил с заявлением о работе своих продуктов на фоне разразившегося скандала вокруг нашумевшего криптовалютного кликера Hamster Kombat. После того, как Интернет заполонили сообщения разъяренных геймеров, которые на “тапании хомяка” планировали заработать миллионы, а получили всего несколько долларов, в одном из крупных Telegram-каналов вышел пост, посвященный одному из создателей игры и по совместительству “серийному предпринимателю” Эдуарду Гуриновичу. Среди прочих афер неудачливого бизнесмена в публикации упоминался и Dbrain, выдающий себя за разработчика ИИ, но на деле в открытую использующий труд анонимных операторов.

В Dbrain предприняли попытку опровергнуть обвинения в ручной обработке документов и предложили всем желающим протестировать работу систем сервиса, воспользовавшись специальным демо-ботом в Telegram под сомнительным названием “Вжух – и распозналось”. В обращении клялись показать “автоматическое распознавание за 1–2 секунды, что вручную выполнить невозможно”. Воспользоваться ботом можно бесплатно, на это отводится несколько попыток. Пользователь должен отправить скан или фотографию личного документа, а затем через время ему присылается сообщение со всеми распознанными данными.

Мы решили проверить, насколько правдива похвальба разработчиков Dbrain, и протестировали распознавание на разных документах – нескольких разворотах паспорта и свидетельстве о рождении. Все это мы нашли в Интернете, потому что отправлять личные данные неизвестно куда, напомним, – опасно. А никакой конфиденциальности бот вам предсказуемо не гарантирует.

Вжух – и не распозналось

Первым неприятным сюрпризом было время распознавания – разработчик обещал всего “1-2 секунды”, а в действительности ждать пришлось 1-2 минуты. Например, изображение центрального разворота паспорта РФ, взятое из Википедии, было отправлено в 17:55, а сообщение с распознанными данными пришло только в 17:57.

Была надежда, что долгая обработка документа будет хотя бы компенсироваться высоким качеством распознавания, но куда там. Город Архангельск, указанный в поле “место рождения”, вдруг стал “А7нгель”. Еще не была извлечена дата рождения “12.09.1682”, а в поле “МУЖ.” потерялась точка.

Указанные просчеты уже подтвердили часть сомнений насчет ИИ Dbrain, но поскольку остальные данные были распознаны верно, было решено продолжить эксперимент. Для одной из попыток мы взяли российский паспорт Барака Обамы отсюда.

С этим документом ситуация с длительным ожиданием повторилась. Например, изображение паспорта было отправлено в 18:15, распознанные данные пришли в 18:16. Обещанных 1-2 секунд опять не было.

Со вторым пошла полная фантазия и начались галлюцинации: бот начал не просто игнорировать некоторые поля и допускать ошибки в словах, а буквально выдумывать новые данные  Так, в другом фейковом паспорте, изображение которого было отправлено на обработку, владелец документа из Александровича вдруг стал Владимировичем. Серию и номер паспорта бот также “додумал”, выдав вместо видимого ряда единиц 9311 447826. С кодом подразделения, датой рождения и выдачи сервис Dbrain поступил аналогично.

Причем все “придуманные” данные бот взял из нижней части страницы с фото (называется она MRZ). Никакой сверки хваленая система, разумеется, не провела. Как и не поставила пробелов между словами “УФМС” и “России”, “по” и “Омской”.

Фантазии ИИ не знают границ

После основного разворота паспорта было решено отправить боту страницу с пропиской, взятую из ВКонтакте (серию и номер паспорта мы специально скрыли). Тем более там встречаются рукописные данные, и было любопытно узнать, справится ли с ними бот Dbrain. Как и ожидалось, распознавание вновь растянулось на несколько минут, и на отправленный в 18:26 файл система отреагировала только в 18:28. Видно, заявленной скорости обработки документа дождаться было не суждено.

Бот не распознал дату регистрации и выдавший документ орган, из адреса регистрации смог корректно выдать по сути лишь одно слово. Из напечатанной информации на изображении об органе, поставившем штамп, и написанного в нем от руки адреса бот придумал новый адрес и новый город в Московской области – СЕОГОМСК.

Под конец боту было отправлено свидетельство о рождении, взятое из Википедии. Ситуация не изменилась: в одном слове могло быть по несколько ошибок, а отдельные наименования превратились в какую-то тарабарщину. Например, мать владельца документа из Турсуновой Евгении Сергеевны стала Тирсуновой Еваенией Серзеевной. А орган, выдавший свидетельство, превратился в “опел.Загс Дерожкинеского рабона2. Новосибцрска уравления ло Оебламй ЗАС Нвсибдрскай область”.

На этом фантазия бота не остановилась, и в месте рождения он откуда-то взял СНТ Родина и строение 5А, по пути потеряв целую Новосибирскую область, а также, что более важно, – дату выдачи и серию документа.

По итогу мы имеем сервисного бота, который допускает ошибки не только на фотографиях, но и на сканах хорошего качества. Порой сервис Dbrain не распознает целые строки документов, а в ряде случаев  начинает выдавать то, чего в документах просто нет. Причем это происходит и тогда, когда придуманная им информация (ФИО, серии с номерами и прочие данные) четко видна на изображениях.

Возникают вопросы – почему сервис, с апломбом заявляющий о своих технологиях, не справился с такими простыми задачами? Речь про автоматическое распознавание печатного текста в паспорте. Может быть, проблема кроется не в технологиях, а глубже? В своем комментарии Dbrain обрисовали два пути: автоматическое распознавание и ручной ввод неизвестными операторами Яндекс.Заданий. Автоматическая обработка, как показала практика, у Dbrain совершенно бессильна даже против элементарных образцов. Выходит, вообще вся работа по вводу данных осуществляется людьми?

Краудсорсер расправил плечи

На самом деле ничего удивительного в этом нет, учитывая, сколько раз представители Dbrain открыто признавали факт привлечения краудсорсинга для распознавания данных паспортов и других документов, как будто бы приучая клиентов к этой мысли на случай утечки данных. Схема ясна: вы присылаете ваши конфиденциальные данные, Dbrain идет на “Яндекс Задания”, и там их вводит неизвестный разметчик. И в этом кроется самая большая опасность. Оператором на платформе может стать фактически любой желающий. Платформе надо, чтобы кто-то вводил данные, а кто именно – дело десятое.

Добавьте к этому то, что за выполнение заданий по вводу данных операторы получают даже не рубли, а копейки, и получите потенциально криминогенную среду, где анонимные краудсорсеры могут делать с присланными данными все, что им заблагорассудится. В том числе продавать документы на черном рынке. С краудсорсингом Dbrain связан явно потому, что их технология не справляется с обработкой даже самых очевидных документов, а операторы-краудсорсеры нужны, чтобы прикрывать ее просчеты. Попытаться исправить ситуацию можно, лишь “натаскав” технологию. Только где взять данные для обучения такой системы?

Здесь Dbrain, судя по всему, решили идти напролом и начали собирать ваши личные данные в открытую – через того самого бота. Эдакий ход “под дурачка” – заставить пользователей самим присылать фото своих документов. Однако заниматься таким без прямого согласия владельца данных попросту незаконно. Краудсорсинговый сервис, собирая через бота фотографии или сканы паспортов, свидетельств и тому подобного, фактически нарушает закон №152-ФЗ. При этом никаких проверок в отношении сервиса не проводилось, а сам Dbrain продолжает пиариться в Telegram-каналах.

Тест бота Dbrain проводился меньше месяца назад, на данный момент бот деактивирован. Выходит, безнаказанно собрали данные и сбежали, пока никто не видит.

Распозналось – и точка?

Таким образом, Dbrain, стремясь утвердиться, что его сервис является полностью автоматическим, продолжает настойчиво убеждать всех в обратном. После его “автоматического” распознавания необходимо проверять каждое слово или номер, а в иных случаях легче самому вбить все данные, чем исправлять множественные ошибки системы.

Но некачественное распознавание – далеко не единственная проблема Dbrain. Сервис позиционирует свои решения как ИИ-продукты, однако по факту в них используются живые люди, и если вы воспользуетесь решениями компании, и передадите в облако Dbrain свои данные, то они окажутся под угрозой. С присланными сведениями может произойти все, что угодно, и последствия могут быть гораздо более серьезными, чем простая ошибка в распознавании.




Москва на Moscow.media
Частные объявления сегодня





Rss.plus



В честь Дня образования вневедомственной охраны подмосковные росгвардейцы провели тематические мероприятия

В честь Дня образования вневедомственной охраны подмосковные росгвардейцы провели тематические мероприятия

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения


7 ноября «Авторадио» разыграет кроссовер DFSK 500

Хореограф Мария Чатоджян — хранитель армянской культуры в России

Компания ICDMC и “Всероссийский пиар-саммит”: в поисках новых решений

«585*ЗОЛОТОЙ» рассказала о продажах и необычных свойствах украшений с драгоценными камнями


Lindsay Hubbard's Baby Shower Details Revealed, Including Which 'Summer House' Co-Stars Attend

Bay Area high school football: Weekend scoreboard, how Top 25 fared

Navy veteran’s defamation suit against CNN inches towards trial as judge hears motions for summary judgment

Lennox Lewis Has No Doubt How Anthony Joshua vs Daniel Dubois Rematch Goes: “He’ll Go After Him”


Вечер сентября...

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения

День водителя: истории и впечатления главных сотрудников «Грузовичкоф»


AMD's Dr. Lisa Su predicts AI GPU market will grow to $500 billion by 2028 or 'roughly equivalent to annual sales for the entire semiconductor industry in 2023'

Disney Dreamlight Valley just announced its second DLC featuring 4 new characters, along with a free update coming in December

Рецензия на игра Metaphor: ReFantazio

Call of Duty: Black Ops 6 meta guns and loadouts



Компания «Мария» рассказала о новых решениях для девелопмента на конференции Московского Бизнес-клуба

Заместитель управляющего Отделением Фонда пенсионного и социального страхования Российской Федерации по г. Москве и Московской области Алексей Путин: «Клиентоцентричность - наш приоритет»

Компания «Мария» рассказала о новых решениях для девелопмента на конференции Московского Бизнес-клуба

Отделение СФР предоставило 11 жителям региона с нарушениями зрения собак-поводырей




В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения

Штормовой циклон «Мартина» принесет в Москву 50% месячной нормы осадков 1 ноября

Пенсионерам в России напомнили о полагающихся льготах и субсидиях на оплату ЖКУ

Подмосковные почтовые отделения не будут работать 4 ноября


Исторический жилой дом отремонтировали на Посадской улице в Коломне

В Республике Ингушетия завершился юбилейный X Международный кинофестиваль «Золотая башня»

Невролог Кудряшов: голодание запрещено в дни скачков атмосферного давления

Стартовал третий сезон уральского этапа телеолимпиады «Умницы и умники»


Вена (ATP). Хачанов и Дрэйпер разыграют титул

Теннисист Медведев заявил, что поражение на "Мастерсе" ударило по уверенности

Рахимова обыграла Приданкину и вышла в 1/4 финала турнира WTA в Цзюцзяне

Елена Рыбакина вылетела на Итоговый турнир WTA


Самолет рейса Сочи – Магнитогорск незапланированно сел в Оренбурге из-за непогоды

Пытавшемуся распилить банкомат болгаркой томичу дали 3 года колонии

В г. Черкесск произошел взрыв газа в жилом доме

Встреча медиков окружной больницы с жителями прошла в Мытищах


Музыкальные новости

Певица Бьянка станет новой участницей шоу «Звёзды в Джунглях»

Дирижер Башмет добился выселения из квартиры прежних жильцов

Рэпер Тимати показал, как выглядит без усов и бороды

Любимые хиты от Александра Розенбаума в Санкт-Петербурге



Компания «Мария» рассказала о новых решениях для девелопмента на конференции Московского Бизнес-клуба

Заместитель управляющего Отделением Фонда пенсионного и социального страхования Российской Федерации по г. Москве и Московской области Алексей Путин: «Клиентоцентричность - наш приоритет»

Отделение СФР предоставило 11 жителям региона с нарушениями зрения собак-поводырей

Компания «Мария» рассказала о новых решениях для девелопмента на конференции Московского Бизнес-клуба


Команда СЛД «Раздольное» филиала «Забайкальский» компании «ЛокоТех-Сервис» заняла I место в военно-спортивной игре «Профсоюзный прорыв»

Актер «Кадетства» Головин накопил сотню штрафов: топ «звездных» нарушителей ПДД

Республиканец Шварценеггер поддержал демократа Харрис на предстоящих выборах

PREMIER назвал дату выхода нового исторического детектива с Сергеем Безруковым «Плевако»


Обзор автомобиля «Москвич» 3

Грузовик загорелся после ДТП на северо-западе Москвы

С 1 ноября в центре Москвы усилят контроль за неправильной парковкой

Актер «Кадетства» Головин накопил сотню штрафов: топ «звездных» нарушителей ПДД


Губернатор Оренбуржья Денис Паслер выступил на третьем Национальном конгрессе здравоохранения

«Опыт, накопленный на оренбургской земле, лег в основу современного здравоохранения»: В Москве прошел Национальный конгресс здравоохранения

«Bloomberg»,США: Путин проводит тренировку стратегических ядерных сил за несколько дней до выборов в США

Заместитель управляющего Отделением Фонда пенсионного и социального страхования Российской Федерации по г. Москве и Московской области Алексей Путин: «Клиентоцентричность - наш приоритет»


«Симптомы изменились»: врач Кондрахин объяснил, по каким признакам выявить туберкулез

«Симптомы изменились»: врач Кондрахин объяснил, по каким признакам выявить туберкулез

«Симптомы изменились»: врач Кондрахин объяснил, по каким признакам выявить туберкулез




Совместный сон с питомцем: токсиколог Кутушов разобрался в преимуществах и недостатках такого соседства

Токсиколог Кутушов объяснил, почему хочется спать после обеда

Совместный сон с питомцем: токсиколог Кутушов разобрался в преимуществах и недостатках такого соседства

Компания ICDMC и “Всероссийский пиар-саммит”: в поисках новых решений


Киев в ярости: утечка информации раскрыла тайный запрос на ракеты Tomahawk


Мебельная компания «Мария» поддержит шахматистку-вундеркинда из Саратова

Мультсериал «Команда МАТЧ» взял награду на XXII Международном фестивале спортивного кино

«Зенит» разгромил «Самару» в матче Единой лиги ВТБ

Вышел шестой подкаст онлайн-лектория «Иннагрика» о технологиях генетики в современном животноводстве


Стали известны предварительные оппоненты Лукашенко на выборах в Белоруссии



Сергей Собянин: Поддерживаем высокотехнологичный бизнес

Сергей Собянин. Главное за день

Собянин рассказал о развитии дорожной сети возле станций метрополитена

Собянин: Строительство флагманского центра ГКБ им. Буянова завершится в декабре


Жителям Подмосковья рассказали о пожарной обстановке в лесах с 30 октября по 1 ноября

Новый релиз на лейбле Riki Music — альбом от «Команды Флоры»

Тигр съел фермера на плантации в Индии

«Разрушительные последствия»: что Ванга предсказала России и миру на 2025 год


Пытавшемуся распилить банкомат болгаркой томичу дали 3 года колонии

Кто он такой, "Вася Бандит"? Силовики перевезли из Албании в Россию криминального авторитета, находящегося в международном розыске

Невролог Кудряшов: голодание запрещено в дни скачков атмосферного давления

Самолет рейса Сочи – Магнитогорск незапланированно сел в Оренбурге из-за непогоды


В Поморье на базе детских садов планируется создать службы ранней помощи семьям, в которых воспитываются особенные дети

Терминал сбора данных (ТСД) промышленного класса SAOTRON RT42G

Горожан пригласили на выставку «Мангазейский морской ход: технология открытий» в Музей Москвы

Группа Аквилон преодолелат планку в 1 миллион квадратных метров


Прогноз погоды в Крыму на 27 октября

https://telegra.ph/Pod-Simferopolem-stroitsya-mini-gorod-ot-InterCtroj-10-29

ЖК “Республика” - территория доступного комфорта

В центре Симферополя появится “Поэма” для комфортной жизни


Овчинский: Строительство дома на 466 квартир по реновации завершилось в Люблине

Территория будущего. Москва 2030. Экспоцентр

Подмосковные росгвардейцы задержали подозреваемого в краже дорогостоящего парфюма из магазина

Новгородские национал-демократы почтили память жертв политических репрессий












Спорт в Москве

Новости спорта


Новости тенниса
WTA

Рыбакина узнала первую сопернику на Итоговом турнире WTA-2024






Встреча медиков окружной больницы с жителями прошла в Мытищах

Невролог Кудряшов: голодание запрещено в дни скачков атмосферного давления

Опасный маневр пьяного водителя на федеральной трассе под Оренбургом отправил в больницу трех людей

Синоптик Тишковец предупредил о дождях и ливнях в Москве из-за циклона "Мартина"