Натренировать OCR модель на основе собственного датасета
Требуется специалист в области ML, OCR, Deep Learning, Python, чтобы натренировать и создать собственную нейросетевую модель распознавания текста на основе предоставленных данных.1. Есть 500 маркированных изображений (с уже присвоенными лейблами) для тренировки модели.2. Есть около 2500 непромаркированных изображений для проверки модели.3. Желательно создать модель на основе TensorFlow / Torch (Python). Я пробовал натренировать сам на основе EasyOCR, но столкнулся с проблемами.4. Модель должна в итоге распознавать текст с точностью не менее 99% (на основе тренировочного датасета и выборочной проверки из 2500 немакрированных картинок).5. Предоставить работающий код (на Python) для проверки модели, саму модель (в необходимом формате) и параметры созданной нейросети.
На скринах - пример изображений для распознавания и файл с лейблами (для 500 картинок).
Писать в ТГ @s00mbre
PS. Ботам и посредникам не заморачиваться! Работаю с реальными людьми, которые точно смогут это сделать, потому что уже минимум раз делали.