Добавить новость
ru24.net
Все новости
Ноябрь
2024

Разработать Custom Speech-to-text Operator на Apache Flink

0
Описание задачи:

Для системы по обработке потоковых голосовых данных требуется разработать оператор на Apache Flink, выполняющий распознавание голоса с использованием OpenAI Whisper.

Предлагается следующая архитектура:
- Apache Flink v1.20 - исполнительная среда для потоковых данных
- Whisper.cpp - высокопроизводительный С++ форк открытого Speech-to-text движка OpenAI Whisper

Задача - создать Custom Operator на Apache Flink (Java или Scala), вызывающий Whisper.cpp.
Предлагается реализация, позволяющая достичь максимальной производительности - например, с использованием JNI (Java Native Interface).

Наконец, используя созданный оператор, разработчику необходимо написать тестовое приложение на Flink, демонстрирующее его работу: эмуляция голосового потока из WAV файла, перевод голоса в текст с использованием нового оператора и выдача текста в консоль. Необходимо, чтобы выполнялся замер производительности для бенчмарка оператора - загрузка CPU и latency распознавания речи.

Результат работы опубликовать в open source репозитории с использованием permissive лицензии (MIT, Apache 2.0)



Moscow.media
Частные объявления сегодня





Rss.plus




Спорт в России и мире

Новости спорта


Новости тенниса
WTA

Определилась соперница Арины Соболенко во втором круге турнира WTA-500 в Брисбене






11 тысяч жилых помещений приватизировали москвичи в 2024 году

Газпром нефть создаёт цифровую модель для прогнозирования изменений вечной мерзлоты до 2050 года

Крупный пожар произошел на овощебазе в Краснодарском крае

Японцы, как и Трамп, хотели бы «дружить» с Китаем против России