Доработать код

19.03.2024 11:15

Бюджет по заказу проставлен символичный, т.к. сложно оценить объём работ, если есть стоящие предложения, готов к обсуждению суммы.

Задача:
С около 50 микрофонов в режиме реального времени приходят аудио потоки, которые необходимо транскрибировать в онлайне и проверять на слова триггеры.

Что есть:
Есть написанный для данных целей код на Python с использованием библиотеки vosk.

Необходимо выделить определённый голос говорящего( по слепку голоса например) из общего потока. Или если не использовать библиотеку vosk, то ваши предложения как это можно сделать. К примеру есть 3 говорящих, и чтобы можно было выделить именно Васю из потока речи. Возможно ли сделать подход как у Алисы? Т.е. запомнить голос на основе 5 произнесённых фраз к примеру и т.д.

Moscow.media

Частные объявления сегодня

Rss.plus

Все новости за 24 часа

Доработать код

Новости спорта

Ничушкин оформил хет-трик в НХЛ, Рублёв проиграл на старте «Мастерса». Главное к утру

Мужчина провалился между платформой и движущимся поездом на МЦД-4

Аренда барнаульского жилья стала популярнее на 34%

Жена раскрытого ФСБ шпиона работала в минобороны Британии и с НАТО в Эстонии

Эксперт Балмасов: РФ и США могут начать миротворческую миссию в Сирии