Доработать код
Задача:
С около 50 микрофонов в режиме реального времени приходят аудио потоки, которые необходимо транскрибировать в онлайне и проверять на слова триггеры.
Что есть:
Есть написанный для данных целей код на Python с использованием библиотеки vosk.
Необходимо выделить определённый голос говорящего( по слепку голоса например) из общего потока. Или если не использовать библиотеку vosk, то ваши предложения как это можно сделать. К примеру есть 3 говорящих, и чтобы можно было выделить именно Васю из потока речи. Возможно ли сделать подход как у Алисы? Т.е. запомнить голос на основе 5 произнесённых фраз к примеру и т.д.