Fugatto создает музыкальные композиции на основе необычных запросов. Так, можно попросить систему сгенерировать звучание саксофона, имитирующего лай собаки, а затем плавно переходящего в электронную музыку. Также система способна генерировать совершенно новые звуки, основанные на подробных описаниях, например, «глубокий гул баса, чередующийся с высокими цифровыми писками, напоминающими звуки пробуждающейся машины». Инструмент трансформирует звучание человеческого голоса, изменяя акцент или придавая ему различные эмоциональные оттенки, например, гнев или спокойствие. Кроме того, Fugatto позволяет редактировать музыкальные композиции: выделять вокальные партии, добавлять новые инструменты и даже изменять мелодию, заменив, например, фортепиано на оперное соло.
Это стало возможным благодаря особому подходу к обучению модели. Исследователи Nvidia отметили, что создать набор данных для тренировки нейросети, которая могла бы связывать между собой звуки и слова, сложно. Обычно нейросети сами учатся понимать текстовые инструкции, но когда речь идет о звуках, им нужна более точная подсказка. Чтобы решить эту проблему, ученые использовали специальную программу (скрипт на языке Python), которая генерировала большое количество инструкций для создания разных звуковых образов. Эти описания, включающие как абсолютные характеристики («синтезировать грустный голос»), так и относительные («увеличить грусть в голосе»), использовались для составления набора данных.
Большинство общедоступных аудиозаписей, которые использовались для обучения Fugatto, не содержат подробной информации о том, какие эмоции в них заложены или как звучит голос. Поэтому ученые разработали способ автоматически описывать звуки словами.
Например, они могли охарактеризовать звук как «веселый», «грустный» или «громкий». Кроме того, использовались специальные инструменты, чтобы извлечь из аудио числовые характеристики, которые помогают понять, как оно устроено.
После обработки обширной коллекции открытых аудиоданных исследователи сформировали детально аннотированный набор данных, включающий 20 млн отдельных аудиообразцов общей продолжительностью более 50 000 часов. На основе этого набора с использованием 32 тензорных ядер Nvidia была обучена модель с 2,5 млрд параметров. ИИ продемонстрировал высокую точность в тестах качества звука.
В Fugatto также интегрирована система ComposableART. Она позволяет, получив текстовое или аудио описание, создавать новые звуки путем комбинирования различных характеристик, извлеченных из обучающих данных.
По сути, ComposableART генерирует звуки, не встречавшиеся в обучающей выборке, поскольку сочетает несочетаемое. К примеру, звучание скрипки смешивается со смехом ребенка, а шум дождя — с банджо.
Модель рассматривает каждую отдельную аудиохарактеристику как непрерывный спектр, а не как дискретное значение. Так, при создании звукового образа, совмещающего звучание акустической гитары и журчащей воды, конечный результат будет зависеть от того, какая из этих характеристик будет преобладать в «смеси», создаваемой Fugatto.
Nvidia считает, что инструмент пригодится в разных сферах — от создания музыки до разработки новых звуковых эффектов для игр. Разработчики подчеркивают, что модель рассматривается не как замена музыкантов, а как новый инструмент для аудиохудожников. Правда, пока Fugatto не доступна для публичного тестирования.
Филиал № 4 ОСФР по Москве и Московской области информирует:
Отделение СФР по Москве и Московской области оплатило свыше 243 тысяч дополнительных выходных дней по уходу за детьми с инвалидностью
Филиал № 4 ОСФР по Москве и Московской области информирует:
В Москве и Московской области 650 тысяч пенсионеров старше 80 лет получают пенсию в повышенном размере
В Подмосковье офицер Росгвардии оказал помощь в эвакуации
пострадавших в результате ДТП
«Грузовичкоф» на передовой новых коллабораций с блогерами: выступление Наталии Поникаровской на конференции The Trends
Exclusive: Sumit Kaul on joining the new season of Tenali Rama as Girgit; says ‘It will be a challenge for me to live up to the expectations of audience’
Michail Antonio reveals he was barred from entering the UK after passport blunder in nightmare international break
F1 Las Vegas Grand Prix – Start time, starting grid, how to watch, & more
Las Vegas GP F1 qualifying: George Russell takes pole, Lewis Hamilton only 10th
Машина с молодой компанией врезалась в грузовик: погибла 18-летняя девушка
Выходной...
Филиал № 4 ОСФР по Москве и Московской области информирует:
Отделение СФР по Москве и Московской области оплатило свыше 243 тысяч дополнительных выходных дней по уходу за детьми с инвалидностью
Свердловчанин с "голосами в голове" перерезал горло сестре бывшей жены
The community behind the PC port of Ocarina of Time have been secretly working on a native version of Star Fox 64
Rejoice, roguelike nerds: Shiren the Wanderer: The Mystery Dungeon of Serpentcoil Island is coming to Steam
Your League of Legends rank will reset less in 2025, and creepy XP-boosting flowers will now grow around your corpse thanks to the new theme coming in season 1
Five new Steam games you probably missed (November 25, 2024)
Филиал № 4 ОСФР по Москве и Московской области информирует:
Отделение СФР по Москве и Московской области оплатило свыше 243 тысяч дополнительных выходных дней по уходу за детьми с инвалидностью
Рустэм Султанов представляет альбом «На осколках декабря»: smooth jazz в преддверии зимы
«Мама»: в «Октябре» состоялась премьера новой главы проекта «Хронос»
Застройщики хотят проспонсировать сериал «Против всех», чтобы восстановить репутацию
Филиал № 4 ОСФР по Москве и Московской области информирует:
Отделение СФР по Москве и Московской области оплатило свыше 243 тысяч дополнительных выходных дней по уходу за детьми с инвалидностью
Застройщики хотят проспонсировать сериал «Против всех», чтобы восстановить репутацию
В Подмосковье офицер Росгвардии оказал помощь в эвакуации
пострадавших в результате ДТП
Рустэм Султанов представляет альбом «На осколках декабря»: smooth jazz в преддверии зимы
Путин: РФ признательна властям Казахстана за бережное отношение к русскому языку
Губернатор Архангельской области получил одобрение от президента РФ на создание
Путин: Москва ждет президента Казахстана на праздновании 80-летия Победы
Заместитель управляющего Отделением Фонда пенсионного и социального страхования Российской Федерации по г. Москве и Московской области Алексей Путин: «Клиентоцентричность - наш приоритет»
«МедАльянсГрупп» – надежный партнер в медицинской сфере
Филиал № 4 ОСФР по Москве и Московской области информирует:
Отделение СФР по Москве и Московской области оплатило свыше 243 тысяч дополнительных выходных дней по уходу за детьми с инвалидностью
Врач-гигиенист клиники «Мегастом» Инна Гришина: как понять, что зубная паста вам не подходит
Дело в шапке: как сохранить здоровье и красоту волос в холодное время года