Удивительно, как незаметно нейросети из обычных чат-ботов, отвечающих на глупые вопросы, превратились в сложные виртуальные машины, позволяющие писать статьи, создавать профессиональные изображения, полноценные видео высокого качества и даже сочинять трогательные песни и музыку к ним. Такие инструменты, как Lyria от Google и Suno AI, уже довольно популярны благодаря своим огромным возможностям по генерации треков. Однако они не единственные на рынке.
Пользователям сегодня сложно разобраться в сотнях платформ-композитров на основе ИИ и выбрать подходящие. Мы решили выяснить, какие из этих сервисов лучше, и протестировали самые интересные из них.
Создатели музыки на базе искусственного интеллекта — это умные системы, которые используют машинное обучение для создания оригинальных мелодий с нуля. Вам не обязательно уметь играть на инструменте или разбираться в нотной грамоте. Достаточно просто объяснить ИИ, чего вы хотите. Проанализировав миллионы существующих песен, эти модели изучили «шаблоны» разных жанров, например, плавность джазовой мелодии или мощь барабанного боя в тяжелом хэви-метале.
Сегодня подобные платформы разделились на две основные категории. Первая — это нейросоздатели «песни по запросу», которые делают всё сами: вокал, текст и сведение одним нажатием кнопки. Вторая — профессиональные инструменты для композиции, которые выдают «скелет» (основу) трека, чтобы вы могли доработать его самостоятельно.
Чтобы обеспечить справедливое сравнение, мы использовали один и тот же текстовый промпт для всех платформ. Аудиообразцы, созданные каждым сервисом, прикреплены к их описаниям.
Вот какую инструкцию мы дали каждой нейросети:
Style: 90s Grunge / Alternative Rock, male raspy vocals, heavy distorted guitar riff, 120 BPM.
Lyrics: [Verse 1] The sky turns grey, a static hum / My sensors feel the rhythm come / Cool liquid drops on rusted chrome / A feeling that I’ve never known.
[Chorus] It’s washing the binary away / In a world of neon and grey / I’m more than metal, more than wire / Feeling the sky’s electric fire.
Машинный перевод запроса на русский язык:
Стиль: гранж / альтернативный рок 90-х, мужской хриплый вокал, тяжелый гитарный рифф с эффектом «дисторшн», темп 120 ударов в минуту.
Куплет: [Verse 1] The sky turns grey, a static hum / My sensors feel the rhythm come / Cool liquid drops on rusted chrome / A feeling that I’ve never known.
[Припев] It’s washing the binary away / In a world of neon and grey / I’m more than metal, more than wire / Feeling the sky’s electric fire.
Начинаем самую захватывающую часть нашего обзора. Сразу отметим, что порядок платформ в списке не отражает реального рейтинга. Подробное описание результатов и выбор лучшего вы найдете в конце статьи.
На данный момент Sonauto — самый интересный инструмент для любителей музэкспериментов. Его последняя версия v3 предлагает глубокий «продвинутый режим». Платформа работает быстро, на этапе бета-тестирования часто не требует оплаты и дает огромный контроль над итоговой структурой композиции. Бот прост в использовании и может сгенерировать трек по простому текстовому запросу.
Результат теста: настоящий хит. Искусственный интеллект идеально уловил эстетику «гранжа 90-х». Гитара звучит напористо и аутентично, а в голосе присутствует та самая характерная хрипотца, которую ожидаешь услышать в треках в духе Nirvana.
Трек от Sonauto
Это официальный ответ Google в технологической гонке музыкальных нейросетей. Продукт получился выверенным, быстрым и интегрированным прямо в приложение Gemini. Он даже создает уникальную обложку для каждой композиции. Однако у него есть определенные ограничения. Самое заметное — лимит по времени. Он не способен создавать длинные треки.
Результат теста: профессионально. У этой записи самое высокое качество звука, без малейшего «цифрового шипения». Но модель генерирует лишь 30-секундные отрывки, поэтому результат больше похож на высококлассную радио-заставку, чем на полноценную песню.
Трек от Gemini Lyria
Если вы хоть немного интересуетесь созданием аудио, то наверняка слышали об этом популярном нейроботе. Suno v5 — король полноценных композиций. Он способен сочинять произведения длиной до 8 минут с очень четкой структурой «куплет-припев-бридж».
Результат теста: очень достойно. Генератор идеально последовал текстовому запросу, а мелодия получилась невероятно запоминающейся. Вокал звучит очень «по-человечески», хотя и несколько чище и ближе к поп-музыке, чем тот гранжевый стиль, который мы запрашивали.
Трек от Suno v5
Udio известен как инструмент искусственного интеллекта для музыкантов. Он фокусируется на студийном звучании высокого качества и отлично подходит для электронной музыки и хип-хопа, предлагая мощную функцию «восстановления» для исправления отдельных участков песни.
Результат теста: превосходный инструментал. Ударные и бас звучат энергично и мощно. Создается ощущение, что трек записывали в настоящей студии. Вокал также хорош, но ему не совсем удалось передать «хриплость» голоса в отличие от бота Sonauto.
Прослушать трек на сайте Udio (v4)
И последняя платформа AIVA — это совершенно другой зверь. В отличие от других ИИ в списке, он не поддерживает создание музыки по текстовому промпту. Вместо этого он создан для опытных профессионалов, которые хотят сочинять конкретные треки, а не получать «готовую» песню с вокалом.
Результат теста: студийное качество. Поскольку я не мог использовать полную инструкцию, я применил его стилевые настройки для «Рока». В итоге получился атмосферный, многослойный инструментал, который звучал как саундтрек к фильму. Никакого вокала, только чистая композиция.
Трек от AIVA
Прослушав все результаты, мы объявляем победителем в этой битве Sonauto. Его способность в модели v3 передавать необузданные, эмоциональные текстуры вокала на данный момент не имеет себе равных, а «неограниченный» доступ в бета-версии делает работу с ним сплошным удовольствием.
Gemini (Lyria 3) уверенно занимает второе место, поскольку его профессиональное качество звука впечатляет, даже несмотря на короткую продолжительность треков. Хотя Suno, Udio и AIVA также являются сильными конкурентами, именно Sonauto становится лидером по части чистой (и качественной) креативности.
Обложка: 1GAI