Elevenlabs — это инструмент для генерации нейросетевых аудио.
Здесь много разных возможностей: перевод текста в речь, перевод речи в текст, различные звуковые эффекты, клонирование голоса, чистка звука, создание аудиокниг, генерация музыки и так далее.
Что касается цен — есть бесплатный тариф, на котором можно сделать 10 минут перевода текста в речь.
Есть платные тарифы, на которых лимиты больше.
Самая интересная возможность – это клонирование голоса.
Быстрый клон голоса доступен на тарифе за 5$, профессиональный клон – только на тарифе за 11 долларов (в первый месяц, далее будет 22$):

Рассмотрим несколько возможностей сервиса:
- Перейдите по ссылке https://elevenlabs.io и зарегистрируйтесь:

Я покажу на примере моего аккаунта, у меня платный тариф:
1. Преобразование текста в речь с помощью голосов, которые уже есть в системе
- Перейдите в раздел «Преобразование текста в речь»:

- Вставьте ваш текст:

В колонке справа есть различные настройки:
- В разделе голоса можно выбрать любой голос:

Сначала попробуем голоса по умолчанию – они доступны, в том числе, на бесплатном тарифе:

- Здесь много голосов, которые вы можете предварительно прослушать и выбрать тот, который вам понравится:

- Далее можно выбрать модель – на данный момент лучше всего работает v2 и задать дополнительные настройки:

- Когда все готово, нажмите кнопку «Сгенерировать речь»:

Вы можете прослушать готовый вариант и при необходимости сменить голос.
Не все голоса, которые представлены по умолчанию, интересные и хорошо звучат.
Любую готовую речь вы можете скачать:

Это базовый вариант преобразования текста в речь.
2. Создание нового голоса
Вы можете создать голос по вашему промпту.
- Кликните на кнопку «Попробуйте voice design V3»:

- Подробно опишите голос, который вы хотите сделать и нажмите кнопку Генерация голоса:

- Система предоставит 3 варианта голоса – вы можете прослушать их и выбрать тот, который больше понравился:

- Назовите голос, укажите язык и сохраните:

- Голос будет доступен в разделе Голоса – Voice Design:

Далее вы можете выбирать его для генерации речи.
Это были варианты, когда вы используете не свой голос.
Для создания клона своего голоса есть 2 варианта:
3. Мгновенный голосовой клон (доступен на тарифе за 5$)
Он делается из 10-секундного аудио и совершенно неидеально копирует голос, по крайней мере мой.
У меня получилось совсем непохоже. При этом я знаю примеры, когда получается более или менее неплохо. Зависит от голоса.
4. Профессиональный голосовой клон (доступен на тарифе за 11$)
Для его создания требуется не менее 30 минут чистого звука с вашим голосом.
Здесь получается очень похоже.
Я давал послушать людям, которые меня хорошо знают, и они не каждый раз определяли, где говорю я, а где аватар.
Конечно, он не может воспроизводить сложные эмоции и полностью эмитировать человеческую речь, но в целом получается довольно интересно.
Генерируются клоны на главной странице в соответствующем разделе:

Можно сделать довольно много быстрых клонов – они делаются буквально за пару минут. И один профессиональный голосовой клон:

Мы рассмотрели варианты использования только одной возможности сервиса Elevenlabs – генерации аудио из текста. Помимо этого, здесь очень много других функций.
Подробнее про нейро-звук посмотрите здесь
Используйте!
Elevenlabs — 4 варианта генерации речи по тексту (включая клон голоса) — видео на Youtube