TechBlogSD - Все для WordPress и WEB разработки
WEB и WordPress инструкции, новости, обзоры тем и плагинов

Синтез речи для вашего веб-сайта – 7 лучших решений

2 728

То, что когда-то было технически сложным и дорогостоящим мероприятием, доступным лишь немногим, теперь превратилось в развивающуюся отрасль, доступность и своевременная доставка которой помогают голосовым технологиям вступить в сегодняшнюю эпоху эффективности. Ниже вы найдете список из 7 лучших указанных компаний:

1 Trinity Audio

Этот тель-авивский стартап находится в авангарде аудио-революции. Они предоставляют решение для аудиоконтента, направленное на то, чтобы донести звук до издательского сектора, а также для каждого создателя контента, который ищет способ расширить свою аудиторию, поддерживать ее вовлеченность и монетизировать ее. 

Компания в первую очередь добивается этого за счет сотрудничества с Amazon Polly. Они внедряют на веб-сайте издателя изящный проигрыватель на основе JavaScript, который мгновенно преобразует контент из текста в аудио. Пользователи могут настроить его в соответствии с существующим опытом работы с веб-сайтом и поработать с различными языками, голосами и скоростями воспроизведения. Пользователи WordPress могут воспользоваться своим плагином WordPress.

После внедрения аудиоплеер имеет возможность автоматически создавать индивидуальный набор умных навыков говорящего на основе выбранного контента. У Trinity Audio также есть технология контента (или ConTech, как ее называют в компании), которая постоянно изучает поведение аудитории и предоставляет рекомендации по аудиоконтенту. TrinityAudio также поддерживает независимые СМИ и спонсирует подкаст Voice Tech.

2 BingeWith

Компания BingeWith, основанная в конце 2018 года в Калифорнии, США, преобразует текстовый онлайн-контент в насыщенный звук с помощью встроенного проигрывателя, позволяя пользователям мгновенно преобразовывать любой блог и статью в аудио.

Он работает на различных платформах, включая WordPress, Squarespace, Medium и JavaScript. В WordPress вы можете просто установить их плагин, а затем вставить шорткод в начало любой статьи, в которой должен отображаться виджет проигрывателя. Затем, когда текст статьи будет завершен, щелкните виджет, чтобы сгенерировать звук.

В качестве альтернативы, чтобы создать файл mp3, вы можете вставить ссылку на статью или необработанный текст на веб-сайт BingeWith, и он создаст аудио версию, которую вы сможете скачать.

BingeWith использует ИИ, который соответствует естественным образцам речи, беря подсказки из текста, такие как запятые и точки с запятой, для создания естественной звучащей речи. Также есть выбор голосов из разных регионов и полов. 

Встраиваемый плеер привлекателен, и его цвет можно настроить. Он имеет красивую большую кнопку воспроизведения, 15 секунд для перехода вперед и назад и общее время аудиоклипа. Слушатели также могут установить наиболее удобную для них скорость звука. В настоящее время мы используем BingeWith на этом сайте, так что вы можете поиграть с ним вверху этой страницы!

3 Speak2web

Speak2web, родом из Миннесоты, США, представляет собой платформу голосового помощника, предназначенную для предоставления услуг предприятиям всех типов и размеров, а не только отдельным блогам. Работая по бизнес-модели платной подписки с доступной бесплатной пробной версией, компания предлагает плагин, который добавляет голосового помощника под названием Simon AI на любой веб-сайт, позволяя посетителям участвовать в разговоре, как если бы они разговаривали с реальным человеком.

Настройка занимает до часа, и пользователи могут выбирать между рассказчиком мужского или женского пола. 

Несмотря на то, что он в основном ориентирован на WordPress, speak2web поддерживает другие платформы веб-сайтов и мобильные приложения. Решение REST API компании легко интегрируется в любой веб-сайт или мобильное приложение, сторонние организации, такие как системы управления списками и бронированием, и даже в источники неструктурированных данных. Голосовой помощник получает доступ ко всем данным на веб-сайте, позволяя посетителям искать и совершать покупки с помощью голосового ввода.

4 SpeechKit

SpeechKit – это независимое решение с открытым исходным кодом, которое в считанные секунды добавляет аудио-текст в речь на любой сайт как часть универсального инструментария для автоматической публикации аудиовизуальных новостей. Имея доступ к десяткам последних голосов из Google WaveNet и Amazon Polly, эта платформа предоставляет технологию программирования на естественном языке и аудиоаналитику с подробными отчетами о вовлечении в аудио.

Помимо аудио-выпусков новостных статей и информационных бюллетеней, SpeechKit также предлагает настраиваемый навык Alexa Skill для развертывания аудиоконтента через плагин WordPress, RSS-каналы или его аудио API. Компания недавно запустила бета-версию AdStudio (бета), своей платформы самообслуживания для аудиообъявлений, которая дает пользователям возможность продавать аудио-спонсорство в начале ролика, что, вероятно, направляет сервис в большей степени на устоявшиеся предприятия, чем на независимых блоггеров.

5 Play.ht

Play.ht – еще один TTS-сервис, который позволяет пользователям WordPress делать свои записи в блогах доступными для прослушивания в виде подкастов. Это также позволяет авторам среднего уровня добавлять аудио к своим статьям через расширение браузера, предназначенное только для Chrome. Выполнив простую процедуру настройки и нажав кнопку «Опубликовать со звуком», авторы могут мгновенно озвучить свое написанное слово на широком диапазоне голосов и языков. Они могут публиковать новые статьи со звуком или впоследствии добавлять аудио к уже опубликованным статьям на своей странице историй.

Сам аудиоплеер можно настроить в соответствии с внешним видом вашего блога. Play.ht также предоставляет приличный объем аудиоаналитики, чтобы пользователи могли проверить, сколько людей слушают, делятся и / или загружают свои истории.

6 Web Speech API

Новый JavaScript Web Speech API позволяет обрабатывать голосовые данные и добавлять распознавание речи на веб-страницы и в приложения. Он состоит из двух частей – преобразования текста в речь (SpeechSynthesis) и асинхронного распознавания речи (SpeechRecognition).

Часть SpeechSynthesis позволяет веб-страницам считывать свое текстовое содержимое и поддерживается большинством основных браузеров. 

SpeechRecognition позволяет веб-страницам слушать посетителей (через их микрофон, если они дают разрешение), распознавать голосовой контекст из аудиовхода и отвечать соответствующим образом. SpeechRecognition в настоящее время полностью поддерживается только Chrome.

Вместе эти две части облегчают общение между веб-страницей и посетителем. Голоса TTS и разделы текста, которые будет произносить система, полностью настраиваются, но для реализации двустороннего взаимодействия требуются некоторые навыки программирования.

7 Отзывчивый голос

ResponsiveVoice – это неограниченная библиотека преобразования текста в речь на основе HTML5, которая также имеет плагин WordPress, предназначенный для добавления голосовых функций в систему управления контентом на смартфонах, планшетах и ​​настольных компьютерах. На данный момент он поддерживает 51 язык и 168 голосов.

При добавлении на веб-сайт WordPress сам плеер не является инвазивным и выглядит как простая кнопка с надписью «Слушать публикацию», «Слушать это» или что угодно в ней. Весь процесс включает только добавление шорткода в любом месте страницы или публикации, и все готово. Вы можете настроить его на чтение всей страницы или только части текста. Кроме того, вы можете установить другие параметры, такие как высота голоса, скорость и громкость. 

Обновление – 5 декабря 2019 г.

8 ReadSpeaker

С 1999 года ReadSpeaker является одной из ведущих компаний B2B TTS во всем мире с более чем 10 000 клиентов в самых разных сферах. Они разрабатывают фирменные голоса для всемирно известных брендов и предлагают 90 высококачественных голосов TTS на более чем 30 языках. Их портфель продуктов включает облачные, производственные и локальные решения для речи, позволяющие использовать IVR, разговорные системы, голосовые помощники, автомобильную промышленность, робототехнику, системы публичных объявлений, обучающие платформы, веб-сайты и многое другое.

Источник записи: voicetechpodcast.com

Этот веб-сайт использует файлы cookie для улучшения вашего опыта. Мы предполагаем, что вы согласны с этим, но вы можете отказаться, если хотите. Принимаю Подробнее