Все чаще в повседневной жизни стали использовать синтезаторы речи. Синтезаторы речи, как становится видно уже по одному названию, осуществляют синтез речи, то есть форматируют письменный текст в устный.
Благодаря этому можно учить новые иностранные слова с правильным произношением, читать книги не отвлекаясь от своих дел или, например, находясь в транспорте. Изначально разработкой таких программ занимались организации, специализирующиеся на технике для людей с проблемами зрения.
Для этого было разработано множество различных программ, приложенный и даже целых систем. К сожалению, не все из них предназначены для русскоязычной аудитории.
Acapela — один из самых распространенных речевых синтезаторов во всем мире. Программа распознает и озвучивает тексты более, чем на тридцати языках. Русский язык поддерживается двумя голосами: мужской голос — Николай, женский — Алена.
Женский голос появился значительно позднее мужского и является более усовершенствованным.
Прослушать, как звучат голоса, можно на официальном сайте программы . Достаточно лишь выбрать язык и голос, и набрать свой небольшой текст.
Кстати, для мужского голоса был разработан отдельный словарь ударений, что позволяет достичь еще большей четкости произношения.
Установка программы проходит без проблем. Разработаны версии для операционных систем Windows, Linux, Mac, а также для мобильных ОС Android u IOS.
Программа платная, скачать ее можно с официального сайта Acapela.
Вторым в нашем списке, но не по популярности является движок Милена от разработчика программы Vocalizer компании Nuance.
Голос звучит очень естественно, речь чистая. Есть возможность установить различные словари, а также подкорректировать громкость, скорость и ударение, что не маловажно.
Как и в случае с Акапелой, программа имеет различные версии для мобильных, автомобильных и компьютерных приложений. Прекрасно подходит для чтения книг.
Скачать все версии Vokalizer и русскоязычный движок Милена можно на официальном сайте производителя программы.
Синтезатор речи RHVoice был разработан Ольгой Яковлевой. Программа озвучивает русские тексты тремя голосами: Елена, Ирина и Александр. Подробнее об установке и применении, а также прослушать голоса Вы сможете в прошлой статье
Код синтезатора открыт для всех, программы же абсолютно бесплатны.
RHVoice выпущена в двух вариантах: как отдельная программа, так и как приложение к NVDA.
Все версии можно скачать с официального сайта разработчика.
Первая версия бесплатного синтезатора речи eSpeak была выпущена в 2006 году. С тех пор компания-разработчик постоянно выпускает все более усовершенствованные версии. Последняя версия была представлена в конце весны две тысячи тринадцатого года.
eSpeak можно установить под следующие операционные системы:
Возможна также компиляция кода для Windows Mobile, но делать ее придется самостоятельно.
А вот с мобильной ОС Android программа работает без проблем, хотя русские словари еще не до конца разработаны. Русскоязычных голосов много, можно выбрать на свой вкус.
Для разработчиков будет интересно узнать, что C++ код программы доступен в сети. Скачать программу, а также посмотреть ее код можно на официальном сайте.
Festival — это целая система распознавания и синтеза речи, которая была разработана в эдинбургском университете.
Программы и все модули абсолютно бесплатно и распространяются по системе open source. Скачать их и ознакомиться с демо-версиями можно на официальном сайте университета Эдинбурга.
Русский голос представлен в одном варианте, но звучание довольно хорошее и ясное, без акцента и с правильной расстановкой ударений.
К сожалению, программа пока может быть установлена только в среде API, Linux. Также есть модуль для работы в Mac OS, но русский язык пока поддерживается не очень хорошо.
Стоит отметить, что любой из вышеприведённых синтезаторов отлично исполнен, но выбор программы индивидуален. Всё объясняется различным произношением голосов. Смею посоветовать второй вариант с голосом Милена. ОЧень выразительный голос, насыщенное звучание и приятная во всех смыслах интонация голоса!
Синтезатор речи является основным средством получения информации о содержимом экрана для незрячего пользователя компьютерной техники, а когда отсутствует альтернатива в виде брайлевского дисплея, то и вообще единственным. Ввиду того что поддержка работы с тактильными дисплеями в платформе Android находится лишь на стадии становления, значение text-to-speech для пользователей с нарушениями зрения становится ещё больше.
На момент написания обзора, пользователям Android OS доступно несколько решений синтеза русской речи с различным качеством синтеза и набором недостатков. Предлагаем познакомиться с ними поближе и послушать их звучание.
Поскольку система Android не предоставляет пользователю возможность переключения синтезаторов речи «на лету», часто возникает ситуация, когда одним голосовым движком приходится читать многоязычные тексты, как минимум, с наличием русского и английского. Даже полный переход на английский интерфейс не решает эту проблему, так как для чтения русскоязычных web-страниц или сообщений всё равно придётся переключаться на русский синтезатор речи, проходя весь путь по меню. Кроме того, работа с использованием синтезаторов речи в целом уступает по производительности зрительному восприятию данных с экрана, поэтому многие опытные незрячие пользователи для компенсации этого отставания предпочитают настраивать TTS на максимальную скорость чтения.
Ввиду этого, в данном обзоре мы также уделим значительное внимание не только качеству синтеза речи как таковому, но и таким аспектам как чтение латинского текста и скорость речи, которые являются важными для людей, использующих text-to-speech в программах экранного доступа.
В конце обзора можно найти сводную таблицу оценки существующих решений по трём ключевым параметрам: качеству синтеза, скорости речи и поддержки чтения латинского текста.
Компанией Acapela Group под операционную систему Android были портированы несколько десятков её синтезаторов речи, используя генератор фраз, среди которых есть и широко известный русский голос Алёна. В целом по качеству синтеза речи данное коммерческое решение находится на довольно высоком уровне, но продукт не лишён и ряда недостатков, хотя, ради справедливости, стоит отметить, что на момент написания обзора он имеет статус beta.
Во-первых, весь движок крайне нестабилен и склонен к ошибкам на всех поддерживающихся версиях Android, после которых его приходится перезапускать.
Во-вторых, у Алёны наблюдается распространённая ошибка с отсутствием произношения отдельно стоящих русских беззвучных букв, таких как мягкий и твёрдый знаки.
В-третьих, голос склонен к проглатыванию окончаний фраз, особенно на границе кириллического и латинского текстов, что можно заметить в вышеприведённом примере.
Из положительных особенностей можно выделить то, что это высококачественный голос, который одновременно с этим подходит не только для разовых задач по озвучиванию текста, но и постоянной работы в программах экранного доступа, так как обладает более быстрым откликом чем движки SVOX и не имеет их проблем с чтением отдельно стоящих латинских букв.
Чтение текста, написанного латинскими буквами, осуществляется по правилам английского языка, хотя с произношением, крайне далёким от правильного.
Максимальная скорость Алёны не очень велика, поэтому любители быстрой работы, скорей всего, будут разочарованы.
Чтобы приступить к работе, сначала из Play Market следует скачать общий движок Acapela TTS Voices, в меню которого следует выбрать интересующий голос. Далее в открывшемся меню нажать на кнопку «Buy» и пройти стандартную процедуру покупки, после чего снова открыть меню этого голоса и подгрузить синтезатор, нажав на кнопку «Download».
Системные требования: Android 2.2 и выше.
Стоимость: 3,30 EUR.
Под операционную систему Android Анатолием Камыниным был портирован широко известный в узких кругах синтезатор речи Капитан.
На момент написания обзора продукт находится на стадии публичного тестирования, но уже сейчас некоторыми используется в качестве основного голоса системы.
Как слышно из аудиозаписи, голос характеризуется высокой разборчивостью произношения, но неестественным звучанием, что делает его речь трудно воспринимаемой для неподготовленного пользователя.
Из существующих недостатков и специфических особенностей можно отметить следующее.
Во-первых, на некоторых устройствах синтезатор дублирует первый символ текстового отрезка, что создаёт эффект лёгкого заикания в начале фраз.
Из положительных особенностей можно отметить рекордную скорость отклика, превосходящую все существующие аналоги, а также возможность более гибкого конфигурирования, в частности многоступенчетого указания подробности чтения неалфавитных знаков: от редких символов пунктуации до каждого знака пробела.
Чтение латинского текста синтезатором осуществляется строго по правилам латыни, что, при знании соответствующих принципов чтения, позволяет работать практически с любым языком на базе латинской письменности.
В отношении скорости речи Капитан также может претендовать на призовые места, выдавая одни из самых высоких результатов.
Системные требования: Android 2.2 до 3.0.
Системные требования: Android 4.0 и выше.
Одни из основных разработчиков специализированного программного обеспечения под Android, сообщество Eyes-Free Project, портировали под эту операционную систему хорошо известный некоммерческий синтезатор речи eSpeak.
Как слышно из демонстрации, его речь на русском языке обладает рядом существенных недостатков.
Во-первых, в русском тексте синтезатор не читает символы в верхнем регистре, как это произошло в вышеприведённой записи со словами «Здравствуйте, Меня, Моим, Подробности».
Во-вторых, всю поступающую на синтезатор строку кириллических символов eSpeak разбивает на множество небольших фрагментов, состоящих либо из нескольких, либо вообще из одной буквы. Чем и объясняется такая рванная речь. Особенно это заметно при наличии мягкого знака на конце слов, который практически всегда читается отдельно.
В-третьих, общее качество звукового сигнала достаточно низко, что особо заметно при работе в наушниках.
Из положительных качеств можно отметить немного более высокую скорость отклика, по сравнению с аналогами, а также, главным образом, бесплатность.
Чтение данным синтезатором латинского текста осуществляется по правилам английского языка и отличается приемлемым качеством.
В отношении максимальной скорости речи eSpeak, к сожалению, не может похвастаться высокими показателями, поэтому с этой стороны не стоит ждать от него многого.
Системные требования: Android 2.2 и выше.
Данный синтезатор речи от Vocolazer представляет собой не универсальный голосовой движок, встраивающийся в системную TTS-службу Android, а встроенный компонент русскоязычного программного комплекса экранного доступа Mobile Accessibility.
Таким образом, этот голос не может быть использован никакой другой программой, кроме русскоязычной локализации продукта Code Factory.
Синтезатор обладает достаточно высоким качеством звучания, а также приличной скоростью отклика, хотя всестороннее тестирование данного аспекта осложняется встроенностью движка в конкретное приложение.
В целом это очень качественное решение по синтезу речи, которое известно по многим другим платформам, но и оно имеет некоторые недостатки.
Во-первых, из-за встроенности Милены в продукт Code Factory, пользователь имеет возможность работать с ним либо внутри среды Mobile Accessibility, либо в системе Android, но исключительно при использовании программы экранного доступа из состава MA.
Во-вторых, сам голос Милены характеризуется своеобразным произношением некоторых букв, например, буквы «ч», при некоторых конфигураций соседних литер, что в частности наблюдается в таком частоупотребимом при озвучивании интерфейсов слове как «отмечено».
Из положительных аспектов также можно отметить тот факт, что за счёт встроенности синтезатора в пакет Mobile Accessibility, пользователю доступны более тонкие настройки, нежели те, которые предоставляются голосовой системной службой Android, например, регулировка чтения знаков пунктуации или фонетическое чтение символов.
Латинский текст Милена читает по правилам английского языка, но правильность произношения зачастую находится на довольно низком уровне, хотя общие правила примерно соблюдаются.
В отношение же скорости речи это один из самых быстрых синтезаторов.
Стоимость: 69 EUR.
В рамках ещё одного решения предлагается два коммерческих русскоязычных голоса от SVOX.
Это женский голос по имени Катя и мужской по имени Юрий, которые, ввиду своего родства, обладают схожими преимуществами и недостатками.
Из различий можно лишь отметить только более богатый низкими частотами голос Юрия, а также, на наш взгляд, его более правильные интонации. Правда, здесь же стоит и упомянуть слабо уловимые дефекты речи Юрия при произнесении шипящих согласных, что, например, можно заметить в отношении буквы «ч» в слове «точка».
Относительно же общей характеристики, то, как слышно из демонстрационных файлов, здесь качество синтеза достаточно высоко и читаемая информация воспринимается без особого труда. Тем не менее, и эти голоса имеют ряд недостатков.
Во-первых, фрагменты текста, являющиеся совокупностью букв и небуквенных знаков, синтезатор зачастую произносит по символам, а не слитно, как это произошло с частью ссылки «www.tiflocomp.ru». Также это проявляется на E-mail адресах и просто на тексте, где не чётко соблюдаются правила постановки пробелов, например, в SMS.
Во-вторых, при вводе текста, буквы I, V, X, L, C, D и M синтезатор читает как римские числа, что для незрячего пользователя, использующего TTS не только для чтения книг, но и для абсолютно всей работы, крайне не удобно. Причём чтение римских чисел также страдает от ошибок, например, MI считается числом 101, а не 1001.
В-третьих, текстовый процессор голосового движка некорректно обрабатывает арабские цифры, читая многие числа неправильно. Главным образом, это заметно на десятичных дробях.
В-четвёртых, синтезатор в целом обладает меньшей скоростью реакции нежели многие аналоги, хотя и с крайне незначительной разницей.
К сожалению, в отношении чтения латинского текста голоса SVOX не способны похвастаться хорошей разборчивостью.
Как слышно из демонстрационной записи, SVOX в целом читает латиницу по правилам чтения латыни, но местами пытается произносить её на английский манер, например, слово «voice» читается как «войке», а не «войце».
В отношении же максимальной скорости эти голоса также не характеризуются высокими показателями.
Системные требования: наличие SVOX Classic Text To Speech Engine и Android 2.1 и выше.
Стоимость: 2,99 USD (за каждый голос отдельно).
Данный синтезатор, разработанный Сергеем Нечипоренко и распространяемый бесплатно, представляет собой облачный сервис, использующий в своей работе Google TTS API. В сущности программа не занимается синтезированием речи, она лишь встраиваясь в голосовую службу Android, отправляет на сервер Google текстовую информацию и воспроизводит возвращаемый аудиосигнал.
Это обуславливает тот факт, что для работы синтезатора необходимо активное Интернет-подключение с достаточно высокой скоростью передачи данных.
Как слышно из демонстрационной аудиозаписи, Google TTS использует уже знакомый голос Катя от SVOX, поэтому для него характерны все те же особенности, которые были освещены в обзоре SVOX Classic TTS.
Отдельно только стоит обратить внимание, что TTS Online не поддерживает настройку скорости речи, поэтому пользователю придётся смириться с его неторопливым темпом.
Кроме того, на момент написания обзора, TTS Online не поддерживает работу в среде Android 4.0.x Ice Cream Sandwich, и изменение этого, по заявлению разработчика, в обозримом будущем не планируется.
Системные требования: Android от 2.2 до 3.x.
Ниже приведена сводная таблица существующих русскоязычных синтезаторов речи под Android OS, в которой отражены такие характеристики как качество голоса, применяемые правила чтения латинского текста и максимальная скорость речи.
Каждый из нас, наверняка сталкивался тем или иным образом с синтезатором речи. В общем и целом их называют «преобразователями из текста в речь» или, более распространённая аббревиатура – TTS (Text-to-speech). Сейчас любой желающий может зайти в переводчик Google и услышать собственными ушами, как работают подобные системы. Было время когда эту технологию активно внедряли в различные системы перевода. Но нас, как музыкантов, интересует использование синтезаторов речи в качестве вокала, при создании музыки, а также в виде плагина для нашей рабочей станции. И это тоже возможно – рассмотрим несколько подобных VST-инструментов и программ.
Первый плагин – от японских разработчиков, со всеми вытекающими последствиями (рис.1).
Рисунок 1. Интерфейс Aques Tone 2.
Неизвестно, заведомо ли японцы решили привнести некоторые ошибки, вроде «Poli» вместо «Poly», но и других японских «фишек» здесь хватает. Например, руководство пользователя доступно только на японском. Но это полбеды. Плагин заточен в основном под японские фонемы! Чтобы понять это на практике представьте, как японец произнёс бы английскую фразу, записанную в японской транскрипции.
Кроме того, органов управления не так уж и много. Основная секция здесь в верхнем окне, в котором загружается файл с нужными фразами. Почему нельзя было сделать возможность писать фразы и проигрывать их «на лету» — непонятно. Ну что ж, попробуем синтезировать какую-нибудь фразу.
Для этого нужно в любом текстовом редакторе написать её, сохранить, а затем загрузить в плагин. Возьмём, к примеру, простую фразу «Hey, yo, come on»! Для того, чтобы Aques Tone 2 распознал её более-менее адекватно, нужно написать так: «hey yo camon». И сохранить файл с расширением txt (в моём случае – hello.txt).
Теперь открываем этот файл, нажав на кнопку Open (рис. 2). Не забываем установить тип файлов «txt».
Рисунок 2. Открываем файл с «лирикой».
Если всё правильно загрузилось, в нашем основном окне, мы увидим записанную нами фразу – «hey yo camon».
Следующий шаг – прописать партию. Собственно, обозначить моменты, когда будет звучать каждый слог. Схема здесь такая – с нажатием каждой новой ноты проигрывается очередной слог. На рисунке 3 я подписал над каждой нотой за какой слог она отвечает.
Рисунок 3. Прописываем ноты для слогов.
Как видим, располагаются они своим особым образом. К примеру, почему-то звук «N» отделился на отдельную ноту, а не «прилип» к слогу «MO». Да и вообще, если послушать демо-фразы, встроенные в программу, то очевидно прослушивается направленность на японский язык.
Регуляторы, представленные в этом vst-инструменте, не представляют особого интереса. Они отвечают за некоторые характеристики эмулируемого голоса. Самым ощущаемым на слух я выделил бы Gender. Он делает голос либо более «мужским», либо более «женским». Кавычки я поставил не случайно, т.к. однозначно сложно сказать – мужской ли это голос, либо женский. Также, к примеру, регулятор Resonance при очень низких значениях делает голос совершенно неестественным, а при высоких – более мягким. Остальные параметры можно «крутить» на свой вкус. Ну и напоследок хочется отметить, что доступен всего лишь один встроенный голос под именем «Lina». Впрочем, послушайте сами сэмпл из нескольких тактов созданной нами фразы – сделайте выводы. Плагин бесплатный.
В отличие от предыдущего представителя, Cantor 2 представляет собой более «продвинутую» систему для синтезирования вокальных партий, но уже за денежку. Он также имеет версию в виде отдельной программы. Хотя и vst-инструмент представляет собой аналог piano-roll в секвенсоре: взгляните на интерфейс (рис. 4).
Рисунок 4. Главное окно VirSyn Cantor.
Поскольку этот плагин обладает большим инструментарием, он может манипулировать большим количеством параметров голоса. Но начинать нужно всё равно с построения фразы по слогам. Как несложно догадаться, делается это посредством piano roll. Здесь же есть панель инструментов с привычными «карандашами», «ластиками» и т.п. Собственно, попробуем синтезировать упоминавшуюся выше фразу «hey, yo, come on»! Нарисуем события в виде прямоугольных областей, а также подпишем каждый из них, как на рисунке 5.
Рисунок 5. «Рисуем» фразу в piano-roll в Cantor.
Как можно увидеть, слова написаны над событиями не все целиком. Например, слово «come on» разбито на два слога – «com» и «on». Внимательные пользователи заметят, что внизу автоматически прописаны фонемы – это довольно удобная функция. Если вдаваться в подробности и нюансы, то нужно очень хорошо представлять себе, что такое фонемы и прочие тонкие нюансы звучания речи, доступные разве что узким специалистам. Мы просто оставим это как есть и посмотрим как оно работает в общем. Но это не всё. Теперь в самой миди-партии дорожки Cantor 2 тоже нужно прописать партию, соответственно которой будут звучать наши слова (слоги). Сделаем так, как на рисунке 6.
Рисунок 6. «Рисуем» фразу в piano-roll в секвенсоре.
Теперь можно включить проигрывание в секвенсоре и убедиться, что у нас появился некий звук на выходе.
Далее настроим некоторые нюансы звучания. Сразу оговорюсь, что для исследования всех нюансов настройки Cantor 2 нужно писать целую книгу. В рамках этой статьи мы рассмотрим общие параметры. Итак, во-первых, можно выбрать уже готовый голос. Доступно их около десятка. Открыть их можно в верхней части программы, в опции Load voice (рис. 7).
Рисунок 7. Загружаем голос.
По-умолчанию был установлен «Nikki», но я переставил его на «Luther». Можете попробовать различные голоса, как женские, так и мужские.
Во-вторых, здесь есть секция эффектов (собственно, раздел Effects, рис. 8).
Рисунок 8. Добавляем эффекты.
Доступно 4 эффекта – Distortion, Echodelay, Chorus и Reverb. Хотя эти же эффекты можно добавлять и отдельно.
Про секции Phoneme и Voice нет смысла рассказывать, т.к. они довольно сложны в освоении и разобраться в их настройках может разве что довольно узкий специалист. Хотя никто не мешает покрутить ручки в этих секциях и таким образом изменить звучание. Либо корпеть над теорией синтезирования речи, а также над руководством пользователя Cantor, чтобы понимать как это всё должно работать. В общем, довольно много параметров, довольно сложно и довольно примитивный звук получается в итоге.
Тем не менее, даже новичок, если постарается, сможет получить звучание, наподобие того, что получилось у меня.
Возможно, многие из вас, увидев Fruity Loops, удивятся, каким образом он попал в эту статью, ведь это скорее, программа для создания музыки, нежели синтезатор речи. Всё дело в том, что Fruity Loops имеет в своём арсенале очень неплохой синтезатор речи. Называется он Speech Synthesizer. И хоть его нет в виде отдельного плагина, но можно вставить сам FL как vst-плагин в вашу рабочую станцию и там уже использовать его Speech Synthesizer. Но я всё же предпочитаю создавать речевую партию в самом FL, затем экспортировать её в аудиофайл, после чего использовать в любой рабочей станции.
Итак, попробуем создать партию из предыдущего примера непосредственно в FL Studio. Вставим этот плагин в наш проект (рис.9).
Рисунок 9. Добавляем Speech Synthesizer в Fruity Loops.
Как только мы добавим его в проект, автоматически появится окно, предлагающее ввести наш текст. Можно долго не думать и сразу ввести нашу фразу из примеров выше (рис. 10).
Рисунок 10. Настройки параметров речи.
Кроме того, можно сразу же установить и другие параметры речи, такие как голос (доступно около 20 голосов), стиль произношения, режим (шёпотом, с придыханием, либо обычный) и настройки темпа и тональности. Советую сразу настроить темп (у меня он, допустим 140, соответственно темпу проекта). Кнопка Listen позволяет прослушать партию «на лету», до её создания. После того, как мы подобрали нужные параметры нажимаем галочку, программа предложит нам сохранить наш файл с созданной речевой партией и в проекте создаётся новая партия с вокалом (рис. 11).
Рисунок 11. Новая речевая партия в проекте.
Нам не нужно заморачиваться – Speech Synthesizer создал за нас дорожку, которая представляет собой Fruity Slicer с созданной в нём партией, разбитой по нотам, где каждому слову соответствует отдельная нота (на рисунке 11 справа как раз видно, что у нас есть партия с 4 кусочками). Кроме того, в piano roll созданы дорожки для нот с подписанными словами, что очень удобно (рис. 12).
Рисунок 12. Окно piano-roll с новой партией.
Всё довольно наглядно и просто. Не нужно прописывать фонемы, подбирать слоги, чтобы фраза звучала правильно. Достаточно просто ввести фразу – она будет звучать уже довольно сносно и разборчиво. Затем также просто можно переставлять слова и экспортировать партию в желаемый аудиоформат. Можно убедиться самим, прослушав пример.
Лично моё мнение: лучше живая речь, живой вокал. Если же выбирать из вышеупомянутых программ, то, безусловно по количеству настроек и параметров выигрывает Cantor 2. Тем более, что он претендует на звание не просто синтезатора речи, а даже вокального синтезатора. Если выбирать по удобству, простоте и качеству звучания, я отдаю предпочтение Speech Synthesizer из Fruity loops.
Есть ещё бесплатная программа для синтезирования речи — AnalogX SayIt. Можно настроить различные параметры и после предпрослушки сгенерировать результат в звуковой файл.
интересное приложение, которое способно преобразовать печатный текст в звуковую речь. Это удобно для создания различных аудио уроков, лекций или даже целых книжек, когда находясь в дороге можно просто.
18 дней назад Лицензия: Бесплатная Язык: Русский/Английский ОС: XP/Vista/7/8/8.1/10 Размер: 3.63 МБ
— программа предназначена для чтения вслух текстовых файлов. Для воспроизведения звуков человеческого голоса могут использоваться любые речевые синтезаторы, установленные на компьютере. Воспроизвед.
2 месяца назад Лицензия: Бесплатная Язык: Русский/Английский/Немецкий ОС: XP/Vista/7/8/8.1/10 Размер: 16.17 МБ
мощный инструмент для озвучивания текста с веб-страницы, из письма, текстового файла, различных документов или конвертирования его в аудиофайлы формата MP3 или WMA. Программа интегрируется в такие при.
2 месяца назад Лицензия: Бесплатная Язык: Английский ОС: XP/Vista/7 Размер: 21.74 МБ
говорящий текстовый редактор. SAPI4 и SAPI5-совместимый синтезатор речи. Программа предназначена для чтения вслух текстовых файлов с использованием пакетов речевых функций Microsoft Speech API 4/5 (SA.
6 месяцев назад Лицензия: Бесплатная Язык: Русский ОС: XP/Vista/7/8/8.1/10 Размер: 3.59 МБ
С помощью 2nd Speech Center текст можно слушать, а не читать с экрана, таким образом дать отдохнуть глазам. Текст произносится из буфера обмена. Есть возможность записать произносимый текст в mp3/wav.
год назад Лицензия: Условно-бесплатная Язык: Английский ОС: 2000/XP/2003/Vista/7/8/8.1/10 Размер: 3.77 МБ
удобная и быстрая программа для озвучивания текстов, создания аудиокниг (в формате wav, mp3, amr, aac + плейлист), расстановки ударений в русских текстах или просто удобного чтения книг с экрана. Кром.
3 года назад Лицензия: Условно-бесплатная Язык: Русский ОС: XP/Vista/7 Размер: 2.59 МБ
бесплатная программа для преобразования текста в речь. Поможет прочесть в слух любой текст, а так же сохранить его в WAV или MP3 файл. В TTSReader уже имеются порядка 10 мужских и женских голосов. Пр.
7 лет назад Лицензия: Бесплатная Язык: Английский ОС: 2000/XP/Vista Размер: 2.29 МБ
Используя Pistonsoft Text to Speech Converter вы можете конвертировать текст в речь или аудиокнигу MP3 и WAV формата. В программе доступны все установленные в системе языки для озвучивания. Технологи.
9 лет назад Лицензия: Условно-бесплатная Язык: Русский/Английский ОС: XP/Vista Размер: 8.14 МБ
программа для озвучивания текстовых файлов, попросту говоря — говорилка. Текст может быть озвучен как мужским, так и женским голосом.
9 лет назад Лицензия: Бесплатная Язык: Русский ОС: XP/Vista Размер: 10.82 МБ
Эта программа читает текст разными голосами на разных языках и может записывать свой голос в wav файл. Говорушка подходит практически для всех категорий пользователей. Особо важна для людей, заботящих.
11 лет назад Лицензия: Условно-бесплатная Язык: Русский ОС: NT 4.x/98/2000/ME/XP Размер: 617 КБ
Голосовой движок Russian Milena (Text-to-Speech Voice)
Все чаще в повседневной жизни стали использовать синтезаторы речи. Синтезаторы речи, как становится видно уже по одному названию, осуществляют синтез речи, то есть форматируют письменный текст в устный.
Благодаря этому можно учить новые иностранные слова с правильным произношением, читать книги не отвлекаясь от своих дел или, например, находясь в транспорте. Изначально разработкой таких программ занимались организации, специализирующиеся на технике для людей с проблемами зрения.
Лучшие программы для изменения голоса
Для этого было разработано множество различных программ, приложенный и даже целых систем. К сожалению, не все из них предназначены для русскоязычной аудитории.
FL Studio: 6 заделка голоса под любой синтезатор
Acapela — один из самых распространенных речевых синтезаторов во всем мире. Программа распознает и озвучивает тексты более, чем на тридцати языках. Русский язык поддерживается двумя голосами: мужской голос — Николай, женский — Алена.
Женский голос появился значительно позднее мужского и является более усовершенствованным.
Прослушать, как звучат голоса, можно на официальном . Достаточно лишь выбрать язык и голос, и набрать свой небольшой текст.
Кстати, для мужского голоса был разработан отдельный словарь ударений, что позволяет достичь еще большей четкости произношения.
Установка программы проходит без проблем. Разработаны версии для операционных систем Windows, Linux, Mac, а также для мобильных ОС Android u IOS.
Программа платная, скачать ее можно с официального
Вторым в нашем списке, но не по популярности является движок Милена от разработчика программы Vocalizer компании Nuance.
Голос звучит очень естественно, речь чистая. Есть возможность установить различные словари, а также подкорректировать громкость, скорость и ударение, что не маловажно.
Как и в случае с Акапелой, программа имеет различные версии для мобильных, автомобильных и компьютерных приложений. Прекрасно подходит для чтения книг.
Скачать все версии Vokalizer и русскоязычный движок Милена можно на производителя программы.
Синтезатор речи RHVoice был разработан Ольгой Яковлевой. Программа озвучивает русские тексты тремя голосами: Елена, Ирина и Александр. Подробнее об установке и применении, а также прослушать голоса Вы сможете в прошлой статье
Код синтезатора открыт для всех, программы же абсолютно бесплатны.
RHVoice выпущена в двух вариантах: как отдельная программа, так и как приложение к NVDA.
Все версии можно скачать с разработчика.
Первая версия бесплатного синтезатора речи eSpeak была выпущена в 2006 году. С тех пор компания-разработчик постоянно выпускает все более усовершенствованные версии. Последняя версия была представлена в конце весны две тысячи тринадцатого года.
eSpeak можно установить под следующие операционные системы:
Microsoft Windows, Mac OS X, Linux, RISC OS
Возможна также компиляция кода для Windows Mobile, но делать ее придется самостоятельно.
А вот с мобильной ОС Android программа работает без проблем, хотя русские словари еще не до конца разработаны. Русскоязычных голосов много, можно выбрать на свой вкус.
Для разработчиков будет интересно узнать, что C++ код программы доступен в сети. Скачать программу, а также посмотреть ее код можно на
Festival — это целая система распознавания и синтеза речи, которая была разработана в эдинбургском университете.
Программы и все модули абсолютно бесплатно и распространяются по системе open source. Скачать их и ознакомиться с демо-версиями можно на официальномуниверситета Эдинбурга.
Русский голос представлен в одном варианте, но звучание довольно хорошее и ясное, без акцента и с правильной расстановкой ударений.
К сожалению, программа пока может быть установлена только в среде API, Linux. Также есть модуль для работы в Mac OS, но русский язык пока поддерживается не очень хорошо.
Стоит отметить, что любой из вышеприведённых синтезаторов отлично исполнен, но выбор программы индивидуален. Всё объясняется различным произношением голосов. Смею посоветовать второй вариант с голосом Милена. ОЧень выразительный голос, насыщенное звучание и приятная во всех смыслах интонация голоса!
К сожалению, в свое время я не получил никакого образования — закончил 9 классов и все. Поэтому мне не оставалось ничего, как найти работу без образования, и устроился таксистом. Сразу же мне понадобился
Тур по Украине
В последнее время, люди выезжая отдыхать в отпусках, стараются не просто полежать в комфортной гостинице, или на теплом песке, а как можно сильнее слиться с природой, ощутить ее дух и набраться ее
Где купить бленду для фотоаппарата
Я себе заказывал здесь бленду вот для фотоаппарата, заказывал бленду EW-60C для Canon EF-S 18-55mm f/3. 5-5. 6, материал у нее пластик,
Флажки на палочке Человек, получивший такой рекламный, информационный или агитационный флажок на палочке с вероятностью в 70% оставит его себе на память, что превращает обычный флажок с логотипом в эффективный рекламный
Промо жилет Промо накидки – это наиболее оптимальное решение для фирм и компаний, которые нуждаются в недорогой рекламной форме. Накидки могут применяться промоутерами и на рекламных выставках компании, и при рекламных
Флаги Что такое флаг, людям было известно достаточно давно. Императоры, военачальники, торговые объединения так или иначе использовали такую форму для собственной идентификации. Так что, говоря о том, что такое
Кредит за 15 минут – быстрые деньги Кредитование граждан в последнее время стало еще более привычным процессом. Согласитесь, что каких-то 15 лет назад кредиты не были в такой мере распространены в силу сложной экономической ситуации, которая
ГДЗ (Решебник) по Русскому Языку для 6 класса, ответы Учащиеся шестого класса уже имеют представление не только об учёбе и требованиям к ней в целом. У каждого есть любимые и нелюбимые предметы, есть те уроки на которые не хочется идти из-за личного отношения
ГДЗ (Решебник) по Русскому Языку для 4 класса, ответы Решебник и ГДЗ по русскому языку курса 4 класса смогут стать незаменимыми помощниками при выполнении любого домашнего задания. Больше нет необходимости листать учебники в поисках нужного правила, достаточно
Стол из искусственного камня Высококачественная, надежная, оригинальная и красивая мебель в наше время предлагается во многих вариантах и из различных материалов. Понятно, что каждому хочется иметь удобную и эстетичную мебель, которая
«Читатель»: лучший в мире синтезатор русской речи для iPhone и iPad
«Центр речевых технологий» (ЦРТ) выпустил новую версию своего мобильного iOS-приложения «Читатель», которое читает вслух любые загруженные на iPhone и iPad книги и документы. Программа делает это с помощью фирменной технологии синтеза речи.
Программа поддерживает текстовые документы форматов TXT, DOC и FB2 и совместима с iPhone, iPod touch и iPad под управлением операционной системы iOS 5.0 и выше. Примеры, как звучит синтезированный текст, можно найти на официальном сайте разработчиков.
Владельцы iPhone и iPad могут оценить новый дизайн «Читатель» 2 с улучшенной эргономикой и навигацией, возможностью работать со шрифтом, а также новыми голосами (2 мужских и 2 женских), которые теперь загружаются дополнительно.
«Фактически, приложение превращает любой текстовый документ в аудиокнигу, озвучивая ее разными голосами, — рассказали в ЦРТ. — Интернет для этого не нужен — перевод текста в речь производится на самом мобильном устройстве».
«Читатель» можно найти в App Store. По данным компании, за два года его скачали порядка 100 000 пользователей. Обновленное приложение поддерживает последнюю версию iOS. В ближайших планах ЦРТ — добавление поддержки некоторых других языков, а также увеличение функциональности.
Стоимость приложения, позволяющего при помощи синтеза речи озвучивать документы, составляет 33 рубля. Скачать «Читатель» можно из App Store по ссылке далее.
Скачать «Читатель» для iPhone, iPod touch и iPad [App Store]
Следите за новостями Apple в нашем Telegram-канале, а также в приложении MacDigger на iOS.
Присоединяйтесь к нам в Twitter, ВКонтакте, Facebook, Google+ или через RSS, чтобы быть в курсе последних новостей из мира Apple, Microsoft и Google.
Синтезаторы речи с русскими голосами. Лучший синтезатор речи. Как пользоваться синтезатором речи?
Сегодня синтезаторы речи, применяемые в стационарных компьютерных системах или мобильных устройствах, чем-то необычным уже не кажутся. Технологии шагнули далеко вперед и позволили воспроизвести человеческий голос. Как все это работает, где применяется, каков лучший речевой синтезатор и с какими потенциальными проблемами может столкнуться пользователь, смотрите ниже.
Что представляют собой речевые синтезаторы и где они применяются?
Синтезаторы речи представляют собой специальные программы, состоящие из нескольких модулей, которые позволяют переводить набранный на клавиатуре текст в обычную человеческую речь в виде звукового сопровождения.
Было бы наивно полагать, что сопутствующие библиотеки содержат абсолютно все слова или возможные фразы, записанные в студиях реальными людьми. Это просто физически невозможно. К тому же библиотеки фраз имели бы такой размер, что установить их даже на современные винчестеры большого объема, не говоря уже о мобильных девайсах, просто не представлялось бы возможным.
Для этого была разработана технология, получившая название Text-to-Speech (перевод текста в речь).
Наиболее широкое распространение синтезаторы речи получили в нескольких областях, к которым можно отнести самостоятельное изучение иностранных языков (программы нередко имеют поддержку в 50 языков и более), кода нужно услышать правильное произношение слова, прослушивание текстов книг вместо чтения, создание речевых и вокальных партий в музыке, использование их людьми с ограниченными возможностями, выдача поисковых запросов в виде озвученных слов и фраз и т. д.
В зависимости от области применения, все программы можно разделить на два основных типа: стандартные, непосредственно преобразующие текст в речь, и речевые или вокальные модули, применяемые в музыкальных приложениях.
Для более полного понимания картины рассмотрим оба класса, но больший упор будет сделан все-таки на синтезаторы речи в их непосредственном назначении.
Что же касается преимуществ и недостатков программ такого типа, сначала рассмотрим все-таки недостатки.
Прежде всего нужно четко понимать, что компьютер — он и есть компьютер, который на данном этапе развития человеческую речь может синтезировать весьма приблизительно. В простейших программах зачастую наблюдаются проблемы с постановкой ударений в словах, пониженное качество звука, а в мобильных устройствах – повышенное энергопотребление, а иногда и несанкционированная загрузка речевых модулей.
Но и преимуществ хватает, ведь очень многие звуковую информацию воспринимают гораздо лучше, нежели визуальную. Удобство восприятия налицо.
Теперь несколько слов об основных принципах использования программ такого типа. Установить синтезатор речи любого типа можно без особых проблем. В стационарных системах используется стандартный инсталлятор, где основной задачей станет выбор поддерживаемых языковых модулей. Для мобильных девайсов установочный файл можно скачать из официального магазина или хранилища вроде Google Play или AppStore, после чего приложение инсталлируется в автоматическом режиме.
Как правило, при первом запуске никаких настроек, кроме установки языка по умолчанию, производить не нужно. Правда, иногда программа может предложить выбрать качество звучания (в стандартном варианте, применяемом повсеместно, частота дискретизации 4410 Гц, глубина 16 бит и битрейт 128 кбит/с). В мобильных устройствах эти показатели ниже. Тем не менее за основу берется определенный голос. С использованием стандартного шаблона произношения путем применения фильтров и эквалайзеров достигается звучание именно такого тембра.
В использовании можно выбрать несколько вариантов перевода текста: ввод текста вручную, озвучивание уже имеющего текста из файла, интеграция в другие приложения (например, веб-браузеры) с активацией выдачи поисковых результатов или прочтения текстового содержимого на страницах онлайн. Достаточно выбрать нужный вариант действий, язык и голос, которым все это будет произноситься. Многие программы имеют несколько разновидностей голосов: как мужских, так и женских. Для активации процесса воспроизведения обычно используется кнопка старта.
Если говорить о том, как отключить синтезатор речи, тут может быть несколько вариантов. В самом простом случае используется кнопка остановки воспроизведения в самой программе. В случае интеграции в браузер деактивация производится в настройках расширений или полным удалением плагина. А вот с мобильными устройствами, несмотря на непосредственное отключение, могут быть проблемы, о которых будет сказано отдельно.
В музыкальных программах настройки и ввод текста намного сложнее. Например, в приложении FL Studio есть свой речевой модуль, в котором можно выбрать несколько типов голосов, изменить настройки тональности, скорости воспроизведения и т. д. Для постановки ударений перед слогом используется символ «_». Но и такой синтезатор годится только для создания роботизированных голосов.
Но вот пакет Vocaloid от Yamaha относится к программам профессионального типа. Технология Text-to-Speech здесь реализована в наиболее полном объеме. В настройках, помимо стандартных параметров, можно выставить артикуляцию, глиссандо, использовать библиотеки с вокалом профессиональных исполнителей, составлять слова и фразы, подгоняя их под ноты, и еще кучу всего. Неудивительно, что пакет только с одним вокалом занимает порядка 4 Гб и более в установочном дистрибутиве, а после распаковки — вдвое-втрое больше.
Синтезаторы речи с русскими голосами: краткий обзор самых популярных
Но вернемся к самым простым приложениям и рассмотрим самые популярные из них.
RHVoice – по мнению большинства экспертов, лучший синтезатор речи, являющийся российской разработкой авторства Ольги Яковлевой. В стандартном варианте доступно три голоса (Александр, Ирина, Елена). Настройки просты. А само приложение может использоваться и как самостоятельная программа, совместимая с SAPI5, и как экранный модуль.
Acapela – достаточно интересное приложение, главной особенностью которого является почти идеальная озвучка текста более чем на 30 языках мира. В обычной версии, правда, доступен только один голос (Алена).
Vocalizer – мощное приложение с женским голосом Milena. Очень часто эта программа применяется в call-центрах. Имеется множество настроек постановки ударения, громкости, скорости чтения и установки дополнительных словарей. Главное отличие состоит в том, что речевой движок может встраиваться в программы вроде Cool Reader, Moon+ Reader Pro или Full Screen Caller ID.
Festival – мощнейшая утилита синтеза и распознавания речи, созданная для систем Linux и Mac OS X. Приложение поставляется с открытым исходным кодом и, помимо стандартных языковых пакетов, имеет поддержку даже финского языка и хинди.
eSpeak – речевое приложение, поддерживающее более 50 языков. Главным недостатком считается сохранение файлов с синтезированной речью исключительно в формате WAV, который занимает уж очень много места. Зато программа является кроссплатформенной и может использоваться даже в мобильных системах.
При установке «родного» синтезатора речи от Google, пользователи постоянно жалуются на то, что он самопроизвольно включает загрузку дополнительных языковых модулей, что может не только занимать достаточно длительный промежуток времени, но еще и расходует трафик.
Избавиться от этого в Android-системах можно очень просто. Для этого используем меню настроек, далее переходим в раздел языка и голосового ввода, выбираем голосовой поиск и на параметре распознавания речи оффлайн нажимаем на крестик (отключение). Дополнительно рекомендуется почистить кэш приложений и перезагрузить устройство. Иногда может потребоваться в самом приложении отключить показ уведомлений.
Поводя некий итог, можно сказать, что в большинстве случаев рядовым пользователям подойдут самые простые программы. Во всех рейтингах лидирует RHVoice. Но для музыкантов, которые хотят добиться естественного звучания голоса, чтобы разница между живым вокалом и компьютерным синтезом не ощущалась на слух, лучше отдать предпочтение программам типа Vocaloid, тем более что для них выпускается множество дополнительных голосовых библиотек, а настройки имеют столько возможностей, что примитивные приложения, как говорится, и рядом не стояли.
Да, забавно, что тот синтез, который показывали по ТВ, и который на данный момент является лучшим для русского языка, вы нашли самым последним. )) В гугле, правда, он выдается только 12 результатом по запросу «Синтез речи» — то есть только на второй странице. Может это так затруднило поиск. ))
Правда, в открытой продаже его пока нет — только демка.
Возможно я не заметил этот сайт, при поиске, искал программы для синтеза речи, и нашёл последнего не через поисковик, а через форум о синтезе речи.
Вроде искал тщательно, много находил других синтезаторов, которые на мой взгляд не хуже последнего. Например Ivona.com, правда она не умеет говорить по русски.
Спасибо. Лучший обзор по синтезаторам речи :).
Молодец за оформление
На каком-то сайте прочитал, что голос Дмитрия должен поступить на прилавки в 20-х числах 2009 года, значит, он, где-то есть))) Только, где.
Да конечно есть, на официальном сайте можно подать заявку и купить лицензионную версию, я точно не знаю как её заказывают, но если для частного использования, должно быть продадут лишь ознакомительную версию. Но Дмитрий читает по-моему не лучше Алёны и Ольги, а Владимир вроде здесь лучший. Было бы здорово найти не он-лайн чтение, а полноценную программу синтеза от Vital Voice
Огромнийшое человеческое Благодарю.
Послушал Дмитрия ака онлайн читалку, всё равно слушать книжки через него невозможно, уж очень часто не к месту скачет интонация и вообще тональность разговора не к месту зачастую 🙂
А не подскажете работает ли еще демо-сервис VitalVoice? Никак не получается туда зайти
У меня vitalvoice недоступен, и они изменили адрес сайта для демо синтеза речи.
Теперь онлайн синтез речи Владимир находится здесь: , или можно прямо с сайта http://speechpro.ru/technologies пробовать.
Mitry, спасибо, а то я уж думал прикрыли этот сервис.
Да полная версия VItalvoice Мне б не помешала
очень нужен скрипт любого синтезатора речи для интеграции в блог.. помогите!!
Мне больше всего понравились Алёна, Ольга и Владимир
Алёну и Ольгу слушал на их сайтах а Владимира здесь:)
они все на одинаковом уровне читают, слабо
на слух алена хороша у катерины 2 косяков меньше но голос не айс
coolreade в помощь
Ещу продвинутый эх
«Из меня херовый диктор,но зато я работаю даже на калькуляторе»
Ё моё предупреждать хоть надо,а то я чуть не упал со тсула!)))
чтение новостей синтезом
http://vitalvoice.ru/VitalVoiceWeb/Default.aspx А это автоматическая озвучка сайтов , дают бесплатный доступ теперь озвучить сайт легко
И как эта озвучка сайтов работает? где нибудь можно посмотреть пример
Примеры скоро будут! По любым вопросам обращайтесь vitalvoice@speechpro.com
Было бы здорово если бы создали озвучу микроблогов, например твиттера или френдфида, плагин или что-то подобное, твиттеру просто необходима эта функция
Эти программы речевые вообще русский текст не читают? Я, честно говоря,плоховато понимаю как это всё нужно установить, кто хорошо знает как установить реч. синтезаторы и оболочки напишите пожалуйста.
Распакуй архив, который тут есть, там есть папка TTS в ней Ale0nka, установи обе программы и больше ничего не надо, заработает голос Алёны. Там встроенная оболочка.
Сложнее всех Локвендо установить, там нужно все по очереди устанавливать, потому что инструкция не правильно написана.
Подскажите, а есть ли голосовой синтезатор,чтоб на входе говорить в микрофон, а на выходе менять тон, пол, ну и вообще.
Интересующийся, чтобы изменить свой голос речевой синтезатор не нужен, это программы шутки смены голоса MorphVOX называется
У меня есть торренты на скачивание Ольги от компании Loquendo, Алены от Acapela Group. Кто заинтересовался пишите на markisspasha@mail.ru.
А у вас там питер из грифинов есть ли его голос?)
хоцца Vital Voice от ЦРТ, но даже ознакомительную версию не могу найти. у них походу все серьезно. если кто-то вдруг найдет, отпишите плз.
Спасибо за статью!
поставил Алену и немогу разобраться как заставить ее использовать свои словари ((
В ЛексиконМенеджере создаю новое слово, куда-то даже оно сохранилось. но в тексте все равно по старому произносит
SV, со словарями я не разбирался, может это зависит от оболочки через которую работаешь, лучше про это узнать на форуме о речевых движках.
Эти программы синтезаторы речи ведь идут на смартфоны NOKIА с осью 9.2 нашел в инете одну такую крякнутую прогу зовется sacrament txt reader ею и читаю книги формата fb2 и txt нужно только путь указать к папке где хранятся книги и еще одну talks and zoom беспонтовую и глючную эта может читать почти всё что на экране от названия папок до смс, голос Катерины супер но раздражает что постоянно она читает знаки препинания очень бесит, всё впечатление портится от чтения fb2 книг 🙁
Подcкажите, как наоборот из речи в текст перевести. Нашёл Горыныча (программа такая)3-й версии, так ни слова не смогла разобрать. Может я не разобрался. В общем там мне не понравилось.Сейчас есть5-я версия. А рельно работающие программы есть? Если есть где скачать или купить. Желательно на русском языке. Только не шлите эти платные архивы. Всё равно в них можно кота в мешок посадить. kiosaki@tut.by
Вышел новый синтезатор речи и новый русский голос. Высокое качество звука.
Размер 26 МБ. Распространяется бесплатно.
Читает русские и украинские тексты.
Заложены функции, чтобы создать свой голос.
Этот синтезатор речи можете скачать на сайте
http://beriinfo.narod.ru
Общаюсь с болгаркой с проблемой зрения, она жалуется что синтезатора болгарского языка нет, быть может кто поможет информацией. Я об этом ничего не знаю. Есть какие ссылки, я ей отошлю. мой мейл: kemenov55@mail.ru
Болгарских нет, только демо Irina у греков есть http://www.innoetics.com
забыли опенсорс движки ESPEAK — ДВИЖОК и голос русский RHVoice
Если можете, добавьте пожалуйста опрос типа рейтинг какая читалка популярней
Куда переехал онлайн синтез речи Владимира? Поделитесь ссылкой.
Огромное спасибо за архив!
Теперь Владимир от Центра речевых технологий доступен по новому адресу: http://api.voicefabric.ru/
Похоже Владимир теперь недоступен вообще, требует ключ API
Жмоты из ЦРТ не дают Владимира. Эх жмоты. Ну жмоты!
как мне скачять нармальный синтызатор я хачю сделоть песню
У вас на сайте swf-объект для прослушивания звука — то работает, то не работает. Постабильнее не нашли?
Владимир доступен, достаточно связаться с разработчиками по емайл, и договориться с ними лично.
Скачать эти синтезаторы, кроме Владимира ЦРТ, можно архивом за 10 марта 2011 года, он доступен.
swf-объект был на сайте podfm, поэтому так плохо работал, теперь меня там заблокировали, спасибо что напомнили об этом, теперь загрузил на другой сервер.
Слышал, что читать одним голосом уже не модно и что где-то на торренте есть такая программа. Если кто знает поделитесь.
Можно ли использовать синтезатор речи Владимир ЦРТ в читалке электронных книг ICEReaderRus для создания МР3 книг?
По мне так для чтения книг самое удобное пока является Дигало Николай. Конеччно у него есть достаточно косяков, но по сравнению с Катериной он лучше! Слушаю книги через Макс Ридер. А вот для работы за компом и в инете Катерина на мой вшзгляд лучший синтезатор. Да, уточню, я неззрячий.
Всем доброго дня! На мой взгляд, для чтения книг пока что лучшим синтезатором является Дигало Николай под Макс Ридер. А вот для работы за компом, по мне так Катерины нет. Может я просто настолько привык к ним, особо не пробовал другие синтезаторы. Да, для уточнения, я нехзрячий.
golos кажется лучший из всех
Где можно самому поюзать этого хвалёного владимира. Нигде не вижу демо сервиса — только рекламу.
улётно то что мне нужно)))))))))))))))))))
Есть ли программа Экранный диктор для Windows XP на русском языке?
Здорово. Спасибо. Но как все же сделать так, что комп научился со мной разговаривать. Звучит дико, но иногда ценный и нужный совет хочется услышать, особенно когда пишешь курсовую или диплом.
где бы Дми3я скачать? может уже доступен где-нибудь?
Привет. Я все же решил здесь отписаться, т.к. темой речевых движков на уровне пользователя занимаюсь давно и она мне очень близка, особенно сейчас, когда я решил озвучивать свои лекции. Первое о чем хотел сказать. Арив, что здесь лежит неполный и как вы все с него поставили звуковой движок Ольга мне просто неведомо. В нем нет самого главного — самого голоса Ольги, папка содержит только мануал и пару текстовых файлов, а установщика нет.
Второе — общее наблюдение для всех проектов. Есть явная разница между тем что дается для примера на сайте и тем, что получишь в итоге. Например, в примере Ольга произношение нормальное, но когда его подключаешь, то лишаешься возможности вставлять теги эмоций — смех, кокетство и т.д., плюс к этому — звучит он очень, очень сильно хуже, чем образцы с примеров. Возможно, что программы реально влияют на возможности языка, хотя по логике все должно было бы содержаться в самом движке голоса вместе с образцами сэмплов, но в любом случае Ольга проигрывает ЦРТ. А всвязи с этим мало вероятно, что Дмитрий будет хорошим голосом, проблемы будут те же.
Третье — тоже общее наблюдение. Голоса очень сильно связаны со словарями. Но . Здесь надо делать отступление. Потерпите. Программы в последнее время стали проектировать немного по особому. Во-первых, разработчики отвязывают от кряка свои продукты за счет реализации части модулей на своем сайте, они больше не выпускают программы как олд-скулл, т.е оффлайном. Во-вторых, разработчики реализуют все чаще и чаще системы искуственного интелекта в программах, которые решают задачи по угадыванию, предсказанию чего либо, либо обучению разбора чего-либо. Последний вариант — самый правильный для задач произношения, это показывают всякие тесты и конкурсы, соревнования. Вот. И исходя из этого я считаю, что ЦРТ не сломают, а если и сломают, то это не даст результата. Его словари, его разбор предложений самообучаем и поддерживается разработчиком на сайте, поэтому у него и произношение лучше.
Четвертое, в связи с вышеперечисленным можно сделать вывод — к сожалению только речевой движок от Центра речевых технологий является приемлемым вариантом, для более менее качественного озвучивания русского текста в комерчесских или серьезных проектах. И дело не в том, что он просто лучше произносит слова и обладает тембром, способствующим пониманию текста, дело в неуловимых мелочах, которые иногда даже не заметишь. Ну, например, в него, как было сказано ранее, заложен хороший разбор предложния — он интонационно выделяет слова, ставя смысловые ударения в предложениях. Например, фраза «Для того, чтобы понять как защищать, необходимо знать что защищать» движком ЦРТ разобралась как надо, и ни один другой с этой задачей не справился. ЦРТ, если прислушаться вначале предложения ставит какое-то причмокивание или облизывание губ и перевод дыхания между предложениями — вздох :))) Вроде бы смешно, но это создает гармонию произношения, очеловечивает речь робота.
komu interesno v iphone est prilojenie
«ispeak russian»
tam golos aleni v offline
ili proga «speak it!» tam mojno dokupit alionu
prilojenie
«chitatel» tam golos vrode vladimira ot «vital voice»
toje v offline
ka4estvo v obeih progah zanijenno nemnogo
Может кто подскажет как записать в аудиофайл то что говорит синтезатор, конкретно Nuance — Vocalizer 5? Мне нужен тайский язык, а он есть только здесь.
записать Wav можно средствами самой винды. на примере ВинХР — включите запись (Стандартные — развлечения — звукозапись), убедитесь в настройках звука что включен канал LineIn а потом запустите онлайн-речь. и получите файл записи звука с этого сайта
Пока прочитал, чуть не лопнул от смеха! Я слепой, и уже давно созданы программы для незрячих, которые читают электронный текст, применяя различные синтезаторы. Эти программы называются «Программы экранного доступа»! Jaws и NVDA.
Оставить комментарий