Вы читаете avva

Колесо вращается быстрей - текст в речь [entries|archive|friends|userinfo]
Anatoly Vorobey

[ website | Website ]
[ userinfo | livejournal userinfo ]
[ archive | journal archive ]

Links
[Links:| English-language weblog ]

текст в речь [июл. 3, 2010|09:39 pm]
Previous Entry Поделиться Next Entry
http://www.acapela-group.com/text-to-speech-interactive-demo.html

В этом демо можно выбрать русский голос (Алена), и скопировать туда небольшой текст, чтобы она его произнесла. Скажите, меня глючит, или качество для компьютерного голоса очень и очень высокое? Я поражен, если честно. Английские и французские голоса тоже потрясающе звучат, но русский меня прямо-таки выбил из колеи.

Если есть среди читающих это люди "в теме" - подскажите, эта фирма лучше всех, state of the art? Или ничего особенного, и так хорошо генерировать голос уже многие умеют?
СсылкаОтветить

Comments:
Страница 1 из 2
<<[1] [2] >>
[User Picture]From: xxqs
2010-07-03 06:43 pm none (UTC)

(Link)

у меня трёхлетней давности TomTom-навигатор синтезирует слова на английском вполне прилично. Названия городов почти не врёт.
[User Picture]From: xxqs
2010-07-03 06:44 pm none (UTC)

(Link)

на названия швейцарских улиц ему мощности не хватает - заканчивает произносить, когда поворот уже пройден
[User Picture]From: _nik_
2010-07-03 06:49 pm none (UTC)

(Link)

Довольно неплохо говорит, да. Немного с ударениями ошибается, но так у всех.
А вот когда же её портируют под android, чтобы мне мой телефон книжки голосом читал? (windows mobile телефон уже несколько лет как книжки голосом читать умеет, а вот новый google nexus one ещё не научился).
From: valen00k
2010-07-03 06:50 pm none (UTC)

(Link)

Испытанием "Эйяфьятлайокудль"ем не выдержала, но в целом впечатляет.
[User Picture]From: gambo
2010-07-03 07:14 pm none (UTC)

(Link)

это как раз показатель правильного синтезатора- его и люди не выдерживают
[User Picture]From: niobium0
2010-07-03 06:53 pm none (UTC)

(Link)

замечательно работает! забавные ошибки начинаются, если кормить синтезатор стихами: все же интонирование заточено под разговорную речь.
[User Picture]From: spamsink
2010-07-03 06:58 pm none (UTC)

(Link)

Скороговорками ее хорошо кормить.
[User Picture]From: ezhik_israely
2010-07-03 06:54 pm none (UTC)

(Link)

я не знаю про другие фирмы, но мне мои "слушающие" друзья советовали именно эту фирму, с этой "Аленой" как один из лучших (приятный на слух) вариантов озвучки текстов.

"Алена" прочитала это пост с ударением "глючИт" :)
[User Picture]From: incogn1too
2010-07-03 06:54 pm none (UTC)

(Link)

Хорошо постарались. Когда последний раз интересовался синтезом голоса - дела обстояли гораздо хуже.
[User Picture]From: malfet_
2010-07-03 06:54 pm none (UTC)

(Link)

С той поры, как отказались от дифонов и начали использовать Марковские цепи качество синтеза речи сильно повысилось. Если интересно - вот здесь есть небольшая подборка статей по теме.
[User Picture]From: egorfine
2010-07-03 07:42 pm none (UTC)

(Link)

ухты! цепи маркова для синтеза речи. Это гениально.
[User Picture]From: spamsink
2010-07-03 06:57 pm none (UTC)

(Link)

"Полили ли лилии?" - очень плохо, и дело не только в ударении в слове "полили".

"На дворе трава. На траве дрова?" - повествовательная и вопросительная интонация не отличаются.

Так что
[User Picture]From: tlkh
2010-07-03 08:37 pm none (UTC)

(Link)

Отличаются, но не всегда заметно.
Попробуйте "И это вопрос" с и без знака.
[User Picture]From: zhilyaev_v
2010-07-03 07:06 pm none (UTC)

(Link)

Отличная программа.
[User Picture]From: imfromjasenevo
2010-07-03 07:08 pm none (UTC)

(Link)

класс, поймал на зммеееде, длиношеее
тоже не может взять
[User Picture]From: ghooky
2010-07-07 11:07 am none (UTC)

(Link)

с двумя "н" все-таки лучше получается
[User Picture]From: klonkaktusa
2010-07-03 07:08 pm none (UTC)

(Link)

"Р" плохо выговаривает.
[User Picture]From: anita43765
2010-07-03 07:10 pm none (UTC)

(Link)

ааа, офигенно говорит! огрехи есть, конечно, но у кого их нет.
From: the_netwalker
2010-07-03 07:23 pm none (UTC)

(Link)

По сравнению с тем малым, что я слышал - говорит прекрасно.
Однако, на удивление "Алена" споткнулась на простейшем:
"Няка", получилось почему-то "никА".
[User Picture]From: raydac
2010-07-03 07:24 pm none (UTC)

(Link)

[User Picture]From: gruimed
2010-07-03 07:27 pm none (UTC)

(Link)

У Алены смешной акцент на английском
[User Picture]From: gaal
2010-07-03 07:30 pm none (UTC)

(Link)

Some of the English ones suck too. But some got me floored.
[User Picture]From: baramin
2010-07-03 07:31 pm none (UTC)

(Link)

Я был сильно в теме TTS/ASR по состоянию на 2006 год (SmartphonePro).
Эти парни неплохи, но Real Speaker от разорившейся Lernout&Hauspie звучал лучше (не путать с их же базовым TTS). Их разорение нанесло колоссальный вред индустрии - до того момента они подобрали под себя все приличные начинания. Real Speaker стоил, как живой слон и грузил CPU не хуже ASR, но сгенерированные им сообщения кране мало отличались от дикторских.
Инженеры из L&H И MS соглашались в одном - сделать TTS начального уровня значительно проще, чем ASR командного языка (ограниченной грамматики) "того же" уровня. Сделать приличный TTS, слабо отличающийся от человеческого, сравнимо со свободным распознаванием речи. Чудовищное количество исключений, аббревиатур, дат и числительных.
Вообще как-то все в ступоре. От соответствующего подразделения MS я года 3 ничего не слышал - после SAPI 5.1 они так ничего и не совершили. А была очень сильная команда.
О Dragon Dictation тоже как-то не слышно особо.
[User Picture]From: egorfine
2010-07-03 07:43 pm none (UTC)

(Link)

"Их разорение нанесло колоссальный вред индустрии"

а разве их патенты кто-то не подгреб с тем чтобы потом полицензировать желающим? Это же интеллектуальная собственность компании.
[User Picture]From: annie_celeblas
2010-07-03 07:32 pm none (UTC)

(Link)

Очень неплохо, особенно prosody, с ударениями тоже справляется (а это очень нетривиально). У нас не так хорошо получается. ;-)
Хотя я про эту фирму даже не слышала. В принципе, хорошей считается Nuance.
[User Picture]From: mikhailian
2010-07-03 09:17 pm none (UTC)

(Link)

Хочу уточнить, Nuance — это в данном случае бывший Lernout & Hauspie, разработчик RealSpeak.
[User Picture]From: sorcino
2010-07-03 07:36 pm none (UTC)

(Link)

Итальянский мужчина тоже звучит неплохо, интонация просто блестящая.
[User Picture]From: mme_n_b
2010-07-03 07:41 pm none (UTC)

(Link)

Очень здорово. Ударения глючат, и все голоса слишком торопятся, но тем не менее качество восхищает.
[User Picture]From: mikhailian
2010-07-03 09:26 pm none (UTC)

(Link)

У современных TTS скорость речи сложно менять в широких пределах, поэтому уже на этапе сбора материала диктор старается говорить быстро. Это всё потому, что люди с расстройствами зрения предпочитают быструю речь.
[User Picture]From: lxe
2010-07-03 07:44 pm none (UTC)

(Link)

Сравнивая связную речь и произвольный набор слогов ("глокую куздру"), быстро приходишь к предположению, что честный синтез подкреплен словарем.
Можно попробовать оценить размер словаря на специализированных текстах, на естественнонаучной лексике какой-нибудь.
[User Picture]From: klonkaktusa
2010-07-03 07:54 pm none (UTC)

(Link)

+1 одни слова хорошо, другие хуже.
[User Picture]From: lordakryl
2010-07-03 08:01 pm none (UTC)

(Link)

По-моему, она (девушка-диктор) использует для всех слов двойные и тройные ударения, то есть "на всякий случай" большинство слогов - ударные.
[User Picture]From: status_constr
2010-07-03 09:25 pm none (UTC)

(Link)

Не совсем --- попробуйте "Бостон Жмеринки не кучерявей" :)
[User Picture]From: mi_b
2010-07-03 08:04 pm none (UTC)

(Link)

сложноподчиненные предложения интонирует совсем плохо. Типа

По всей видимости, адмирал Чичагов, считая как шведских, так и русских моряков не слишком опытными и искусными в управлении своими кораблями, полагал, что преимущество в бою будет на стороне стоящих.
From: (Anonymous)
2010-07-03 08:14 pm none (UTC)

(Link)

Да, с обработкой запятых у них не очень.
Напимер "По всей видимости, нам, бля пиздец." призосится хорошо, а "По всей видимости, нам, бля, пиздец." - уже совсем неправильно.
[User Picture]From: dimorlus
2010-07-03 08:13 pm none (UTC)

(Link)

Да ладно, первый же естественно пришедший в голову тест - "иди на хуй!" она произносит не правильно.
[User Picture]From: ygam
2010-07-04 12:57 am none (UTC)

(Link)

"Ющ - пидарас! Ющ - пидарас! С нами Севастополь, Харьков, Донбасс" - все правильно, кроме "Харьков".
From: (Anonymous)
2010-07-03 08:19 pm none (UTC)

(Link)

Я синтезаторы тестирую на «Серпуховских» Лейбова (http://unclear.rinet.ru/~r_l/serp/), веришь, нет? Алёна неплохо справляется, хотя где ударение в слове «Серпухов», ей неизвестно.
[User Picture]From: avva
2010-07-03 08:23 pm none (UTC)

(Link)

Ух ты, отличная идея для тестирования, да.
Страница 1 из 2
<<[1] [2] >>