Syntetizátory hlasu

V současné době, kdy Internet hledá možnosti vývoje ve směru k multimédiím, se stále více uplatňují podcasty, ilustrační videa, propojení webů s externími službami a podobně. Mezi jednu z možností jak oživit příspěvky v blogu nebo články v magazínu patří právě přidávání podcastů. Jde prakticky o mluvenou verzi článku. Někteří autoři článek namluví sami, jiní využijí automatické čtečky, která text převede do zvukové podoby sama.

Pro angličtinu nebo například polštinu existují již čtečky poměrně kvalitní. Nejlepší česká čtečka, se kterou jsem se při hledání na netu setkal, je produktem Akademie věd České republiky a zmiňuji ji až v závěru.

Na eMagu (http://www.emag.cz/pet-nastroju-pro-prevod-textu-do-mluveneho-slova/) vyšel článek popisující některé online nástroje umožňující převody textu na řeč – hlasové syntetizátory. Podíval jsem se po zdrojích, které článek popisuje a zde je výčet adres na kterých se nacházejí:

Seznam hlasových čteček

Produkty podrobněji

VozMe se zaměřuje na web, umožňuje stažení zvuku do mp3 a nabízí 3 jazyky. Lze jej použít i jako gadget nebo modul do WordPressu – přímo ke stažení.

Espressivo od IvoSoftware nabízí 3 jazyky se 4 mluvčími, pro češtinu je využitelná polština. S úspěchem jsem použil obě polské verze. Výhodné je psát místo V – W, použít spřežky (cz, sz, …), místo I psát Y a pak už se výslovnost češtině podobá. Samozřejmě to ještě není 100% ono, ale je to lepší, než použít čtečku anglickou.

Cepstral je služba, která nabízí 6 jazyků (z čehož počítám dva jako anglickou a americkou angličtinu) a navíc ještě zvláštní hlasy – šepot, štěkání a podobně. Na češtinu to asi použitelné není, ale své uplatnění našli například v přednesu informací o počasí. Nabízejí větší množství nastavení, než předchozí služby, podporu pro čtení webových stránek a možnosti stažení a vytváření vlastních hlasů.

Společnost Ivo Software kromě stránek Espressivo uvádí demo verzi svého hlasového syntetizátoru i na svých stránkách. Prakticky se ale jedná o tentýž produkt. Umí anglicky, polsky a rumunsky. Délka vstupu je omezena na 200 znaků a Ivo Software uvádí, že se IVONA používá ke čtení polské verze Wikipedie.

Plzeňská společnost SpeachTech představuje online ukázku svého software Eris TTS s možnostmi použití 4 hlasů pro češtinu a různými nastaveními.

Epos Speech Synthesis System je perlička na závěr – jde o projekt Ústavu fotoniky a elektroniky Akademie věd České republiky a jedná se o unikátní systém. Ke stažení je i na sourceforge.net. Doporučuji vyzkoušet.