TerxtToSpeachのどれが使えるか調査

2020年10月16日

テクノロジー

eyecatch 会話の話し相手にロボットでもいいかなと思い始めた、ユゲタです。 よくアレクサと話をしていますが、感情が入っていない話し方に慣れると、コミュニケーションが取れてる感じがしますが、他人が見たら怖いでしょうねwww podcastで使えるTextToSpeachを探していたら、世の中にはwebブラウザで簡単にmp3をダウンロードさせてくれるサービスがあるんですね。 今回はそうしたサービスの使い勝手を調査してみたいと思います。 調査ポイントは、
1. Language : 日本語での利用 2. mp3 : mp3でダウンロードできるかどうか 3. Terms : 利用規約(無料で利用できるか) 4. Voice : voiceの種類 5. Options : ピッチなどの機能がついているか? 6. Limit : テキスト文字数の制限
3番まではマスト項目という事で、これを基準に調べてみます。

Verby

https://verby.co/
1. Language : 日本語利用可 2. mp3 : mp3でダウンロード可 3. Terms : 商用利用の場合にプレミアム会員登録が必要、個人利用は無料で利用できる 4. Voice : FemaleとMaleの2種類 5. Options : 無(ログインすると、SSMLエディタ機能あり) 6. limit : 記述が見当たりません
アカウントを作ってログインすると、SSMLエディタというのが使えるけど、日本語ではあまり変化を感じられないので意味ないかも・・・ かなり自然な読み上げ精度です。 ロボット感はあまり無いですね。 でも単語解釈が若干甘い感じがあります。 「webエンジニア」を「ダブルイービーエンジニア」と読まれてしまいます。

TTSMP3.com

https://ttsmp3.com/
1. Language : 日本語利用可 2. mp3 : mp3でダウンロード可 3. Terms : 有償販売をしているが、無料変換の利用範囲は書かれていませんでした。 4. Voice : TakumiとMizukiの2種類 5. Options : SSML 6. Limit : 3000文字/日
若干ロボット感が残る感じですが、単語認識は、verbyよりはいい感じです。 この辺はカタカナで書いて対応できるので、やはりボイス品質のいいverbyの方が良いかな〜。 そして、このサービスもSSML機能が手書きで使えます。

TTSREADER

https://ttsreader.com/
1. Language : 日本語利用可 2. mp3 : 無 3. Terms : 利用規約に金額記載などは無し 4. Voice : G** , KYOKO , OTOYAの3種類 5. Options : ピッチの切り替え機能がある 6. Limit : 記載無し
macで使えるkyokoとotoyaがそのままブラウザで使えます。 読み上げ時にテキストにハイライトをリアルタイム連動してくれる機能は、とても便利です。 でも、mp3ダウンロードが見当たらなかったので、正直実用には、本サービスを利用するしかなさそうですね。

wideo

https://wideo.co/text-to-speech/
1. Language : 日本語利用可 2. mp3 : 有 3. Terms : 文字数制限内であれば、無償利用可能 4. Voice : 3種類 5. Options : speed切り替え機能 6. Limit : 2000文字/日
ロボット感が満載ですが、一般的なTTSレベルですね。 speedを変更すると、ますますロボット感が増しますwww

ttsdemo

https://ttsdemo.com/
1. Language : 日本語利用可 2. mp3 : 無 3. Terms : 不明 4. Voice : 10種類 5. Options : Effect機能が10種類ほどあります。 6. Limit : 無
かなりスムーズなスピーチができます。 画面に表示されているキャラクターがクチパクで喋ってくれて、会話感が増す製品です。 ただ、mp3ダウンロードが無いので、このデモ画面でしか使えないですね。 term画面も探すのが大変のUIでした。

ReadSpeaker

https://www.readspeaker.com/
1. Language : 日本語利用可 2. mp3 : 無 3. Terms : 商用利用のみ 4. Voice : 7種類 5. Options : 無 6. Limit : 無
独自でスムーズなスピーチ機能ですが、mp3ダウンロードが無いので、正直使えません。 サービス契約すると、webページのガジェットとして、読みあげ機能がホームページに搭載できるようです。 利用規約ページなどにあると、便利(なのかな?)かもしれませんね。

Woord

https://www.getwoord.com/
1. Language : 日本語利用可 2. mp3 : 有 3. Terms : 無料版は個人利用はできるが、商用、公開はNG 4. Voice : 1種類(premiumにすると2種類) 5. Options : 無 6. Limit : 1000/日(アカウントを作ると5000文字までアップ)
種類も少なく簡易なTTSですが、規約制限により、Poscastでの利用はできないっぽいです。 5000文字は魅力だったんですが・・・

Google cloud Text-to-Speech

https://cloud.google.com/text-to-speech?hl=ja
1. Language : 日本語利用可 2. mp3 : 無 3. Terms : Google 4. Voice : 4種類 5. Options : SSML 6. Limit : 100万文字まで無料/月
アプリなどの組み込み用で使う用ですね。 podcastで使うmp3ダウンロードは、工夫をしたらできそうですが、少しめんどくさいので、スルーします。

まとめ

どのサービスも、当たり前ですが、有償サービスのためのサンプル画面でのテストだったのですが、 組み込みを意識するために、mp3ダウンロードを付けていないものは、スピーチ精度も独自でいい感じなのですが、それ以外は、恐らくフリーライブラリを利用しただけの製品のようです。 でも、ブラウザでテキストを簡単にmp3に変換できるのは、かなり利用価値がありますけどね。 場面によって、サービスを使い分けると、リミットも気にならないかもしれませんね。 とりあえず、podcastで使う方向で検討してみました。

このブログを検索

ごあいさつ

このWebサイトは、独自思考で我が道を行くユゲタの少し尖った思考のTechブログです。 毎日興味がどんどん切り替わるので、テーマはマルチになっています。 もしかしたらアイデアに困っている人の助けになるかもしれません。