商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース

Emotional, Burning, Unlimited Tuned Laboratory

音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。

これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由して対話できるようにするといったことも可能になるのです。ややシステム寄りの話で、その意義がよく理解できない……という人も少なくないと思うので、仕掛け人であるITAコーパスのプロジェクト責任者であり、SSS合同会社の小田恭央さんにオンラインインタビューするとともに、システムを開発したヒロシバさんにもメールインタビューすることができたので、その内容を紹介していきたいと思います。