WWWの次の世界

20世紀は、メディアを発見する時代だった。

1911年生まれのマクルーハンは、20世紀中盤にメディア論を唱え、それまで人類が無自覚的に使ってきたあらゆる「道具」をメディアとして再定義することで全地球規模の「村」、グローバルヴィレッジを構想した。この思想に刺激を受けてグラフィカルユーザーインターフェース(GUI)が発明され、インターネットという全地球規模の「村」が出現した。

マクルーハンの思想に強く影響を受けたアラン・ケイは、自らの夢想した新しい機械を「パーソナル・ダイナミック・メディア」と呼んだ。
この思想は後に、「パーソナルコンピュータ」として知られるようになる。

今日、我々が毎年のようにiPhoneの新製品に一喜一憂するのは、こうしたメディア論の裏付けがあるからに他ならない。
マクルーハンの時代には当然、パーソナルコンピュータなどというものは存在しなかった。

しかし、マクルーハンは、ラジオからテレビへとメディアの中心が変化する時代の中心にいた。
あるメディアが衰退し、別のメディアが台頭してくる現象を分析するためのツールとして、マクルーハンはテトラッドと呼ばれる図を用いた。

商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース

音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。

これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由して対話できるようにするといったことも可能になるのです。ややシステム寄りの話で、その意義がよく理解できない……という人も少なくないと思うので、仕掛け人であるITAコーパスのプロジェクト責任者であり、SSS合同会社の小田恭央さんにオンラインインタビューするとともに、システムを開発したヒロシバさんにもメールインタビューすることができたので、その内容を紹介していきたいと思います。

スマートホームでできること : Amazon Alexa

Alexaとスマートホーム対応製品を組み合わせて家電をスマート化すると、「アレクサ、〇〇して」と話しかけるだけでハンズフリーで家電の操作が可能になります。
たとえば、ソファーから動かずに声でテレビの操作ができたり、子育てで両手がふさがっているときに声でエアコンの操作ができたりと、いつもの生活がより快適になります。

今お使いのテレビやエアコンなど、赤外線対応リモコン(一般的なリモコン)で操作している家電は、仲介させるスマートリモコンを使うと、ON/OFFや温度調節、チャンネル変更などが声でコントロールできるようになります。家電を買い替える必要はありません。

リモコンが付いていない扇風機やシンプルなスイッチのみのフロアスタンドは、スマートプラグ を使うと声でON/OFFができるようになります。

無料で使えるAI音声合成サービス「CoeFont STUDIO」

株式会社Yellstonは4月23日、人工知能(AI)を活用するWeb音声合成サービス「CoeFont STUDIO(コエフォントスタジオ)」を期間限定で無料公開した。無料提供の終了時期は未定という。

本サービスでは、AIにおけるディープラーニング(深層学習)を活用することで、人間の声を再現してWeb上で音声合成ができる。Web上でアクセント調整やスピード調整などの機能を利用し、作成した音声はダウンロード可能だ。本サービスおよび出力した音声データは営利・非営利問わず自由に利用できる。

本サービスでは「アリアル」と「ミリアル」がユーザーの入力した言葉を話してくれる。両キャラクターはともにイラストレーターの凪白みと氏がキャラクターデザインを手がけた。「アリアル」は芯の通った声質、「ミリアル」は透き通った声質が特徴という。

Lyra – enabling voice calls for the next billion users

Google Open Source Blog: The past year has shown just how vital online communication is to our lives. Never before has it been more important to clearly understand one another online, regardless of where you are and whatever network conditions are available. That’s why in February we introduced Lyra: a revolutionary new audio codec using machine learning to produce high-quality voice calls.

As part of our efforts to make the best codecs universally available, we are open sourcing Lyra, allowing other developers to power their communications apps and take Lyra in powerful new directions. This release provides the tools needed for developers to encode and decode audio with Lyra, optimized for the 64-bit ARM android platform, with development on Linux. We hope to expand this codebase and develop improvements and support for additional platforms in tandem with the community.