Next Voice – EBUT Laboratory https://ebutlab.com Emotional, Burning, Unlimited Tuned Laboratory Sun, 19 Feb 2023 10:41:55 +0000 ja hourly 1 https://wordpress.org/?v=6.8.2 https://ebutlab.com/wp-content/uploads/2016/01/cropped-logo-2x-100x100.png Next Voice – EBUT Laboratory https://ebutlab.com 32 32 179778457 Apple brings AI narration to audiobooks https://ebutlab.com/blog/2023/01/08/apple-brings-ai-narration-to-audiobooks/ Sun, 08 Jan 2023 01:09:27 +0000 https://twitter.com/hckojima/status/1611892805840015360 Apple Inc. has made audiobooks narrated by a text-to-speech artificial intelligence algorithm available through Apple Books.

The digital narration feature, as it’s called, is designed to make audiobooks more accessible by reducing the complexity and costs of creating them. The current model for audiobook production generally involves authors either narrating their own books, or hiring someone to do it for them.

It’s a costly process that can take weeks to perform. AI-powered narrators on the other hand are essentially free, and make it much more affordable for smaller publishers and lesser-known authors to create audio versions of their books.

]]>
21463
大切な人と一緒に楽しいホリデーシーズンを過ごそう https://ebutlab.com/blog/2022/12/15/%e5%a4%a7%e5%88%87%e3%81%aa%e4%ba%ba%e3%81%a8%e4%b8%80%e7%b7%92%e3%81%ab%e6%a5%bd%e3%81%97%e3%81%84%e3%83%9b%e3%83%aa%e3%83%87%e3%83%bc%e3%82%b7%e3%83%bc%e3%82%ba%e3%83%b3%e3%82%92%e9%81%8e%e3%81%94/ Wed, 14 Dec 2022 23:57:35 +0000 https://ebutlab.com/?p=21385 続きを読む]]>

プランニングから作品選びまで、Google が映画パーティのお手伝い

「OK Google」 と言ってはじめよう

忙しい年末こそ息抜きを忘れずに「ムービーナイトをカレンダーに追加

思い立った時に音声で操作。買い忘れを防げます「 ショッピングリストにポップコーンを追加
音声操作で映画館の雰囲気に早変わり「リビングの電気を消して
その日の気分にぴったりの作品を見つけよう「 おすすめのクリスマス映画

]]>
21385
Amazon shows off Alexa feature that mimics the voices of your dead relatives https://ebutlab.com/blog/2022/06/28/amazon-shows-off-alexa-feature-that-mimics-the-voices-of-your-dead-relatives/ Tue, 28 Jun 2022 04:19:30 +0000 https://twitter.com/hckojima/status/1541637391223783424 “Hey Alexa, that’s weird as hell”

Amazon has revealed an experimental Alexa feature that allows the AI assistant to mimic the voices of users’ dead relatives.

The company demoed the feature at its annual MARS conference, showing a video in which a child asks Alexa to read a bedtime story in the voice of his dead grandmother.

“As you saw in this experience, instead of Alexa’s voice reading the book, it’s the kid’s grandma’s voice,” said Rohit Prasad, Amazon’s head scientist for Alexa AI. Prasad introduced the clip by saying that adding “human attributes” to AI systems was increasingly important “in these times of the ongoing pandemic, when so many of us have lost someone we love.”

]]>
20743
デンソーテン:音響信号から振動信号をリアルタイムで自動生成する技術を開発 https://ebutlab.com/blog/2022/06/03/%e3%83%87%e3%83%b3%e3%82%bd%e3%83%bc%e3%83%86%e3%83%b3%ef%bc%9a%e9%9f%b3%e9%9f%bf%e4%bf%a1%e5%8f%b7%e3%81%8b%e3%82%89%e6%8c%af%e5%8b%95%e4%bf%a1%e5%8f%b7%e3%82%92%e3%83%aa%e3%82%a2%e3%83%ab%e3%82%bf/ Fri, 03 Jun 2022 01:35:56 +0000 https://twitter.com/hckojima/status/1532536530212102145 デンソーテンは、映像・音響信号を含む3Dオブジェクトデータをもとに振動効果を与える場面・タイミングを自動で検出し、その場面の音響信号から、音響信号と連動した振動信号をリアルタイムで自動生成する技術を開発した。自動車の車内のユーザーインターフェース(UI)として、椅子やシートの振動による触覚の活用を見込んでいます。

従来、椅子やシートを振動させるためには、あらかじめ振動信号を準備する必要があり、その時々に応じてリアルタイムに振動信号を生成するのが困難だった。今回、本技術を搭載したソフトモジュールに映像・音響信号を含む3Dオブジェクトデータを通すことで、振動効果を与える場面・タイミングの検出と振動信号生成までを自動でリアルタイムに行えるようになる。座面や背もたれなどに組み込まれた複数の振動デバイスをリアルタイムに個別に制御することで、振動を活用した情報提示が可能となり、従来の視覚・聴覚だけでなく、触覚を利用して直感的な状況判断につながり、安心・安全に貢献する。例えば、車両に搭載したカメラやマイクから得た3Dオブジェクトデータをもとに、周囲の車両等が自車に接近した際の接近感覚を振動によって知らせたり、ナビゲーションとの連携により右左折等の進路指示を振動の方向感で提示するなどが可能。また、運転シミュレータに本技術を組み込むことで、より現実感のある疑似的な運転体験なども可能となる。

]]>
20615
WWWの次の世界 https://ebutlab.com/blog/2021/09/20/www%e3%81%ae%e6%ac%a1%e3%81%ae%e4%b8%96%e7%95%8c/ Mon, 20 Sep 2021 11:41:09 +0000 https://twitter.com/hckojima/status/1439917541971808265 20世紀は、メディアを発見する時代だった。

1911年生まれのマクルーハンは、20世紀中盤にメディア論を唱え、それまで人類が無自覚的に使ってきたあらゆる「道具」をメディアとして再定義することで全地球規模の「村」、グローバルヴィレッジを構想した。この思想に刺激を受けてグラフィカルユーザーインターフェース(GUI)が発明され、インターネットという全地球規模の「村」が出現した。

マクルーハンの思想に強く影響を受けたアラン・ケイは、自らの夢想した新しい機械を「パーソナル・ダイナミック・メディア」と呼んだ。
この思想は後に、「パーソナルコンピュータ」として知られるようになる。

今日、我々が毎年のようにiPhoneの新製品に一喜一憂するのは、こうしたメディア論の裏付けがあるからに他ならない。
マクルーハンの時代には当然、パーソナルコンピュータなどというものは存在しなかった。

しかし、マクルーハンは、ラジオからテレビへとメディアの中心が変化する時代の中心にいた。
あるメディアが衰退し、別のメディアが台頭してくる現象を分析するためのツールとして、マクルーハンはテトラッドと呼ばれる図を用いた。

]]>
19729
商用でも利用可能なAI音声合成ソフトウェア『VOICEVOX』がオープンソースとして無料でリリース https://ebutlab.com/blog/2021/08/01/%e5%95%86%e7%94%a8%e3%81%a7%e3%82%82%e5%88%a9%e7%94%a8%e5%8f%af%e8%83%bd%e3%81%aaai%e9%9f%b3%e5%a3%b0%e5%90%88%e6%88%90%e3%82%bd%e3%83%95%e3%83%88%e3%82%a6%e3%82%a7%e3%82%a2%e3%80%8evoicevox%e3%80%8f/ Sat, 31 Jul 2021 18:32:00 +0000 https://twitter.com/hckojima/status/1421720498178715651 音声合成技術の世界に、また画期的な動きがありました。「Seiren Voice」や「Yukarinライブラリ」の開発者としても知られるヒロシバ(@hiho_karuta)さんが、ITAコーパスを利用した商用利用も可能なAI音声合成システム、VOICEVOXなるソフトウェアをオープンソースのとして無料でリリースしたのです。具体的には現時点Windowsで動くシステムで、「ずんだもん」および「四国めたん」の声でテキストを読み上げるシステムとなっています。

これがオープンソースとなったことで、一般ユーザーが自由に利用できるというだけでなく、さまざまなシステムに組み込んで喋らせることが可能になったのが画期的なところ。たとえばロボットなどに組み込んで対話型のシステムを作ることや、観光案内システムに導入して喋らせる……といったこともできるほか、クラウド型のシステムを構築し、ブラウザを経由して対話できるようにするといったことも可能になるのです。ややシステム寄りの話で、その意義がよく理解できない……という人も少なくないと思うので、仕掛け人であるITAコーパスのプロジェクト責任者であり、SSS合同会社の小田恭央さんにオンラインインタビューするとともに、システムを開発したヒロシバさんにもメールインタビューすることができたので、その内容を紹介していきたいと思います。

]]>
19376
スマートホームでできること : Amazon Alexa https://ebutlab.com/blog/2021/07/18/%e3%82%b9%e3%83%9e%e3%83%bc%e3%83%88%e3%83%9b%e3%83%bc%e3%83%a0%e3%81%a7%e3%81%a7%e3%81%8d%e3%82%8b%e3%81%93%e3%81%a8-amazon-alexa/ Sun, 18 Jul 2021 11:35:36 +0000 https://twitter.com/hckojima/status/1416723324927762440 Alexaとスマートホーム対応製品を組み合わせて家電をスマート化すると、「アレクサ、〇〇して」と話しかけるだけでハンズフリーで家電の操作が可能になります。
たとえば、ソファーから動かずに声でテレビの操作ができたり、子育てで両手がふさがっているときに声でエアコンの操作ができたりと、いつもの生活がより快適になります。

今お使いのテレビやエアコンなど、赤外線対応リモコン(一般的なリモコン)で操作している家電は、仲介させるスマートリモコンを使うと、ON/OFFや温度調節、チャンネル変更などが声でコントロールできるようになります。家電を買い替える必要はありません。

リモコンが付いていない扇風機やシンプルなスイッチのみのフロアスタンドは、スマートプラグ を使うと声でON/OFFができるようになります。

]]>
19337
無料で使えるAI音声合成サービス「CoeFont STUDIO」 https://ebutlab.com/blog/2021/05/09/%e7%84%a1%e6%96%99%e3%81%a7%e4%bd%bf%e3%81%88%e3%82%8bai%e9%9f%b3%e5%a3%b0%e5%90%88%e6%88%90%e3%82%b5%e3%83%bc%e3%83%93%e3%82%b9%e3%80%8ccoefont-studio%e3%80%8d/ Sun, 09 May 2021 12:17:52 +0000 https://twitter.com/hckojima/status/1391366811115917313 株式会社Yellstonは4月23日、人工知能(AI)を活用するWeb音声合成サービス「CoeFont STUDIO(コエフォントスタジオ)」を期間限定で無料公開した。無料提供の終了時期は未定という。

本サービスでは、AIにおけるディープラーニング(深層学習)を活用することで、人間の声を再現してWeb上で音声合成ができる。Web上でアクセント調整やスピード調整などの機能を利用し、作成した音声はダウンロード可能だ。本サービスおよび出力した音声データは営利・非営利問わず自由に利用できる。

本サービスでは「アリアル」と「ミリアル」がユーザーの入力した言葉を話してくれる。両キャラクターはともにイラストレーターの凪白みと氏がキャラクターデザインを手がけた。「アリアル」は芯の通った声質、「ミリアル」は透き通った声質が特徴という。

]]>
19054
Lyra – enabling voice calls for the next billion users https://ebutlab.com/blog/2021/04/10/lyra-enabling-voice-calls-for-the-next-billion-users/ Sat, 10 Apr 2021 00:17:51 +0000 https://twitter.com/hckojima/status/1380676362269122560 Google Open Source Blog: The past year has shown just how vital online communication is to our lives. Never before has it been more important to clearly understand one another online, regardless of where you are and whatever network conditions are available. That’s why in February we introduced Lyra: a revolutionary new audio codec using machine learning to produce high-quality voice calls.

As part of our efforts to make the best codecs universally available, we are open sourcing Lyra, allowing other developers to power their communications apps and take Lyra in powerful new directions. This release provides the tools needed for developers to encode and decode audio with Lyra, optimized for the 64-bit ARM android platform, with development on Linux. We hope to expand this codebase and develop improvements and support for additional platforms in tandem with the community.

]]>
18842
Meet the Slack-backed Voice Messaging Start-Up, Yac https://ebutlab.com/blog/2021/02/13/meet-the-slack-backed-voice-messaging-start-up-yac/ Sat, 13 Feb 2021 11:33:25 +0000 https://twitter.com/hckojima/status/1360552655039328260 Yac, a start-up aiming to revolutionise voice messaging in the enterprise, has raised $7.5m to develop its audio communications platform.

The Florida-based firm, which counts Slack among its investors, was founded in 2019 and says its mission is to “eliminate pointless meetings”. Its features include voice messaging, screen sharing and group meetings – with a large focus being placed on ‘asynchronous’ messaging. The term asynchronous refers to messages where the recipient is not expected to reply in real-time, as opposed to video chats or instant messaging. Yac calls the concept “podcast-like messages”, with the implicit rule being that responses can take minutes or even hours to be sent…

]]>
18665
The UX of Voice: The Invisible Interface https://ebutlab.com/blog/2021/02/13/the-ux-of-voice-the-invisible-interface/ Sat, 13 Feb 2021 10:54:19 +0000 https://twitter.com/hckojima/status/1360542816523325444 Voice interaction represents the biggest UX challenge since the birth of the smartphone, so we break down the implications and opportunities for this paradigm shift in UX design.
It’s a brand new year, and by most reliable indicators – the latest demos at CES 2017, the buzz on all the tech blogs and even the pre-roll ads interrupting my binge watching of Crazy Ex-Girlfriend – it looks like 2017 will be the year that voice interaction reaches mainstream adoption.

Voice interaction – the ability to speak to your devices, and have them understand and act upon whatever you’re asking them – was everywhere this year. Device manufacturers of all shapes and sizes heavily integrated voice capabilities into their offerings at CES 2017, with Amazon’s Alexa stealing the show as their AI platform of choice…

]]>
18669
Clubhouse banned in China https://ebutlab.com/blog/2021/02/11/clubhouse-banned-in-china/ Thu, 11 Feb 2021 00:40:17 +0000 https://twitter.com/hckojima/status/1359663514667786245 Fast-rising audio chat app Clubhouse doesn’t seem to be available in China anymore.

Clubhouse users in mainland China started complaining of disruptions on Monday, Reuters reported.

The disruptions aren’t due to technical issues; the service has been banned by the Chinese authorities, TechCrunch said. An outright ban certainly isn’t out of the ordinary, as numerous U.S.-based social media services, including Twitter and Facebook, are already banned in China.

The ban comes just as Clubhouse started gaining popularity in China. According to The Guardian, a hashtag on Weibo that referred to Clubhouse as “the Renaissance of China” was viewed at least 50,000 times before it, too, was banned …

]]>
18649