Amazon Alexaが導く未来の暮らし。“Alexa Everywhere”の世界観とは?

# HomeTech 5/8

--

2018年11月に開催された第2回「LivingTech カンファレンス」。『POST2020』をテーマに掲げ、2020年から5年後の社会を考えるトークセッションが展開されました。人口減少、少子高齢化、過剰供給……。社会課題について交わされた13セッションの中から、「顧客志向から生まれるスマートホーム戦略」と題して行われたセッション(全8回)の5回目をお届けします。

第1回から読む

登壇者情報

  • 前田 宏 氏 /アマゾンジャパン合同会社 消費財事業本部 統括事業本部長 バイスプレジデント
  • 柳田 晃嗣 氏 /アマゾンジャパン合同会社 Alexaビジネス本部 本部長
  • 山下 智弘 氏 /リノベる株式会社 代表取締役
  • 塚本 信二 氏 /米DUFL 共同創業者, リノベる株式会社 社外取締役 /モデレータ

パートナー情報

本セッションはリノベる株式会社様にサポートいただきました。

Amazon Alexa がもたらす豊かな暮らしとは?

塚本 では引き続き、先ほどの動向の流れのマップにもありましたけれども、Echo周りの話を柳田さんにぜひしていただきたいです。

最近やっとスクリーンのついたもの(=Echo SpotやEcho Show)が出てきました。

私の家も4台ぐらいEchoを使わせていただいているんですけれども、どうしても中が見えなかったり、どういうふうに使い切ればいいのかとか、いち消費者としての疑問が残っているフェーズだと思うんですよね、多分。

いろいろなことに取り組まれ、今後どのように展開していくのかも含めてお話ししていただけると非常に参考になると思います。次のスライドですね。

柳田 ありがとうございます。

Alexaのテクノロジーを使ってAmazonのブランドでご提供しているデバイスの名前がEchoで、EchoはAlexaが使えるAmazonブランドのデバイス。

Alexa自体がボイスファーストと呼んでいる音声ファーストのテクノロジーで、クラウドベースのサービスを提供させていただいてるんですね。

先ほど実はショッピングのところでも、購買活動でもEchoの写真がパッと出ていましたけれども、もちろんAmazonのビジネスの大きなところはショッピングです。

けれども、実はこのEchoもしくはAlexaは、ショッピングをしてもらうために作られたものではないんですね。

やはりお客さまが、またはAmazonのお客さまでなくても構わないぐらい、日常生活の中で声からスタートすることによって、今まで当たり前だと思っていたタスク、一つか二つくらいの仕事があるんだとしたら、それを外してあげればどんなに便利になるんだろうかと。

コンセプト的には、1966年にアメリカでスタートした『スタートレック』というテレビシリーズがあって。今でも映画化されたりしていますけど、そのなかのコンピューターが声なんですね。ほとんど声でやり取りをする。

そういったものを、創業者のジェフ・ベゾスも大変好んで話をする機会がよくあります。

そういう中で、「なんで今どきまだ声でコンピューターを使えないんだろうか」という疑問点、シンプルな疑問ですよね。そういうところからこのサービスがスタートしているという背景があります。

そうすると、「声でやることができるようになったらどんなに便利なんだろうか」という点で、Alexaがアメリカでまず最初に一般家庭に使っていただく形で紹介されて、実際に使ってみると驚くほど便利だということで普及してきた。

そしてようやく日本に昨年の11月、招待制という形で、ご招待者のみ購入できるかたちでスタートして、今年の3月にようやく皆さんが買いたいときに買える状況になりました。

Voice to Voice そして、Voice to Screenへ

このAlexa自体は今ここに書いてあるように、機械学習、自動音声認識、自然言語理解、それから音声合成という4つのキーの技術を使って提供しているサービスですね。

先ほどもおっしゃったように、よくAIスピーカーと呼ばれるんですけど、私どもはAIスピーカーという言い方はしていないんですが、AIというとすぐArtificial Intelligenceになって人工知能、何かそこに意思があってものを考えているみたいに思われるケースがあります。

けれどもそうじゃなくて、AIのテクノロジーを使ってお客さまが話された声を認識してその意図を汲み取ってということで、ちょっとこれ見ていただくと分かるんですが、実はユーザーが(Alexaに)声を掛けられるわけですよね。

そこにはデバイスが必要なので、耳になってくれるのがEchoのデバイスです。

そしてそこで何を話されたのかまず言葉を認識して、そこの言葉がどういう意味合いを持っているのか。言葉通りだけではなく、その意図ってあるんですよ。

「天気予報を聞かせて」と言ってくださる方は非常にストレートで分かりやすいです。

けれど「今日、傘は必要かな」と言ったときに、Echoが、もしくはAlexaが「Amazonでは次の傘が一番人気で売れております」と説明をしたら、「違うよ」と。「今日出かけようとしてるんだよ。今日雨が降るのかどうか知りたいんだ」と、意図が違うわけですよね。

「傘が買いたいんだ」と言えばそういう意図なんですけど、今の発話がどういう意図を持っているのかを理解して、今の例えば天気予報を提供しているのがYahoo!天気さんだとしたら、Yahoo!さんに右側のリクエストを渡してそこからそこの場所であるとか、今日の天気予報なのか明日の天気予報なのか1週間天気なのかを確認したうえで戻してもらって、それをまた聞き取ってる方が分かる言葉で発話をしてあげると。

もし必要であれば、例えば予約の確認番号が必要な場合には下の携帯もしくはパソコンのスクリーンにそういうカードを送ってもらうことによって、すぐにメモを取る必要もないと。

それ持って出掛けるだけという状況までやる、この一つのサイクルがAlexaとの会話という感じになるんです。

塚本 なるほど。多分多くの実際に買った人は活用しようとしている段階だと思いますし、こちらでいただいてるようなさまざまなデバイスの種類も出てきています。

柳田 そうですね。今この写真に出ているのはSpot(Echo Spot)です。Echoのスピーカーonlyの製品が3月から一般販売していました。

実はそこからほんの数カ月後にEcho Spotというスクリーンのついた、ちょっとかわいらしい小さな丸型の、昔でいうとベッドの横に置いてあった置時計みたいな感じのものが出てまいりました。

日本では実はこのスクリーンがついている音声ファーストのスクリーンのデバイスが非常にうけているんですね。

非常に分かりやすくお使いいただいてるのが日本の特徴だと思っています。

塚本 なるほど。これが発売し始めたの、いつでしたっけ?

柳田 7月末に出荷開始しました。

塚本 Voice to VoiceからVoice to Screenに変わっていくタイミングは、個人的にもかなり大きなシフトだと思います。

ちょっと込み入った質問かもしれませんが、販売的には予想以上に好調なのか。個人的な意見ですが、日常に溶け込まないとこういう新しい技術とか生活スタイルは定着しないと思っているんですよね。

そういった意味でいうと、今後標準になっていくのか。出荷し始めてすぐのタイミングですけど。

柳田 シフトというよりも今新しい12月12日から出荷開始になるEcho Showという10インチの製品と、今ここのEcho Plus。(それ以前の商品も)もともと音は良かったんですけれども、Echo Showでは非常にスピーカーが強化されています。スクリーンのついていないデバイスも新しく発表されています。

なので、シフトというよりもスクリーンのついたものが加わったと。

しかもスクリーンで、あの丸い小さいもので目の前において2時間映画を観るかというと多分違うんだと思うんです。

けれどもこのEcho Showの10インチのものであれば十分映画の鑑賞にも耐えられるし、音もすごく充実しています。

そういった製品が出てくると、お客さまがどんな体験をしたいのかという選択肢が増えていく。

そうすると自分はこれ、例えばニュースを聞くのが中心で、洗面所とか歯を磨いている間にニュースを聞きたいのであればスクリーンいらないかもしれないです。

さらに例えば7月末に発売されたEcho Spotに関していえば、ちょうどそのあとお盆休みということもあって、2台買われて実家に1台お持ちになった方もいらっしゃったんじゃないかなと思うぐらい。

塚本 テレビ電話をするためにですか。

柳田 はい。2台ご購入された方も多かったと。

なのでお客さまが逆に理解されていろんな使い方を考えてやられている。それによってスクリーンつきのものがいい、ないほうがいいということで選ばれているのではと思います。

晩酌のお供まで……“Alexa Everywhere”の世界

塚本 なるほど。中に「スキル」が入っているじゃないですか。

要はスマホでいうとアプリになりますけども、AmazonのEchoの「スキル」は、今日来られている方々で今後消費者にアプローチしていったり、新しい生活支援をしていくときに、つくるのはそんなにハードルは高くないんですかね。

柳田 そうですね。もちろんAmazonが最初につくっておいた機能もたくさん入っているんですね。

もちろん「こんにちは」と言ったら挨拶しますし、「ダジャレを言って」と言ったらダジャレを言うこともあります。

けれども、ただやっぱり日本のお客さまがどんなことを求められているのか。

音声ファーストで、声を掛けただけで答えてくれるという環境ができたときに、どんなものがあるのかを考えたときに、例えば銀行や保険会社、セキュリティサービス、教育、ショッピング、エンターテイメントなどさまざまな領域で「声を使う」ということが、普通に仕事として存在するものは全てパートナーになりうる。

そういったスキルを開発してEcho、Alexaをうまく使っていただくサービスになりうるわけです。

塚本 それもVoice to Screenが比較的近い将来スタンダードになっていく印象を持っていらっしゃるということですよね。

柳田 そうですね。いま実は1,500以上のスキルが登場しています。そのほとんど95%以上が日本の開発者もしくは企業が、日本のユーザーのために日本で開発されたものなんですね。

例えばJR東日本さんとか三菱UFJさんとかドコモさんとか、そういった全く違う業界の会社、もしくはエンターテイメント、それからピカチュウみたいなものもありますし、ありとあらゆるスキルたちが出てきて。

塚本 今日本って500ぐらいでしたっけ?

柳田 今1,500超えてます。

塚本 もう1,500なんですね。

一人で晩酌するためのスキルが出たり、マーケティング的にも非常に面白くなってきた感じで。

柳田 そうですね。九州のラジオ局の。

塚本 居酒屋清子ですよね。

柳田 居酒屋清子というのがあるんですが、テーマ的にはサラリーマンが一人で寂しく家に帰ってきて、「居酒屋清子を開いて」と言うと一緒に晩酌してくれます。

地方のラジオ局の番組がこれをうまく活用されることによって全国デビューというか、そういう形でも喜んでいただいてると。またユーザーも増えています。

塚本 これだけポテンシャルが高いデバイスなり技術ですと、Bの企業側もCの消費者もそれぞれがデザインしていくという、もしかしたらAmazonの予定していないところで新しいサービスが生まれたりすることも結構多くなる気がします。

柳田 そうですね。Amazonがこれ全てやりたいと思っているわけでもなければ、Amazonがハードウェアをたくさん使っていきたいのは山々なんですが、このハードウェアをたくさん売ることによってビジネスがしたいと思ってこれをやっているというよりも、さまざまなところで、“Alexa Everywhere”と言っているんですけれども、行ったところ行ったところで「Alexa!」と声を掛けると答えてくれます。

そして自分の必要な情報だとかサービスとかを提供してくれると、今から何年後か分かりませんが、そういうことが実現できた暁には、もしかするとAmazonはEchoデバイスをつくらなくてもよくなるのかもしれないということさえ考えているぐらい、自然なサービスになっていければなと考えています。

それが多分、お客さまの一番の本当の便利を獲得された瞬間だと思っています。

--

--