データとAPIが次世代経済をどのように動かすかを理解する

Chainlink Japan
Chainlink Community
Feb 2, 2021

本記事はChainlinkオフィシャルブログに公開された“Understanding How Data and APIs Power Next-Generation Economies”の和訳です。

Chainlink公式より許可をいただいた上で記事を翻訳・公開しています。

前回までの2回の教育シリーズの記事では、価値を移転・蓄積するための安全性と信頼性の高い新しいインフラとして、ブロックチェーンスマートコントラクトについて取り上げました。インターネットのないコンピュータのように、ブロックチェーンベースのスマートコントラクトは、トークンの作成やスワップなど、それ自体に固有の価値を持っています。しかし、ブロックチェーンエコシステムの外側(オフチェーン)に根付く広大で加速するデータやAPIエコノミーに外部から接続すると、それらは指数関数的に強力になります。

スマートコントラクトは、データプロバイダー、ウェブAPI、企業システム、クラウドプロバイダー、IoTデバイス、決済システム、その他のブロックチェーンなどによって生成された膨大なデータの蓄積をうまく利用すれば、すべての主要な市場でデジタル契約の支配的な形態になる可能性があります。

この記事では、データとAPI、具体的にはどのようなものがあるのかを深く掘り下げてみます。

  • データとは何か、それがどのようにデータ経済を牽引するのか?
  • ータはどのように生成されるのか?
  • データはどのようにAPIを通じて交換されるのか?
  • ビッグデータアナリティクスとは何か?

オフチェーンデータエコノミーの全範囲を理解することは、次の記事の基礎を築くことになります。

データとデータ経済

データ

データとは、外の温度を測定したり、車の位置を計算したり、オンラインアプリケーションとユーザーのインタラクションをドキュメント化したりするなど、観察を通して得られる特性や情報のことです。生データは、それだけでは特に価値があるわけでも、信頼性があるわけでもありません。

メタデータ

メタデータとは、データの追跡や作業をより簡単にするための基本的な情報で構成された「データに関するデータ」のことです。たとえば、テキストメッセージの送信時間、温度測定値の地理的位置、電話の通話時間などはすべて、データにインデックスを付けて意味を与えるのに役立つメタデータです。

データのクリーニング

さらに、ミッションクリティカルなアプリケーションで使用するのに十分な信頼性を確保するためには、データを処理してクレンジングする必要があります。クレンジングプロセスには、外れ値の除去、不正確さの発見、無関係な情報の無視などが含まれます。例えば、現在の気温と過去の気温を比較して外れ値を発見し、外れ値の使用を防ぐことができます。

データエコノミー

データエコノミーとは、あらゆるタイプのデータが収集され、洗練され、価値ある洞察を生み出す方法で交換される経済のエコシステムのことです。これらの洞察はその後、社会的なアウトプットを最大化するために利用されます。例えば、臨床試験を保存するための健康データベースを共有して病状をよりよく理解したり、民間企業が社内の業務を追跡して非効率性を特定して改善したりすることができます。

データ経済の成長は、人間の仲介者を介さずにデータが直接経済行動のトリガーにつながる自動化の新しい可能性を切り開いています。例えば、商品が到着した(GPSデータ)、状態が良い(IoTデータ)、税関を通過した(Web API)という3つのデータを確認した後、商品の支払いを行うアプリケーションを作成することができます。

データプロダクション

データはプロセスやイベントの副産物です。データは、生成するための入力(アクション)、記録するための抽出(測定)技術、そして意味を与えるための集約技術(分析)を必要とします。特定の入力や抽出/集計技術へのアクセスには制限があるため、すべてのデータが同じように作成されるわけではなく、誰もが同じ品質のデータを作成できるわけでもありません。

新しいデータやオリジナルのデータを取得する最も一般的な方法には、以下のようなものがあります。

  • フォーム(手動入力) — アンケートへの参加、文書への署名、ソーシャルフォーラムへの参加など、ユーザーが公的または私的なフォームに手動で記入することで取得されるデータ。
  • アプリケーション/ウェブサイト(使用許諾) — データは、ユーザーがアプリケーションやウェブサイトの利用規約に同意することで取得されます。一般的には、アプリ固有のアクティビティ、閲覧習慣、場合によっては一般的なプロフィール情報(性別、年齢など)などの特定のデータメトリクスを追跡することに法的な同意を与えるものです。
  • モノのインターネット(リアルタイムモニタリング) — スマートフォン、スマート家電、健康ウェアラブル、RFIDで追跡された商品など、インターネットを介してデータを送信するセンサーやアクチュエーターを備えたデバイスによって捕捉されたデータ。
  • 独自のプロセス/個人の経験(所有権) — 企業がビジネスプロセスを所有している(特許を持っている、マーケットリーダーである)、または個人のユニークな経験から取得したデータ。
  • 研究と分析(組み合わせと解釈) — 既存のデータセットを利用し、独自の解釈を提供することで収集されたデータ:過去のデータとの照合、他のデータセットとの照合、新しいフィルタリングや計算技術など。

また、データアグリゲータや価値ある企業からデータを一括で購入し、エンドユーザーに再販するデータ再販業者も存在します。データ再販業者はより高価ですが、カスタマイズされたフィルターやフォーマットに合わせてデータを前処理します。

データ交換

データが次世代アプリケーションの中核的な構成要素になるのであれば、産業界は自社生産だけに頼るのではなく、データを売買するマーケットプレイスを必要としています。データを購入することは、データを生産するよりも大幅にコストを下げることができます。例えば、自動運転車のアルゴリズムを作成するには、物体検出、物体の分類、物体の定位、および予測的な動きに関する膨大な量のデータが必要になります。このデータを入手するには、開発者は何百万マイルもの距離を走行することで内部でデータを生成するか、あるいは単にAPIを介して外部からデータを購入することができます。

アプリケーションプログラムインターフェース(API)とは、外部アプリケーションがシステム内の特定のデータセットやサービスにアクセスする方法を説明したものです。APIは、今日ではデータやサービスを売買するための標準的な方法です。人気のライドシェアアプリUberは、位置データ用のGPS API(MapBox)、メッセージングデータ用のSMS API(Twilio)、支払いデータ用のPayments API(Braintree)を使用して、これらのサービスを一から構築するのではなく、共通のアプリの機能を管理しています。

(API経済は創業以来、順調に上昇傾向にあり、新しいAPIを導入したり、より良いAPIの管理方法を提供するイノベーションが多く見られます。出典: ソフトウェア開発会社Informatica)

APIは通常、エンドユーザーが使用ごとに支払う(従量制)、標準的な月額プラン(ライセンス)を利用する、または何らかの形の階層課金に同意するなどのサブスクリプションプランを通じて収益化されます。これにより、データプロバイダがデータを生成するための金銭的なインセンティブが生まれ、エンドユーザーは独自のインフラストラクチャを提供する必要なくデータを消費することができます。また、データの海賊版や無断転売などの悪質な行為を防ぐために、APIプロバイダーと有料ユーザーとの間に法的拘束力のある契約を確立します。また、データ提供者に特定のパフォーマンス基準に対する責任を負わせることもできます。

天気データのOpen Weather Map、飛行状況データのSkyscanner Flight Search、世界的な人間の行動と信念のGDELTなど、誰でもアクセスできるオープンで無料のAPIが数多く存在します。さらに世界各国の政府はオープンデータの取り組みの一環として、オープンAPIを介して利用可能なデータ量を増やしています。

しかし、オープンAPIは金銭的なインセンティブや、品質管理やレイテンシー性能に縛られる法的な契約がないため、有料APIほど信頼性が高くありません。高品質なデータの大部分は有料APIを介して取得されていますが、有料APIは一般的にプライマリデータソースへのアクセス権を持ち、フルスタックインフラストラクチャを所有し、フルタイムの監視チームを雇用し、他のデータプロバイダーとビジネスを競うために常に技術革新を行っています。

ビッグデータのインフラとアナリティクス

人間は、学習と自己改善の方法でシステムをプログラミングするという考え方に魅了されてきました。学習とは行動を起こし、結果を受け取り、過去のデータと照らし合わせて分析し、将来、特定の目標を達成するためにはどうすればより良いパフォーマンスを発揮できるかという新たな洞察を得ることによって促進されます。このように大量のデータを取り込み、フィルタリングし、分類し、その結果から深い洞察を得ることができるインフラを構築することがメガトレンドとなっています。

欧米ではFacebook、Google、Amazon、東洋ではAlibaba、Tencent、Baiduがテック系の巨人になったのは、広く使われているインターネットアプリケーションがユーザーから膨大なデータを蓄積しているからです。このデータは、世界最高のデータ分析、特に人工知能(AI)と機械学習(ML)ソフトウェアの基礎を形成しています。これらのテクノロジーは、消費者の行動、社会的傾向、市場慣行に関する幅広い洞察を与えてくれます。

同時に、経営管理ソフトウェアは、企業が自社の業務をよりよく理解するのに役立ちます。SAP、Salesforce、Oracleなどの企業はERP(Enterprise Resource Planning)、CRM(Customer Relationship Management)、クラウド管理ソフトウェアを構築しており、すべてのデータやシステムをコンパイルすることで、企業が重要なインサイトを生み出すために内部のビジネスプロセスを管理するのを支援しています。

またクラウドコンピューティングとストレージは、デジタルインフラストラクチャへのより信頼性の高い広範囲なアクセスを得るための方法として、ますます普及しています。クラウドコンピューティングを利用することで多くの異なるユーザーがデータを保存したり処理したりするためのインフラを共有することができ、それぞれが独自のシステムをプロビジョニングしたり実行したりする必要がなくなります。アプリケーションのバックエンドプロセスを改善し、システム間の共有を増やし、AI/MLソフトウェアにアクセスするためのコストを削減しました。例えば、Google Cloudのユーザーは、ML機能を内蔵したペタバイト級のデータをスケーラブルに分析するSoftware-as-a-Service「BigQuery」を活用することができます。

第4次産業革命に向けて

AI/ML、経営管理ソフトウェア、クラウド基盤を組み合わせることで、データから得られるインサイトを強化するためのより優れたツールが生まれます。さらにこれらのトレンドに加えて、エッジコンピューティング、5G通信ネットワーク、バイオテクノロジーが、ますますリアルタイムで生物学的に接続されたデータ環境を切り開いています。これらのシステムは、特にデータがシームレスでより頻繁に生成され、共有されるようになったことで、経済システムをより少ない労力でリアルタイムのデータ駆動型の意思決定へと継続的に移行させています。実際、多くの人はこのメガトレンドを第4次産業革命と呼んでいます。

参考文献

教育シリーズの次の記事「オラクル問題」をチェックして、詳細を確認してください。Twitter をフォローして、今後の記事リリースの通知を受けたり、Telegram に参加して、Chainlink の最新情報を入手したりしてください。

Chainlink日本語リソース

--

--