分散型 AI におけるデータ可用性の役割

qyeah
0G Japan
Published in
6 min readMay 16, 2024

「The Role of Data Availability in Decentralized AI」の翻訳記事です

導入

「暗号AI」または「オンチェーンAI」とも呼ばれる分散型AIは、最近大きな注目を集めています。現実には、現時点ではその大部分がオフチェーンで発生しており、実際のアプリケーションの範囲は依然として限られており、暗号通貨 x AI の真の力を実現したい場合は、克服しなければならない大きな制限があります。

主な制限は、AI に必要な膨大な量のデータをオンチェーンで保存および処理する必要性によって課せられますが、既存のデータ可用性 (DA) ソリューションを使用しては不可能です。代わりに、計算はオフチェーンで実行され、認証に暗号化技術 ZK Proofs を使用してリアルタイムでオンチェーンに持ち込まれる必要があります。

0G は、大規模なデータ ストレージ ソリューションと無限にスケーラブルな DA レイヤーの両方を提供し、ついに AI をオンチェーンでサポートできるようになります。

この記事では次のことについて言及します

  • データの可用性とその既存の制限
  • 分散型 AI におけるデータ可用性の役割
  • AI をオンチェーンに導入する 0G の役割

データの可用性

Ethereumの将来は、レイヤー 2 (L2) ネットワークがオフチェーンでトランザクションを処理して、ネットワークの混雑を緩和し、料金を削減し、最終的にはEthereumエコシステムを拡張するロールアップ中心のロードマップです。その後、L2 はデータをEthereumに公開して、そのセキュリティを継承し、正しい計算の証明を提供します。しかし、最近のEIP-4844 (「プロト ダンクシャーディング」) アップグレードにもかかわらず、Ethereumのデータの公開は依然としてコストが高すぎるため、世界規模で拡張することはできません。

これはデータの可用性の問題です。 すべてのノードにすべての履歴データを保存することを義務付けることなく、要約された形式のデータが有効なトランザクションのセットを正確に表現できるようにするにはどうすればよいでしょうか?

データ可用性レイヤー (DAL) は、データを公開し、誰でも検証できるようにするための効率的かつ安全な方法を提供します。たとえば、データ可用性サンプリングは、ライト クライアントがすべてのデータの一部のみを保存し、数学的サンプリング プロセスを通じてすべてのデータが存在することを検証する 1 つの手法です。

欠点は、既存の DAL ソリューションでは、業界で予想される急激な成長には不十分であることです。その代表的な例は分散型 AI で、これにはモデル トレーニングなどの目的で大量のデータを効率的に保存および取得できる DAL が必要です。

暗号×AI

ブロックチェーンと AI の相互接続は重要な意味を持ち、不透明で独占的な業界に分散化、透明性などをもたらします。関心が高まっているにもかかわらず、状況はまだ初期段階にあり、私たちは可能性の表面をなぞっただけです。

出典: uETH ブログ投稿

その理由は、分散型 AI が現時点で非常に困難であるためです。膨大な量を効率的に保存できるだけでなく、複雑な計算に伴うガス料金を最小限に抑えながら、データを迅速に取得してモデルをリアルタイムで実行できなければなりません。

主なアプローチは、計算をオフチェーンで実行し、オンチェーンのゼロ知識証明 (ZKP) を使用して、モデルが正しく実行されたことを検証することです。これにより、AI の結果を迅速にオンチェーンに取り込むことができると同時に、データの機密性が保たれます (ZKP は基礎となる情報を明らかにしないため)。同時に、ZKP は比較的新しいため、依然として遅くて高価であり、オフチェーン データは AWS のような集中型ストレージ企業に依存し続けています。

その代わりに、大量のデータをオンチェーンに保存し、透明性の向上や協調的な AI などの関連メリットをもたらすことが大きなニーズとなっています。 AI に大規模なオープンソース アカデミーがあるのは事実ですが、最終的に最新のテクノロジーを持っているのは最大手の企業だけです。また、平均的な当事者にとってモデルを収益化することは困難であり、高度なモデルの構築や共有の意欲を阻害する可能性があります。

暗号通貨と AI の組み合わせには、関連する多くの利点があります。しかし、前述したように、既存の DAL にはこれができません。これが解決されるまで、データはオフチェーンに保持され、それに関連する前述の問題が継続します。

0Gの役割

0G は、分散型 AI を実現するために必要な、無限にスケーラブルでプログラム可能な DA レイヤーを提供します。

これは、データのパーティショニングと、共有ステーキングとして知られるプロセスで任意の数の個別のコンセンサス ネットワークを導入する機能の両方によって可能になります。共有ステーキングでは、資産を別の選択チェーン (Ethereumである可能性が高い) にのみステーキングしながら、さまざまなコンセンサス ネットワークによって 0G コンセンサス バリデーターを同時に管理する必要があります。これにより、設計が簡素化されますが、ネットワーク上でスラッシュ可能なイベントが発生すると、ステークされたアセットを含むネットワーク上でスラッシュがトリガーされます。

DA レイヤーとしての 0G の役割以外に、構造化データと非構造化データの両方を対象とする一般的なデータ ストレージ システムである 0G ストレージもあります。膨大な量のデータを保存でき、Web3 エコシステムの残りの部分にデータ ストレージ インフラストラクチャを提供します。

0G の設計の詳細については、最近のブログ投稿を読むことをお勧めします。

結論

AI をオンチェーンに導入するには、拡張性の高い DAL が必要であり、膨大な量のデータを効率的に保存および取得して使用するためのインフラストラクチャを提供します。既存の DAL は、このような大規模なデータ ニーズをサポートするために適切に準備されていない可能性があり、代わりにカスタム目的のアプリ チェーンなどの目的に適しています。

0G の無限にスケーラブルな DA は、ついに AI をオンチェーンに導入するために必要なソリューションであり、最初のステップとして、これを実現するテストネットを最近発表しました。

詳細については、 Twitter をフォローしてください

テストネットについて詳しくは、こちらの最新の投稿をご覧ください

--

--