今週の GCP 9/10
訳者: @apstndb @kumakumakkk @nagachika
この記事は Google Cloud の DevRel の @alexismp による TWiGCP — “All about datasets, Google/Cisco deliverables, and matchmaking” の日本語訳に各参照先の記事の説明となる訳注を加えたものです。実際に読む記事を選ぶ際の参考にお使いください。
Googleはデータセットを探すのを簡単にしています。“Making it easier to discover datasets” (Google blog).
この新しいサービスでは、例えば、USPTO Patent Trial and Appeal Board (PTAB) Data (kaggle.com)や、 Dataset and Challenge for Image Captioning (Google blog)のような新しいリリースが探しやすくなります。 (訳注: Google は世界中のデータセットを検索する Dataset Search を公開しました。論文検索の Google Scholar と同様の仕組みでどこでホストされているかに関わらずデータセットを検索することができます。データセットについてのメタデータは Schema.org で標準化されています。)
その他のデータセットが提供されたコンペのトピックとしては、機械学習をより(訳注:国、地域、人種を超えて)あらゆる人々に受け入れられるようにするためのものがあります。 — “Introducing the Inclusive Images Competition” (Google blog) (訳注: Google が NIPS のコンペティションと共同で開催する包括的画像認識のコンペティションの紹介。近年の機械学習による画像処理の発展には ImageNet, Open Images など大規模な公開データセットの存在が大きな要因になっていますが、これらのデータセットは主に北米や西欧などの特定の地域のものからなっており地理的な偏りがあるため、これらのデータセットを用いてトレーニングした機械学習モデルもこのデータの偏りを反映してその他の地域の画像をうまく認識できないことがあります。今回そのような偏りのあるデータを元にしてもより包括的な認識が行なえる機械学習モデルのトレーニングへの挑戦のため、Open Images のデータセットを用いてトレーニングしたモデルでその他の地域から収集した画像をラベリングするというタスクをコンペティションとしています。コンペティションは2ステージにわかれており、最初のステージは9月5日に開始、締切は11月5日とのことです。)
ハイブリッドクラウドを実現するにはあらゆるパートナが必要で、CiscoはGoogleにとって重要なパートナーです: “General availability of Cisco Hybrid Cloud Platform for Google Cloud” (Google blog) (訳注: GCP とオンプレミスのハイブリッドクラウドを実現する Cisco Hybrid Cloud Platform for Google が GA になりました。 Istio を使った既存のオンプレミス環境と統合したポリシーの適用や Apigee で管理される API のオンプレミスからの提供、統合されたサポートの提供などをアピールしています。)
もし数週間前のGoogleとUnityのマッチメイキング(訳注:協業)の発表にワクワクしたんでしたら、Open Matchがリリースされました: “Flexible and extensible matchmaking for games” (Google Blog) (訳注: スケーラブルなマッチメイキングを実装することは容易ではなく、その時間をよりゲームの楽しさを実現するために使いたいものです。 Google は対人プレイ・協力プレイをするゲームでのマッチメイキングを行う OSS である Open Match を Unity との協業でリリースしました。ゲームクライアントへのフロントエンド API とゲームサーバへのバックエンドの API を提供し、マッチメイキングのロジックをカスタマイズする拡張性、 Kubernetes 上ならどこでも動く柔軟性、スケーラビリティの利益を得ることができます。)
GoogleのHead of Technical InfrastructureであるUrsは、クラウドがどこに向かうのかを理解するために非常にユニークな立場にいます — “Google infrastructure chief Urs Hölzle: This is the future of software and the cloud” (siliconangle.com) (訳注: Google Cloud 技術インフラストラクチャ担当上級バイス プレジデントの Urs Hölzle はインタビューの中で、 Kubernetes と Istio は今後 Linux を代表とする LAMP スタックのような標準的な技術となり各クラウドやオンプレミスで同じことを同じように実現できるようになっていき、GCP ならば BigQuery や Cloud Spanner のように特定のクラウドにしかなく標準化がまだできないが強みになるものがプロプライエタリとして残り続けるであろうと述べています。)
「最近medium.com/google-cloudを見た?」コーナー:
- Understanding Istio Ingress (medium.com) (訳注: インシデント対応の記録サービス FireHydrant のエンジニアが Istio 1.0 の Networking API のうち、 Gateway と VirtualService を使って特定の HTTP のパスを Kubernetes 上の Service にルーティングする方法について説明しています。)
- CI/CD in a serverless Google Cloud world (medium.com) (訳注: GCP におけるサーバーレスなデータ投入パイプラインを例として、 Cloud Build を使ってパイプラインのデプロイをする方法を解説しています。具体的には Cloud Storage のファイル更新通知を Cloud Functions で受け、Cloud Dataflow のパイプラインを叩いて BigQuery に書き込むパイプライン全体を Cloud Build 上で Terraform や Gradle などの各ステップでデプロイしています。)
- Why ingress traffic to “the cloud” is free (medium.com) (訳注: クラウド各社の IaaS の価格体系では、データセンターから流出する egress トラフィックは課金されても流入する ingress トラフィックには課金されないのが何故かということを解説しています。この記事ではインターネットとの接続を提供するプロバイダとの接続が上りと下りが同じ帯域であるのに対して、一般的なデータセンターではダウンロードなどの egress トラフィックが主なため ingress トラフィックに関しては帯域が余っていることが原因だとし、1998年の Google の最初のデータセンターの請求書の時点でトラフィック利用に対する料金が不均等だったという資料を提示しています。)
- Moving from AWS Aurora to Google CloudSQL (medium.com) (訳注: Cloud SQL for MySQL は最近 Cloud SQL 以外の外部マスターのレプリカとなることでマイグレーションを行うことができるようになりましたが、マスターでは GTID が有効になっている必要があります。この記事では、上流の Aurora からは GTID なし、下流の Cloud SQL からは GTID ありに見えるパッチを当てた中継ぎの MySQL サーバを置くことで Aurora から Cloud SQL へのマイグレーションを行った方法について解説しています。)
「どうやるの?」コーナー:
- Scaling up Keras with Estimators (towardsdatascience.com) (訳注: Keras で定義した機械学習モデルは TensorFlow Estimator を使うことで分散学習することができ、そのために必要なのは model_to_estimator を呼び出すだけであると解説しています。)
- Installing Istio On Google Kubernetes Engine (GKE) (medium.com) (訳注: Kubernetes Engine に Istio 1.0 をインストールする方法を GDE が解説しています。)
- Using Apache Hive on Cloud Dataproc (Google documentation) #ephemeralClusters (訳注: Apache Hive を Cloud Dataproc 上で走らせることで、一時的なクラスタを使ってコスト効率よく分散処理を行う方法について解説している GCP 公式のソリューション記事です。)
- How to deploy a TeamCity Continuous Integration solution to Google Cloud (Google blog) (訳注: JetBrains の CI ツールの TeamCity は Compute Engine 上でのビルドエージェントの自動スケールやアーティファクトの Cloud Storage への保存に対応しており、Compute Engine の Preemptible VM や高速な起動時間、秒単位課金の強みを生かすことができることを解説しています。)
- “Building IoT Applications on Google Cloud”. The video. The code. #IoTCore #PubSub #Functions #Firestore (訳注: Cloud Next ’18 のセッション内で構築してみせた IoT アプリケーションの実装を GitHub で公開しました。RaspberryPi に接続した血圧計の値を Cloud IoT Core, Cloud Pub/Sub, Cloud Functions と経由して Cloud Firestore に保存し、 Google Spreadsheet および Angular で書いたウェブクライアントから可視化することができます。)
Edge TPU Devices are coming in the fall (aiyprojects.withgoogle.com) (訳注: モバイル端末でも画像認識モデルを 30 fps 以上で動作させることができる機械学習専用プロセッサである Edge TPU の開発ボードおよび USB アクセラレータが秋に入手可能になります。)
「音声と動画」コーナー:
- GCP Podcast Episode #0145 — ATLAS with Dr. Mario Lassnig(gcppodcast.com) #CERN
- kube-hunter and KubeCon, with Liz Rice (kubernetespodcast.com)
- BigQuery ML — Machine Learning using SQL in BigQuery (youtube.com)
- Ep. 68: Dan Kohn and Sarah Novotny on Kubernetes, multi-cloud and the rush to serverless — THE ARCHITECHT SHOW (architecht.io)
今週の画像は Inclusive Images Competition post からです
今週は以上!
-Alexis (原著者)