CDP: Unlocking Climate Solutions に挑戦するPart4(End)
2020/12/3にCDPのコンペティションが終了しました。提出も完了しています。個人的にはこれが初めてのコンペ参加、提出となりました(Award/Tierの対象でないためKaggleオフィシャルのSubmissionとしてカウントはされないのですが)。
Part1でトップNを目指すつもりはないと言っておきながら、Part2で作成したデータセットがNotableとして取り上げられ、行けるんちゃうかとしゃかりきになり(これがコンペの魔力かと感じました)、提出と相成りました。
そういう意味では予想よりガッツリ取り組むことになりました。本記事では、提出前の動きと提出後の振り返りを書き綴ろうと思います。
- CDPコンペティション提出前
- CDPコンペティション提出後
CDPコンペティション提出前
コンペティションのOverviewを読み込みました。主催者の意図を確認するためです。財務・非財務を組み合わせるという方向性を決めPart2~3にかけて準備を行いましたが、それをどう主催者の意図に沿ったものに仕立てるのか検討しました。Overviewから重要な点は以下と推察しました。
- CDPは環境に対する取り組みをまとめた大規模なデータセット。
- 毎年アンケートを取っており蓄積がある。
- 企業/都市双方からアンケートを回収している。
- 特に都市について、気候変動対策をしつつ景気を回復させる一方、格差を拡大させない方法について知見を得たい。
- 都市/企業が協力できるポイントを見つけたい。
お題はCDPのデータを使い上記に関連するKPIを作成せよというものです。
都市での対策を重視している印象でした。環境へ配慮する一方格差や差別といったsocialな問題を気にかけているようです(あまり詳しくないですが、気候変動対策の振興というと大企業有利に働いたりするのか?)。そういう意味では、CDPにないsocial系のデータを組み合わせるのが王道と思いました。今回は企業に焦点を当てると決めていたので、「都市/企業が協力できるポイントを見つけたい」というお題にフォーカスすることにしました。
ライバルの動向もチェックしました。締め切り前になると何人かの方が提出を始めたので、Voteが多いものを見ながら書き方を盗みました。この点についてはコンペティション提出後で詳しく述べたいと思います。
最終的に以下の方向性で書くことにしました。
- 「都市/企業が協力できるポイントを見つけたい」というリクエストに応える。
- 協力するなら有望な機会でなくてはならない。有望性を定性的・定量的に評価する(定性はアンケート回答、定量に財務を使用)。
- 都市/企業がそれぞれ取り組んでいる機会を(自然言語処理で)マッチングさせ、そこから定量的・定性的に評価が高いものをランキングする。
プラスアルファとして、「インタラクティブ性」を加えました。正直環境に対する取り組みなんてものすごくあやふやなので、決定的なKPIを「モニタリングする」よりガチャガチャいじりながら「検討する」方が良いと考えたためです。Altairで以下のようなスライダーで重みをいじれる仕組みを取り入れました。
上図は企業が取り組む機会を可視化したものです。左でトレンドを、右でトレンドの上下が定量/定性のどちらに起因するのか確認する作りになっています。定性・定量の計算パラメーターをスライダー/ドロップダウンで切り替えられるようにしています。
- 定性: 時間軸/発生確率/インパクトそれぞれの重み
※機会の時間軸/発生確率/インパクトはアンケート回答から取得 - 定量: 計算に使う勘定科目
企業と都市のマッチングにはベクトル表現(Universal Sentence Encoder)を使用しました。当初定量のみだったのでNLPの出番あるかなと考えていたのですが、企業/都市の取り組みで似たものを探すという重要な役割を果たしてくれました。
仕事が終わってから取り組むというかなりハードな毎日を過ごしていたので提出前は正直大変でした。提出したNotebookは以下になります(Notebookを提出する形式だった)。
CDPコンペティション提出後
他の提出者のKPIをながめてました。提出前後も含め、以下のKPIが気になりました。お二人ともかなり早い段階で提出されてました。
“Risk, Ambition and Solution KPIs for cities”は以下の書き方が上手いと思いました。
- レポートの冒頭で、主催者のお題をどう解釈したのか提示。その上で、ゴールを設定。
- ゴールが主催者の意図だけでなく、社会的な世情/動向においてどういう位置づけなのかを語る。
- KPI計算の妥当性を保証するためのフレームワークを提示(今回の場合SDGs)
- 計算したKPIの有効性を定量面(複数KPIがあるのだが矛盾した値になっていないか)、定性面(事例との適合)から検証。
個人的にはこれがトップ取るんじゃないかなと思っています。方法はすべてまねたんですが、時間の関係でKPI計算の妥当性や事例分析を収められなかったのが反省点です。提案手法の背景や手法の妥当性を説くのは”Impact Potential Analysis of Water-Use Efficiency”でも同様です。プロの人?が書くレポートってこんな感じなんだなと感心しました。
今回の学びはデータを解析する際に活かしてきたいです。また、今回のコンペティションでの可視化はAltairをフル活用しました。コンペ前の連載でAltairを扱っていましたが、図らずもかなり使い込むことができたのでそのまんま実践に入れそうです。
次回からはまた財務の可視化に戻ろうと思います。