Graph Convolutionを自然言語処理に応用する Part7(End)

piqcy

Published in

programming-soda

6 min readFeb 5, 2019

本記事は、Graph Convolutionを自然言語処理に応用する連載の最終回になります。最終回ではこれまで行なった検証とその結果、そこから導かれる考察をまとめたいと思います。項目は以下の通りです。

検証の背景(仮説)
仮説に関連する研究の調査
仮説を証明するための実験
実験結果を受けての考察
振り返り

検証の背景

「Graph Convolutionを使用することにより、よりリッチな分散表現を得られないか？」という仮説が本検証を始めたきっかけでした。

Graph Convolutionを自然言語処理に応用する Part1

Graph Convolutionを自然言語処理に応用するため、何回かに分けて学習した内容をまとめていきます。内容については、最終的にQiitaなどで1記事にまとめる予定です。

medium.com

この仮説の背景には、Self-Attentionを利用したTransformerで高い精度/転移性能が得られていることがありました。Self-Attentionは、自ノードから他ノードへの接続(重み)を持つグラフ的な構造を持っています。そのため、ここにグラフを扱うためのネットワーク(Graph Convolution)を組み込めばより良い性能が得られることを期待しました。

仮説に関連する研究の調査

調査は、以下2つに分けて行いました。

Graph Convolutionについての調査
Part1: Graph Convolutionについての調査
 Part2: 代表的手法であるGraph Attention Networkについての調査
 Part3: Graph Convolutionで扱うタスクの調査
自然言語処理への応用についての調査
Part4: 仮説に関連するタスクを中心とした、関連研究調査

そして、これらのサーベイを元に検証方針を作成しました。

Graph Convolutionを自然言語処理に応用する Part5

Part5からは、サーベイ結果を基にGraph Convolutionが有効なシチュエーションを探っていきます。今回は実験内容と実験を行うための実装の紹介で、結果は次回以降となります。

medium.com

ただ、この方針は途中でちょっと変えています。当初は転移性能を得たいというのが主目的でしたが、転移は高い精度あってこそなので、まずはその点を検証しました。

Graph Convolutionで自然言語処理を行う(テキスト分類編) Part1

本記事から、Graph Convolutionのテキスト分類における効果を検証してみます。Graph Convolutionの手法としては、前連載で実装したGraph Attention Networkを使用します。

medium.com

仮説を証明するための実験

仮説を証明するための実験として、以下の実装を行いました。

Graph Convolutionの代表的な手法Graph Attention Networkの実装
Graph Attention Network Layerを実装する Part1
Graph Attention Network Layerを実装する Part2
Graph Attention Network Layerを実装する Part3(End)
Graph Attention Networkを利用した、テキスト分類
Graph Convolutionで自然言語処理を行う(テキスト分類編) Part1
Graph Convolutionで自然言語処理を行う(テキスト分類編) Part2
Graph Convolutionで自然言語処理を行う(テキスト分類編) Part3
Graph Convolutionで自然言語処理を行う(テキスト分類編) Part4
Graph Convolutionで自然言語処理を行う(テキスト分類編) Part5

実装は以下になります。

icoxfog417/graph-convolution-nlp

Graph Convolution Network for NLP. Contribute to icoxfog417/graph-convolution-nlp development by creating an account on…

github.com

実験の結果、Graph Convolutionによりベースラインと同等の結果を得ることはできました。しかし、上回るわけではありませんでした。また、既存の研究で良しとされていた係り受け/単語類似度によるグラフより、単純に前の単語に接続を行うようなシンプルなモデルの方が精度が高いという結果でした。

実験結果を受けての考察

最終的な考察は、以下の記事にまとめています。

Graph Convolutionを自然言語処理に応用する Part6

Part6では、Graph Convolutionの性質が活きるタスクの調査を行います。調査はPart4でも行いましたが、今回は調査の観点が異なります。

medium.com

TransformerのSelf-Attentionのように、自然言語処理においてグラフ的な機構が有用な場合はある。しかし、そのこととGraph Convolutionが有効なことは等価ではない。
Graph Convolutionが有効なのは、ノード分類/グラフ構造分類のタスクに落とし込めるケース。文脈情報を獲得したいというモチベーションと、Graph Convolutionの得意領域とはあまり合致しない。
Graph Convolutionを自然言語処理で使うならば、「大規模かつHeterogeneousなグラフで、ノード分類の問題に帰着できる」ケースが適していると思われる。

振り返り

「グラフが有効=Graph Convolutionが有効」ではないという点に早めに気付ければよかったかなという思いはあります(How Powerful are Graph Neural Networks?がなかったら気づいてないかも)。ここに気づけていたら、Part6に割と早い段階で行けたのではないかと。

ただ、実際に自分で手を動かして実装、実験をするというのはやはり良いものでした。最近本業では文書作成の方が多いので、今後もこうしたサーベイは続けていきたいと考えています。ほぼ週一ぐらいのペースでやることにこだわりましたが、見返すとだいぶ記事があり驚きました。やはり継続は力なりと思います。

本連載が、Graph ConvolutionをNLPで使って見たい方の参考になれば幸いです。

Graph Convolutionを自然言語処理に応用する Part7(End)

検証の背景

Graph Convolutionを自然言語処理に応用する Part1

Graph Convolutionを自然言語処理に応用するため、何回かに分けて学習した内容をまとめていきます。内容については、最終的にQiitaなどで1記事にまとめる予定です。

仮説に関連する研究の調査

Graph Convolutionを自然言語処理に応用する Part5

Part5からは、サーベイ結果を基にGraph Convolutionが有効なシチュエーションを探っていきます。今回は実験内容と実験を行うための実装の紹介で、結果は次回以降となります。

Graph Convolutionで自然言語処理を行う(テキスト分類編) Part1

本記事から、Graph Convolutionのテキスト分類における効果を検証してみます。Graph Convolutionの手法としては、前連載で実装したGraph Attention Networkを使用します。

仮説を証明するための実験

icoxfog417/graph-convolution-nlp

Graph Convolution Network for NLP. Contribute to icoxfog417/graph-convolution-nlp development by creating an account on…

実験結果を受けての考察

Graph Convolutionを自然言語処理に応用する Part6

Part6では、Graph Convolutionの性質が活きるタスクの調査を行います。調査はPart4でも行いましたが、今回は調査の観点が異なります。

振り返り

Written by piqcy