[論文]Machine Learning Predicts Laboratory Earthquakes

Yusuke Stephen Inoue

Published in

Academication

15 min readMar 6, 2017

【一言まとめ】実験室で発生させた人工地震の予知に成功( ランダムフォレスト )

【著者】Bertrand Rouet-Leduc, Claudia Hulbert, Nicholas Lubbers, Kipton Barros, Colin Humphreys, Paul A. Johnson

【日付】2017/2/19

【所属機関】
・ケンブリッジ大学窒素ガリウム研究センター（英国）
・ロスアラモス国立研究所（ニューメキシコ州）

【URL】https://arxiv.org/abs/1702.05774

【Abstract】
Forecasting fault failure is a fundamental but elusive goal in earthquake science. Here we show that by listening to the acoustic signal emitted by a laboratory fault, machine learning can predict the time remaining before it fails with great accuracy. These predictions are based solely on the instantaneous physical characteristics of the acoustical signal, and do not make use of its history. Surprisingly, machine learning identifies a signal emitted from the fault zone previously thought to be low-amplitude noise that enables failure forecasting throughout the laboratory quake cycle. We hypothesize that applying this approach to continuous seismic data may lead to significant advances in identifying currently unknown signals, in providing new insights into fault physics, and in placing bounds on fault failure times.

【Abstract翻訳】
断層の予測は地震科学の基本的ではあるが難しい目標である。ここでは、実験室の断層によって放出された音響信号を聴くことによって、機械学習が断層する前の残り時間を非常に正確に予測できることを示します。これらの予測は、音響信号の瞬間的な物理的特性のみに基づいており、その履歴を利用しません。驚くべきことに、機械学習は、以前は低振幅ノイズであると考えられていた断層帯からの信号を、実験室の地震サイクルを通して、断層予測を可能にする信号として識別します。我々は、この手法を連続地震データに適用することで、現在未知の信号を特定したり、断層物理学に新しい洞察を提供したり、断層時に境界を設定したりする重要な進歩につながる可能性があると想像する。

【まとめ】

・以前は単純な地震間隔の予測が基本的なアプローチであり、誤差が大きかった。また、計器が進歩したといっても地震の前兆を発見できるパラメータがあるとは思われていなかった。

・実験室の断層から記録された音響時系列データに対して、ランダムフォレスト（RF）を適用し、過去の履歴を用いることなく断層の発生を予想できた。

・RFには100以上の統計値を入れている。

・このアプローチは非周期的な断層サイクルに一般化できる。RFが今までに見たことのない条件でタイミング予測を行うことができるという事実は、取得している時系列信号が断層の予測につながる基本的な物理を捕捉していることを示唆している。

・連続的な地震には対応できない

・研究室レベルから地球レベルの予測にしていくのはまだこれから。

【本文のgoogle翻訳】
地震が迫っている可能性があると判断するための基本的なアプローチは、定期的に繰り返される地震特有の地震のイベント間時間（再発間隔）に基づいています。地質学的記録の洗練された解析から推測された地震の再発は、精度が低いにもかかわらず、障害が接近する可能性があることを推測する手段である。重要な手掛かりは、過去の大規模な地震の再発について、さまざまなアプローチを適用して解釈することができます。例えば、アトウォーターは、カスカディア海岸に沿って繰り返された突発的な地震活動の変化と、定期的な大地震に続く津波浸水の証拠について述べています。 1万年前の地震の際に堆積したタービダイト層序学の最近の分析は、カスケード沈み込み帯が巨大地震に対して熟していることを示唆している（図1）。対照的に、地震記録から構築された地震カタログは1世紀だけ存在していたため、San Andreas断層のParkfieldセグメントなど、再発間隔が比較的短い場合にのみ適用できます。事実、特徴的で反復的な地震の背後にある考え方は、よく知られているパークフィールド予測の基礎となっていました。 1857年、1881年、1901年、1922年、1934年、および1966年の同様の地震は、21.9±3.1年ごとに地震のパターンを示唆した。再発間隔に基づいて、1988年〜1993年の間に地震が予想されたが、最終的に2004年に発生した。このアプローチでは、地震の再発は一定の断層で一定ではないため、イベントの発生は大きな誤差範囲内でしか推測できない。
過去15年間で、計測器の品質と密度の大幅な進歩に基づいて予測を進めることができるという新たな希望があります。これらの進歩により、深い断層で発生する低周波地震および地震からのスロースリップおよび関連する地上信号を含む、以前は未確認のスリッププロセスが発見されたことが驚くべき発見につながった。これらの発見は断層すべりの新しい理解をもたらし、地震発生帯への深い断層の結合が解明されるならば、断層の断層の断層予測の進展につながる可能性がある。
計器の感度と密度の進歩は、先駆者かもしれない小さな地震を記録する新しい手段を提供します。音響/地震予兆は、材料にはほぼ普遍的な現象であるように見える。例えば、粒状物質および雪崩の不具合は、しばしば衝動的な音響/地震前駆体を伴い、その多くは非常に小さいことが十分に確立されている。前駆物質はまた、産業および地球物質のスペクトルの脆性破壊においても日常的に観察される。前駆体は実験室の欠陥で観察され、広く地震前に系統的には観察されていない。国際的な地震予知に関する委員会の2011年の結論は、このタイプの[失敗予知]研究の方法論的改善のためのかなりの余地があったと結論付けています」と委員会は公表された結果が肯定的な観察に偏っていると結論付けた。地震前兆の大きさは非常に小さく、したがって頻繁に記録されないか、または未確認となることが想定されていますが、機器が向上するにつれて、大部分またはすべての地震について前駆体が最終的に存在する可能性があります。故障を予兆する他の信号が存在する。
私たちの目標は、機械学習の近年の進歩を、十分に特徴付けられた実験システムからのデータに適用することによって、故障の失敗時間を予測することです。実験室の研究を地球規模に結びつける重要な飛躍ですが、過去の研究から、実験室の前駆物質から計算されたグーテンベルグ・リヒターの関係は、地球で観測される境界内にあるということが分かりました。この類似性は、重要な断層摩擦物理学のスケールの一部を意味する。実験室実験では、地球の複雑な破裂のすべての物理現象を捉えることはできません。それにもかかわらず、実験室から地球に移動する際に開発している機械学習の専門知識は、最終的にはさらなる研究を大規模に導くでしょう。
私たちの実験室フォールトシステムは、二重直接剪断に提出された断層ガウジ材料を含む2フォルト構成です。加速度計は、剪断層から放出される音響放射（AE）を記録する。駆動ブロックによって加えられるせん断応力も監視され（図1、図2a）、せん断速度、ガウジ層の厚さ、摩擦、および加えられた荷重などの他の物理的パラメータも監視されます。摩擦破損（ラボクレーク）の後、せん断応力は増加する（図2a）と摩擦として現れるように、せん断ブロックが変位し、同時にガウジ材料が拡張して強化する。材料が破壊に近づくにつれて、衝撃的AEを放出する多くの小さなせん断破壊を含む臨界応力領域の特性を示す。この不安定な状態は、せん断ブロックが急速に変位し、ガウジ破壊によって摩擦およびせん断応力が急激に減少し、ガウジ層が同時にコンパクトになるという挑戦で結論づけられます。広範囲の荷重および剪断速度条件下で、装置は、単一の実験の間に数百の応力サイクルの間、準周期的にスライドスリップする。インパルス性前駆物質の割合は、失敗が近づくにつれて加速し、次のラボのタイミングが予測できることを示唆している。この作業では、継続的に録音された音響信号の特性を使用して、今後のラボの失敗時間を予測できるかどうかを尋ねます。
我々の目標は、AEデータ（図2b、上）のローカルな移動時間ウィンドウのみを使用して、次の故障（図2a、下）の前に残る時間を予測することである。我々は、障害から記録された連続音響時間系列データに対して、ランダムフォレスト（RF）という機械学習手法を適用する（図2参照）。 RFモデルは、一連の決定木の平均である（図2c）。各決定木は、時間窓から得られた統計的特徴に基づく決定のシーケンスを使用して、次の故障の前に残っている時間を予測する。図2aは、実験中に複数の故障事象を示す実験室せん断応力を示す。
各時間ウィンドウから、RFが次の故障の前に残っている時間を予測するために使用する約100の潜在的に関連する統計的特徴（例えば、平均、分散、尖度、自己相関など）の集合を計算する。図2bは、図4と同じ時間スケールでこれら4つの特徴を示す。複数の故障サイクルを通して、図2aに示す。いくつかの機能は、ストレスサイクル中の早い段階での信号特性の変化に敏感です。示されたすべての機能は、システムがせん断応力臨界に近づくにつれて、障害の直前の信号特性に強く敏感です。
図2dおよび図3は、モデルが一度も見たことのないスリップ事象のシーケンスに対応する音響信号である、試験データに関する故障予測を示す。赤い破線は、次の故障（せん断応力データから得られる）の前に残っている時間を示し、青い線は、RF回帰モデルの対応する予測を示す（「瞬時の音響データからのみ得られる」）。青い影付き領域は、予測の5番目と95番目の百分位数を示します。つまり、森林を構成する樹木の90％がこれらの範囲内で予測を行いました。予測を行うときには、過去または将来の情報は考慮されていないことが強調されています（青色の曲線）。各予測では、単一の時間枠内の情報しか使用されません。このように、システムによって現在放出されている音響信号を聞くことによって、それが失敗する前の残りの時間、すなわちその履歴を利用しないシステムの瞬間的な物理的特性に基づく「今」予測を予測する。
図3は、RF予測をより詳細に示す。我々は、決定係数であるR2を用いてモデルの精度を定量化する。イベントの周期性にのみ基づいたナイーブなモデルは、0.3のR2パフォーマンスしか達成しません。比較すると、RFモデルからの故障予測までの時間は非常に正確で、R2の値は0.89です。驚くべきことに、RFモデルは、故障が差し迫っているときだけでなく、ラブサイクルサイクル全体を通して、正確に故障を予測し、システムがストレスサイクルを通じて故障に向かって連続的に進行することを実証する。インパルス性前駆体は、システムが臨界的なストレス状態にある間のみ観察されるので、これは予想外である。信号振幅分布（例えば、分散および高次モーメント）を定量化する統計は、予測失敗時に非常に有効であることがわかります。全体的な信号振幅の変動を特徴付ける分散は、時間の早い段階で最も強力な単一の特徴です（図2b）。システムが故障に近づくにつれて、第4の瞬間や閾値などの他の異常値統計もまた予測的になる。これらの外れ値統計は、物質が実験室や地球の剪断条件下のものを含めて故障に近づくにつれて典型的に観察される衝撃的な前駆体AE（図4c）に応答している。これらの信号は、ラッシュアーク直前のガウジ内の小さな、観察可能なせん断破壊によるものです（1）。
当社の機械学習解析はスリップ物理学の新しい洞察を提供します。具体的には、故障の直前に発生したAE信号は、以前は雑音であると考えられていたため、見落とされていました。この信号は、遅いスリップに関連する非火山性振戦に似ており、長期間にわたってリンギング特性を示す。重要な違いは、時間の経過とともに震えが孤立していることです。実験室実験では、中央ブロック（図1）が応力サイクルの間にゆっくりと滑り、破損時に一時的に加速する。（4b）は、失敗から遠い生の時系列を示す。この信号は、目で識別し、ストレスサイクルを通して持続することが困難な小さな変調を示す。これらの変調は、信号分散の増加によって測定されるように、障害に近づくにつれて振幅が増加する。信号分散のこの増加は、音響信号によって運ばれるエネルギーが応力サイクル全体にわたって着実に増加することを示す。これらのモジュレーションは、ブロックのゆっくりとした滑りによる断層ガウジの連続的な穀粒運動からのシステマティックな唸り、はけ、チャタリングによるものであると推測します（このシステムの離散要素モデリングはこの推論をサポートします）。私たちのML駆動解析は、スリップ事象が発生したときに蓄積されたエネルギーを急激に放出する前に、システムがストレスサイクルを通じて、わずかながらもエネルギー量を増加させることを示唆しています。
我々のモデルの予測は、実験条件を超えて一般化する。これを実証するために、適用された1つの負荷レベルでシステムを訓練し、異なる負荷レベルのデータでテストし、障害間のイベント間の時間間隔が異なっています。モデルの予測は、負荷レベル全体で精度が保持されていることがわかります。さらに、図5の挿入図に示されるように、より短い再発時間によって応力サイクル周期性が乱された場合、図3に示すように、RFは依然として故障時間を予測する上で優れた仕事をしており、そのアプローチが非周期的な故障サイクルに一般化できることを示している。 RFが今までに見たことのない条件でタイミング予測を行うことができるという事実は、時系列信号が予測につながる基本的な物理を捕捉していることを示唆している。私たちの物理的解釈は、チャタリング信号の分散と高次モーメントが瞬時摩擦とせん断応力状態の指紋であることです — 時系列の分散と他の特徴は、定量的な摩擦状態情報を運び、次のスリップ事象起こります。
私たちが地球に学んだことを適用する際に考慮すべきいくつかの問題があります。実験室剪断速度は、地球よりも大きいオーダーである（5ミクロン/秒対cms /年）。実験室の温度条件は決して地球のものに似ていますが、圧力は流体圧力が大きいときの現場圧力を表すことができます。これらの違いは否定できないが、先に述べたように、実験室から地球までのGR関係は本質的に同じであるため、実験は摩擦のいくつかの本質的な物理学を捉えている。我々は、この実験に適用されたMLが、スリップサイクル中のいつでも音響信号の瞬時解析に基づいて正確な故障予測を提供し、以前には識別されなかった信号を明らかにすることを示す。これらの結果は、地球の地震信号のML解析を促進するのに十分なはずです。私たちの知る限りでは、これは失敗時間を推測する目的で連続音響震源データにMLを適用する最初の方法です。これらの結果は、地震カタログのみに基づく以前の分析は不完全である可能性があることを示唆している。特に、MLベースのアプローチは、潜在的に関連する変数の大きな空間内のパターンを自動的に検索することによって、人間の偏りを緩和する。
私たちの現在の目標は、このアプローチを実験室システムに最も似た地球の問題に適用することによって、研究室から地球へと徐々に拡大することです。実験室への興味深いアナロジーは、小さな繰り返し地震を示す断層であってもよい。例えば、Parkfield近くのSan Andreas断層に位置する断層パッチは、このような挙動を示す。これらの欠陥パッチのリピータは、実験室と同様にチャタリングを発している可能性があります。もしそうなら、この信号を坑井と地表の計器で記録することはできますか？地震のタイミングに関する情報（地震の大きさはもちろん）に情報を提供するには、連続地震または他の地球物理データに適用されるMLアプローチが成功するかどうかに関わらず、未知の断層物理学に関連する未確認の信号が現れる可能性がある。さらに、この方法は、産業および天然材料の広いスペクトルにおける故障予測に有用であり得る。テクノロジーは、計装、機械学習、膨大なデータセットと高速コンピュータの処理能力の劇的な進歩の合流点にあります。したがって、地震科学の潜在的に顕著な進歩のための段階が設定されている。

[論文]Machine Learning Predicts Laboratory Earthquakes

Written by Yusuke Stephen Inoue