SomaticSignatures: inferring mutational signatures from single-nucleotide variants. — Bioinfomatics2015
【一言まとめ】変異情報に対し既存のNMF手法をR上で簡単に使えるBioconductorパッケージとして実装
【著者】Gehring JS1, Fischer B2, Lawrence M3, Huber W4.
【所属機関】European Molecular Biology Laboratory, Genome Biology Unit
【URL】https://www.ncbi.nlm.nih.gov/pubmed/26163694
【Abstract】
Mutational signatures are patterns in the occurrence of somatic single-nucleotide variants that can reflect underlying mutational processes. The SomaticSignatures package provides flexible, interoperable and easy-to-use tools that identify such signatures in cancer sequencing data. It facilitates large-scale, cross-dataset estimation of mutational signatures, implements existing methods for pattern decomposition, supports extension through user-defined approaches and integrates with existing Bioconductor workflows.
【Abstract翻訳】
突然変異サインは、基本的な突然変異プロセスを反映することができる体細胞単一ヌクレオチド変異の発生パターンである。 SomaticSignaturesパッケージは、癌のシーケンシングデータにおけるそのようなシグネチャーを特定する、柔軟で相互運用可能で使いやすいツールを提供します。 これは、突然変異シグネチャの大規模かつクロスデータセット推定を容易にし、パターン分解のための既存の方法を実施し、ユーザー定義アプローチによる拡張をサポートし、既存のBioconductorワークフローと統合します。
【どんなもの?】
変異情報に対し既存のNMF手法をR上で簡単に使えるBioconductorパッケージとして実装した。
【先行研究と比べてどこがすごい?】
既存の実装では入力、出力共に他のワークフローとの互換性がなかったが、これは可能。ユーザーによるカスタマイズを提供する。
【技術や手法のキモはどこ?】
・NMFでは分解後の行列積と共に現れる誤差行列を最小化している。学習結果の中でどのMSが寄与するかの判定のため?PCAも共に提供している
・Vcfファイル、VRangeオブジェクトへの対応をした。context情報を得る部分も自動化した。視覚化も簡単にできる。
【どうやって有効だと検証した?】
【議論はある?】
生物学的に意味のあるまとまりへのクラスタリングが難しい。変異率とRNA発現プロファイルに基づく分類を今後予定している。
【次に読むべき論文は?】
【手法詳細】
【関連リンク】