Druglikenessについてのよもやま話

こちらは創薬 Advent Calendar 2017#souyakuAC2017)20日目の記事です。

Rule of five

Druglikeness (薬らしさ) が創薬トピックスになったのは90年代後半からだと思います。きっかけはChemical Space 10⁶⁰問題とPfizerのLipinskiが発表したRule of five (Lipinski’s rule) です。

分子量500以下で考えうる有機化合物が10⁶⁰個という数字の精度は議論の余地があります。しかし、当時のメガファーマの化合物ライブラリでも10⁷程度であり、ケミカルスペースを網羅することは現実的ではないと世界中が感じました。
1997年に発表されたRule of fiveはDruglikenessとは謳っておらず、Ph2以上の経口薬の物性計算値の傾向を解析したのみでした(Lipinskiは後に”数字遊び”と表現)。しかし、シンプルかつキャッチーなルールであったため、非ペプチドコンビケムとHTSという並列合成/高速評価の普及に付随してDruglikenessの指標として世界中を席巻しました。

Rule of five
- 水素結合ドナー≦5
- 水素結合アクセプター≦10
- 分子量≦500
- CLogP≦5

Rule of fiveで用いられる記述子はscientificにも妥当であり、初期の指標の中では非常に優れたものでした。その後は亜流としてLead化合物用のRule of threeなども登場しました。
しかし、Rule of fiveにはいくつかの課題がありました。記述子間の独立性、ハードカットオフ、芳香環問題です。

記述子間の独立性とハードカットオフ

水素結合ドナー/アクセプター数やClogPは互いに独立な記述子ではありません。また、非常に覚えやすいですが分子量500がクライテリアというのは恣意的であり、分子量499はOKで分子量501はNGというハードカットオフはかなり乱暴な議論です。アステラスのOhnoらの論文が嚆矢となり、記述子間の相関やDruglikenessの定量化について報告が相次いだのは2010年頃の話でした。

Maryland大のOashiらが提唱した4D BAは記述子間の相関性を意識しながらWDIの化合物群の確率分布を計算し、ハードカットオフのRule of fiveを単一のスカラー量の指標へと変換しています。新たな記述子が必要な場合においても、次元の拡張は容易であり適切な教師化合物情報があればnD BAを計算することもできます。

中枢薬に特化した定量的指標としては、PfizerのWagerらが発表したCNS MPOなどもあります。

芳香環問題

Rule of fiveの提唱と同時期に広まりLipinskiが考慮できなかったファクターがありました。鈴木カップリングを始めとするクロスカップリング反応です。
その後に創薬標的として注目されたKinaseのATPバインディングポケットの平面性が高いことなどもあり、合成化合物の芳香環は急増しました。
しかし、芳香環によるπ-πスタッキングの増加は溶解性と密接に関係します。

溶解性の予測としてYalkowskyらが提唱したLogS (溶解性のLog値)の予測式General Solubility Equation (GSE) は以下で表されます。

LogS = -LogD-0.01([melting point] -25)+0.5

2010年にGSKのHillらは、融点に対して芳香環の影響が非常に大きいことに注目し、GSEを大胆に近似したSFI (Solubility Forecast Index)を提唱しました。

SFI = CLogD(pH7.4)+#Ar

#Arは芳香環の数, ナフタレンなどの二環式は2つとカウント
後にPFI (Property Forecast Indices) として概念を拡張した。

ちなみに芳香環の数は溶解性のみならずADMET全般において重要なファクターであり近年過剰に芳香環が使われているという警鐘は、前年の2009年にも同じGSKのRitcheらによって報告されていました。

他にもWyethのLoveringらが2009年に提唱したFsp3 (sp3炭素の割合) なども芳香環に注目した記述子です。

QEDの登場

前述したとおり、2010年前後はDruglikeness研究の分野において重要な時期でした。
その中で2012年にDundee大のHopkins (ex. Pfizer)らが発表したのがQED (Quantitative Estimate of Drug-likeness)です。

Rule of five記述子のMW (分子量), HBA (水素結合アクセプター), HBD (水素結合ドナー), ALogP (ClogPの代替, Biovia社の分配係数予測) に加えて、tPSA (トポロジカル極性表面積), ROTB (回転可能結合数), AROM (芳香環の数), ALERT (忌避構造の数) を線形結合して、経口承認薬群からの距離で正規化しています。
2010年前後ではLogPではなくLogD (電離を考慮した分配係数)が重要という言説が強かったですが、CLogDの予測精度が高くないと判断してCLogPを採用しています。

QEDはあえて記述子間の相関を考慮していません。これはRule of fiveのシンプルさに着目し、メディシナルケミストが改善の方向を見出しやすくするためです (複合関数にしてしまった場合、どのような変換をすれば改善するかがわかりにくくなります)。
その後もセレクションが続くような場面では4D BAを重視し、メディシナルケミストが参画して合成がはじまる前後ではQEDを重視するのが適切なのかもしれません。

また、QEDの教師化合物を承認薬から特定の標的タンパク質の既知阻害剤へと変えることで、特定の標的にフォーカスした指標としたQEXなどの応用例もあります。


忌避構造

これは要らないという部分構造は忌避構造 (アラート構造, 構造フィルター) と呼ばれています。
初期では酸ハライドやアセタールなど化学的に不安定な構造がピックアップされていましたが、製薬会社毎に様々なルールが追加されていきました。極端な例としては代謝物が変異原性を示す可能性があるためにアニリンを忌避構造に加えていた会社もあるようです。
これらは各社の機密情報として表に出ていませんでしたが、最近ではQEDのALART構造の他にもLilly Medchem RulesやPAINS フィルターなど、多くの忌避構造リストが公開されています。

他方で一時期過度にシビアな忌避構造が増え過ぎたのは業界の反省点でした。現在でもどこまでを忌避構造とするかは統一した見解になりにくく、集合知のような採点をしている報告も多いです。


活性とのバランス

ここまではあくまでも化合物の構造のみで優劣を判断した、Druglikenessの話題です。

実際の創薬プログラムではスクリーニングヒットからHit to Lead(H2L, ヒットエクスパンジョン, リードジェネレーション)、Lead Optimization(LO)といった過程を経て化合物をブラッシュアップしていきます。正直なところ、結合活性だけを気にするのであればMedicinal Chemistは化合物をある程度のレベルまでは仕上げる事ができます。

その中で標的に対する活性値だけにとらわれると、高脂溶性や高分子量の化合物に意識がむいてしまったり、オフターゲットや薬物動態や毒性の面で望ましくないプロファイルになってしまいます。そのため、化合物の物性と活性のバランスを考慮する必要があります。

多くの指標が提唱されていますが、ここでは2つの重要な指標を紹介します。LEとLLEです。

LE (Ligand Efficiency)

LEは後にQEDを提唱したHopkinsがPfizer時代の2004年に発表した指標です。

まず1999年にPennsylvania大のKuntzがMaximal affinity of ligandという考え方を示し、HAC (Heavy Atom Counts: 重原子数)15以上の時にはほとんど一原子あたりの結合自由エネルギーは増加しないとしました。

Hopkinsはこの考え方をとりいれ、LEを下記のように定義しました。

LE = ΔG/HAC = -RTlnKd/HAC ≈ 1.36 pKd/HAC

Kuntzが言うとおり一原子あたりのMax affinityが存在するならば、HTSからヒット骨格を選択して最適化研究を行う中で、LEが下がる事はあっても上がる事はありません。最終的に分子量500MW (平均HAC38個) を有してKd = 10 nMの薬剤を創出するには、1重原子あたりLE 0.29 kcal/molが必要となりヒットの段階で最終物の活性の上限値が予測できます。
活性のみを指標としてヒット選択を行うと、高分子量中活性の化合物に意識がとらわれてしまい、LOの段階で活性が頭打ちになる可能性が生じます。しかし、LEを指標にする事でバイアスを取り除いて低分子量低活性のヒットから、最終的に強活性となりうる化合物をピックアップする事が有用としました。

LEに関しては元の理論を気にせずにIC50などにまで拡張して使う研究者も多いです。この場合はLEの絶対値による最終活性予測はあまり意味をなさず、同一スクリーニング系での骨格の比較にしか使えません。
また、結合モードが違う場合にも注意が必要です。例えばtype 1とtype 2のkinase阻害剤を比較する際に、type 2は分子量が大きくLEでは不利になりますが、細胞系でのATP濃度の影響を受けにくいため、細胞系でのリン酸化などを指標にすると優劣が逆転する事もあります。

後の研究で、KuntzのMax affinityは重原子数15以上でも厳密には一定ではなく、単純にLEで比較するとサイズが小さいFBDDのヒットを過大評価する点が指摘されています。それを補正したLEとしてアステラスの%LEやJ&JのFQ (Fit Quality) なども提唱されています。

いずれにしてもLEはHit selectionからH2Lの段階でパフォーマンスを発揮しやすいと感じます。

LLE (Lipophilic Ligand Efficiency)

これはLEと名前が近い事もあり、LEの仲間と考えがちですが、全く違う指標です。LEは主薬効を分子サイズでスケーリングしたものに対して、LLE (LipE)は副作用リスクを数値化したものです。こちらは同時期に独立して複数社から発表されています。

https://www.slideshare.net/pwkenny/ligand-efficiency-metrics-n

世界的にはLEやLipEほど有名ではないかもしれないですが、第一製薬(現第一三共)の小林がSAR newsに発表したCALTA理論は非常に優れた論文です。

http://bukai.pharm.or.jp/bukai_kozo/SARNews/SARNews_11.pdf

小林は膜タンパク質阻害剤プロジェクトのpIC50-LogDを散布図で可視化した際に斜辺-1の逆三角形にプロットされる事に気付き、非特異的な見かけの活性を排除した‘真の活性’を提唱しました。
2007年にAstraZenecaのLeesonがLLEを, 2009年にPfizerのRyckmansがLipEを発表しましたが、3つを並べてみるとほぼ同様の指標である事がわかります。

真の活性 = pIC50-LogD
LLE = pIC50 (or pKi)-LogD (or CLogP)
LipE = pIC50 (or pEC50)-CLogP

これらは、使う実測値がやや異なったり実測値ではなく計算値を用いたり微妙に数値のずれは生じます。しかし、経験則であるにも関わらず、いずれの論文も係数が付かずに活性10倍向上とLogP/Dが1下がるのは等価としている点は興味深いです。

小林は膜タンパク質阻害剤プロジェクトにおけるADME面から着想していますが、その後のトレンドではもっと標的が一般化しており、また、ADME以上にToxの指標、先ほど述べたとおり未知のOff targetに対するリスク指標として捉えられています。そのため、LO段階 (活性のみではなくADMET全体を含めたマルチパラメータ最適化の段階)で用いられる事が多いように感じます。

その他にLEとLLPをmixしたGedeon RichterのLELPやAstexのLLEATなど、多くの指標が提唱されています。また、LE重視の流れに批判的な学者もいます。この辺りは切りがないのですが、Practical Fragmentsによく紹介されています。

最後に

Lipinskiはこのように述べた事があります。

“A full Outlook calendar is an innovation killer”

あくまでもDruglikenessは指標です。LEもLLEも (あるいはIC50も) 万能の指標ではないです。あくまでもリスクファクターの定量化であって、指標にとらわれすぎることは望ましくないと考えます。
Druglikenessが低い化合物に注目する場合には、そこにリソースを投入したい側に説明責任が生じ、進むのには指標が低いなりの覚悟が必要なだけです。

「覚悟」とは!!
暗闇の荒野に!!進むべき道を切り開く事だッ!

Araki H. JOJO’S BIZARRE ADVENTURE Tokyo: Shueisha Inc.;

Druglikenessは使用上の注意をよく読み用法用量を守って正しく使いましょう。