2021年1月6日水曜日

機械学習による画像分析を基礎とした薬剤開発

いつも記事を読んでくださり、ありがとうございます。

薬剤の開発において
全ての薬剤候補を人でその薬効と安全性を評価するのは
不可能であると言われています。
人ではなく基礎研究に当たるラットでも難しい
と考えられています(1)。
それには時間もコストもかかるからです。
従って、候補をできるだけ少数に絞って、
その中で動物実験、人での臨床試験に進めていくことが現実的です。
従って、薬剤の開発において重要なのは
どのように絞るか、スクリーニングするか?
ということです。

実際に薬剤の開発においては、
基本的なモデルを立てて、
それを試験管などで細胞レベルから人工組織(オルガノイド)で
想定した特性を示すかどうか?
あるいは計算によって示された候補を
一つ一つ試していく発見的問題解決(ヒューリスティック)な
アプローチが取られると思います。
この段階では比較的多くの薬剤候補を試すことができる
と考えています。
こういった特性評価を
薬剤開発における「Profiling」と呼ぶと理解しています。

このような薬剤候補を絞っていく過程において
近年では人工知能である機械学習が使われることがあります
機械学習の得意とする所の一つは画像分析があります。
例えば、
医療における画像診断は多くの場面があります(3-5)が、
その一部を機械学習によって行うという取り組みは
世界で広く開発されているものだと思います。
そのようなアプローチは薬剤開発の特性解析(プロファイリング)
でも活用出来て、イメージベースの薬剤開発に
貢献するものであると考えています。

Srinivas Niranj Chandrasekaran氏, Hugo Ceulemans氏, 
Justin D. Boyd氏、Anne E. Carpenter氏による研究グループは
機械学習による画像分析を基礎とした特性評価においての
薬剤開発について総括しています(1)。
その内容を参照しながら比較的自由に記述しました。
その情報について読者の方と共有したいと思います。

参考文献(1) Fig.1(a)で示されているように
イメージベースの特性解析を行う場合には
事前に専門家の方が定めた特徴を学習、入力して
それに基づき取り出された画像データが
「多次元の関数空間上の点になる」ということです。
その空間上の点は画像情報が圧縮された点ですから
点と点の距離は「その指標での画像の類似性」を示します。
その時に評価者は点の散布図を見ることができ
集合性が認められる箇所にある点
あるいは特異性の高い点を見つけることができます。
その点は画像ですから
特異性が高い点はどういった画像なのか?
というのをその関数空間上の点をクリックすれば
その画像が表示されるようになります。
例えば、その画像はミトコンドリアに関するものであれば
ミトコンドリアに薬剤がどう作用しているか
という画像が呼び出され、
なぜ他の画像と特異性があるのか?
このことを画像の分析から認知することができます。
あるいは局在化しているところには
どのような特徴があるか?
というのを見出すことができます。
従って、うまく関数空間を定義することができれば
そのネットワークは意味のあるものになります。
そうすると
機械学習を使ってイメージベースで薬剤開発をするときには
その関数空間をどう定義するのか?
それが非常に重要になるという事です。

イメージベースの機械学習による画像分析の場合は
その画像と各オミックス(遺伝子、転写、たんぱく質、代謝)
のデータを1対1で対応させるわけではないですし、
その様な事は現実的に不可能なので
純粋に画像データから読み取れる傾向を見る事になります。
そうした場合、
上で述べた様に人工知能が内部で行っている事の
少なくとも一部は
多次元の関数空間でのプロットだと思っています。
つまり抽象的な画像を数学的に分析していると言えます。
その数学の関数は人が定義し入力する場合もあるし
人工知能が自動的に構築する場合もあるかもしれません。
人工知能が自己的に教師データを作製して
画像分析していくときには
その多次元の関数空間を関数を変えながら、
上手く特徴を洗い出しているといえるかもしれません。
実際に
「自己教師(Self-supervised)データによる
逆畳み込み(decovolution)」
というのがあります(2)。
これは画像の特徴を強調する処理ですが、
おそらくある指標で最適化された関数空間の中で
一連の類似性、コヒーレンシーが認められた場合に
そこの関数のスパイクの振幅を強調させるような
処理を行っていると考えました。
おそらく自己で学習していく際においては
傾向がより強調されるような最適化が行われていくのではないか
と思います。
そうした場合、画像において特徴的な部分を□(四角)で明示したり
あるいはネットワーク空間を表示させることもできるのではないか
と思います。
その場合、重要なのは人が
それぞれのネットワークの点(ノード)をクリックしたときに
実際の画像が表示されて評価できる事と、
局在化していない散逸性の高い点においても分析できるように
しておくことだと思います。

例えば、特定の疾患の検査画像を何百万枚と覚えさせて
その特徴を内部の関数空間にプロットさせておけば
新たに画像を分析させたときに
少しでもその特徴が見つかれば、
その箇所を明示することができるのではないかと思います。
その時には一つとしては
特徴の強化「deconvolution」が採用できると考えます。
その様にすでに結果がわかっている場合はいいのですが
薬剤開発の場合には、スクリーニングの際には
そのように結果ベースで学習させることができないため
集められた画像から「その科学的な意味は未知だけど」
特定の傾向を見出すことができる
という事だと思います。
そうするとそこからの科学的な概念の付加は
その画像条件を再現した実験結果、
あるいは専門家の方による解釈です。

一方、
効果がわかっている少数の薬剤の動画を分析する場合には
静止画が任意の時間解像度で撮影されるわけです。
その一連の動きの特徴を分析するときには
機械学習による画像ベースのアプローチが役に立つかもしれません。
数万枚の静止画を指定して、
例えば、
「ミトコンドリアの特定の位置に多く接触している。」
このような傾向が結果として出たとします。
このような事はおそらく
人工知能による機械学習によって可能だと思います。
そして、ミトコンドリアのその特定の位置を観察すると
そこには重要な分子パターンがあり、
その分子パターンと薬効の関係性があるかもしれない
ということが見出されます。
あるいは
「それとは少し離れた細胞内小器官の動きに特徴がある」
そういったことも見出されるかもしれません。

以上です。

(参考文献)
(1)
Srinivas Niranj Chandrasekaran, Hugo Ceulemans, Justin D. Boyd & Anne E. Carpenter 
Image-based profiling for drug discovery: due for a machine-learning upgrade?
Nature Reviews Drug Discovery (2020)
(2)
Simm, J. et al. 
Repurposing high-throughput image assays enables biological activity prediction for drug discovery. 
Cell Chem. Biol. 25, 611–618.e3 (2018).  
(3)
Cataldo, A. M. et al. 
Abnormalities in mitochondrial structure in cells from patients with bipolar disorder. 
Am. J. Pathol. 177, 575–585 (2010).
(4)
Blanchet, L. et al. 
Quantifying small molecule phenotypic effects using mitochondrial morpho- functional fingerprinting and machine learning. 
Sci. Rep. 5, 8035 (2015).
(5)
Hung, C. L.-K. et al.
A patient- derived cellular model for Huntington’s disease reveals phenotypes at clinically relevant CAG lengths. 
Mol. Biol. Cell 29, 2809–2820 (2018).

0 コメント:

コメントを投稿

 
;