3. オミクスデータを用いた構造生成器28図3 TRIOMPHEの概要同じ化学構造が出力される。ここで重要となるのが、VAEの中間層に相当する、潜在空間である。潜在空間座標は多次元の数値ベクトルとして表現されており、それ自体の物理的・化学的意味を解釈することは不可能である。しかし、潜在空間座標は、1つの化学構造情報を表現しており、類似した化学構造に対応する座標は潜在空間上で近傍に位置する性質がある。潜在空間座標を適切に選択し、decoderにより復元することで、新規化学構造式を取得できる。潜在空間は、「化学構造の地図」と例えることができる。 VAEを用いた深層学習型構造生成器の先駆けとなったのはChemicalVAE13)であり、潜在空間探索により、化学構造に関する数種類の指標について最適化することに成功している。一方、潜在空間座標から化学構造への復元成功率は1割程度と性能に難があることから、VAEを改善した構造生成器が多数報告されている14~16)。深層学習型構造生成器は、膨大なルールを事前に設定することなく構造を生成することができることから、人間の先入観にとらわれず、膨大な化学構造の特徴に即した構造を取得することが可能となり、医薬品設計の新たな地平を切り開くことが期待されている。 次世代シーケンサーをはじめとする解析技術の発展により、包括的な生体分子応答情報をオミクスデータとして取得できるようになった。さらに、取得したデータをデータベースに集約・公開する動きも盛んである。遺伝子発現量を数値ベクトルとして表現した遺伝子発現プロファイルの解析により、疾患治療標的の予測や化合物-タンパク質間相互作用予測、ドラッグリポジショニング予測などが可能となり、創薬の効率化に寄与する事例が報告されている17,18)。これは、遺伝子発現プロファイルが、生体情報を包括的に保持していることを示している。一方、遺伝子発現プロファイルを用いて医薬候補化合物の構造を生成しようとする試みは発展途上であり、その1つとしてBayer社で開発された深層学習型構造生成器19)があげられる。このモデルは、遺伝子発現プロファイルを直接的に深層学習モデルに入力し、構造生成をはじめて試みたという点で先進的な研究である。一方、遺伝子発現プロファイルを直接化学構造へ変換することの妥当性については議論が不十分である。 筆者らは、化合物をヒト細胞に添加した際の応答として得られた遺伝子発現プロファイル(化合物応答プロファイル)と、分子生物学的な手法により遺伝子摂動(標的タンパク質の遺伝子ノックダウンや遺伝子過剰発現)を導入した際の応答として得られた遺伝子発現プロファイル(標的摂動プロファイル)との間に相関関係がある点に着目し、遺伝子発現プロファイル間の相関関係を利用した新規構造生成器であるTRIOMPHE(TRanscriptome-basedInferenceandgenerationOfMoleculeswithdesiredPHEnotypesbymachinelearning)を開発した。TRIOMPHEの概要を図3に示した。最初に、標的摂動プロファイルベクトルと化合物
元のページ ../index.html#28