(https://www.nibiohn.go.jp/mine/)3.AIとオープンプラットフォーム122図3 オープンプラットフォーム「峰」 で、これら300例を超える肺生検の試料のうちの約250例について多層オミックス(全ゲノムシーケンス、RNAシーケンス、およびDNAメチル化アレイ)解析が完了している。一方、血液からは血清、血漿、および末梢血単核球(PBMC)のオミックスデータを収集している。プロテオーム測定は、血清中エクソソームに含まれるタンパク質をDIA(Data-Independent Acquisition)法により同定・定量している。世界的に見ても1,000検体レベルでの大規模プロテオーム解析を実施した例はほとんど見当たらないが、NIBIOHNでは、多検体処理のため血清からのエクソソームの精製および質量分析の前処理の自動化技術を取り入れることで、現在までのところ900症例に対し2,000種類を超えるタンパク質のデータを取得することに成功している。同様に血漿のmiRNA-seq(約750症例)、PBMCから抽出したDNA(約700症例)の全ゲノムシーケンス(depth 30)についても完了しており、引き続き未測定サンプルのオミックスデータの収集を進める予定である。 このように神奈川コホートでは1,000を超える症例に関する詳細かつ網羅的な診療情報とそれに紐づく多層オミックスデータを含む、世界に類を見ない大規模IPFデータベースを構築している。創薬標的や患者層別化マーカー等のデータ駆動的探索に役立つものと期待している。 IPFは前述のとおり多彩な間質性肺炎の中の1つの病型であり、その鑑別は非常に難しい。また、一口にIPFといってもその実態は均一ではなく、かなりヘテロな集団である。IPFをAIで解析するとどのような分類が出てくるかは非常に興味があるところだろう。 NIBIOHNと国立研究開発法人 理化学研究所 革新知能統合研究センターは、患者集団間の類似度をあらかじめ定義・算出しなくても患者層別化が可能な新規アルゴリズム、「サブセットバインディング」(Subset Binding:SB)法を開発した。SB法は複数のデータセット間で相互に関連する属性情報を出力できる。異種のデータセット間でも動作するところが強みであり、例えばオミックスデータのような分子に関する情報と診療情報を入力すると、「分子AとBが増える一方で分子Cが減少している患者は診療情報の項目X、Yが当てはまる」というルールが出力される。これを応用すれば、入力データの組み合わせをいろいろと変えることによって、患者層別化のみならずバイオマーカー探索や疾患発症メカニズムの推定等、広範な応用が可能となる。NIBIOHNでは、PRISMで先行して収集が完了している大阪大学コホートのIPFデータ(プロテオームデータと診療情報)を用いて、SB法による患者層別化を行った結果、新規な創薬標的候補分子を見出しており、現在、その分子の妥当性を検証している。 NIBIOHNでは、PRISMで構築した疾患データベースおよびAIを幅広く公開・共有するためのオープンプラットフォームの構築を進めている(図3)。PRISM参画機関が開発した臨床データを解析するためのAIを、データサイエンスの特別なスキルがない研究者でもまるでスマホのアプリのように簡単な入力とクリックを繰り返すことで解析結果が得られるツールとして公開する予定である。現在、公開にむけた作業を実施中であるが、すでにオープンプラットフォームのホームページを一部公開しているので、将来提供を予定しているデータやAI(プログラム)をチェックしてみてほしい。図3に示すように、ホームページ上段には連峰が描かれている。一つひとつの山の峰はPRISMに参画する研究者が苦心してつくったデータベースやAI等の成果物をイメージしており、これらが多くの研究者に使っていただくことで、もっとよいものに磨き上げられ、また新しいアイデアが吹き込まれることで、より高く壮大な連峰へと成長することを願い、このオープンプラットフォームを「峰」と名付けている。
元のページ ../index.html#10