MEDCHEM NEWS Vol.34 No.3
54/64

4. 「情報時代」のAI関連基本技術と原理のか1744-1. AI技術の歴史と種類 AIの歴史は長く、1950年代のアラン・チューリングから展開されてきた。その後、何度も盛衰を繰り返しつつ現在に至っている。形式的には大きく2分類され、ルールベース型とネットワーク型の2種類となる。現在展開されている種々の生成AIは、人間の脳神経の働きや仕組みを取り入れたネットワーク型である。本稿では人間の知的・創造的業務をこなすという点で、ChatGPTに代表される大規模言語モデル(LLM)を中心に討論する。このAIの特徴は極めて膨大な量の学習を行うという点であるが、画像、音声、その他の生成AIも相対的に大きな学習量を必要とする。したがって本稿では、総ての生成AIを対象として議論する場合は「(大規模)生成AI」と表記する。なお、大規模言語モデルが中心となる議論をするときはそのまま大規模言語モデル(LLM)として表記する。4-2. 現在汎用的に展開されているAIと(大規模)生成AIの違い的・創造的業務を支援可能とすることを最大の特徴とする最新のAIであり、従来型の予測・判定・解析型AIと根本的に異なる能力を有する。ChatGPTは、機能的に大規模言語モデル(Large Language Model:LLM)として分類される。このLLMは古代から近代そして現代に至る数百年の期間において研究者の専任業務であった知的・創造的業務を支援可能とした。さらに多種多様な生成AIを加えた(大規模)生成AI群は「情報時代」を支える基本技術となる。 現在「コンピュータ時代」から「情報時代」へと時代が移行しつつある。情報時代の革命はAI革命と称されており、AIが基本技術となっている。本項ではAIについて、簡単にまとめてみる。AIにも種類があり、なぜ情報時代のAIが革命を起こすのかを考えてみる。 現在展開されているAIはネットワーク型であるが、機能的にはデータサイエンスの一手法となり、データの予測、決定、解析等の事項を実施目的とする。本稿で議論する(大規模)生成AIもネットワーク型ではあるが、学習したさまざまな情報を基本として新たにデータを生成することが可能なAIである。特にChatGPTのよう4-3. 大規模言語モデルとは 大規模言語モデルが人間の知的・創造的業務を支援可能であることは、現在までのAIの限界を超えたことを意味する。ChatGPTは当初、言語解析の技術から始まっており、ネットワーク型で、かつ深層学習が基本であった。したがって文章解析等が基本機能であり、他の多くの言語解析AIと同様に高度な知識や創造的活動を支援することはできなかった。しかし、ChatGPTがこの限界を超えた機能を獲得して、AI革命を起こした。4-4. ChatGPTが、なぜ知的・創造性を有するのか 通常実施されてきた言語モデルAIとChatGPTのような大規模言語モデルAIはともに深層学習を基本とするネットワーク構造を有するが、決定的な違いは学習量の違いである。従来の言語モデルではサンプルデータや学習パラメータ数は数千万レベルが常識だった。しかし、ChatGPTはその公開版のChatGPT-3.5で用いられたパラメータ数は1.75兆個であり、有料版のChatGPT-4は約100兆個とされている。パラメータ数は計算法により変化するが、通常のAIによる学習数と比較して桁違いに大きな数の学習数であることがわかる。4-5. 大規模言語モデルの学習量が増えると何が起こるな大規模言語モデルは、現在まで技術の適用が不可能であった人間の知的・創造的業務の領域まで踏み込んでおり、正に革命といえる強力なAIである。この高度な機能を最大限に生かすことが、今後の「情報時代」における創薬研究をはじめとしたさまざまな研究の展開や発展に重要となる。 大規模言語モデルが従来のAIでは実施不可能であった知的・創造能力が必要な研究業務をこなせる理由や基本原理は明確に判明していない。事象的には、「創発(Emergence)」が起きたためとされる。「創発」とはAIモデルがデータの学習により、新しい情報や知識を発見する能力(すなわち、知識や創造能力)を有する現象とされる。この「創発」が起こるのはAIの学習量がある一定量を超えた時点で発生し、知的・創造能力が生成する。その後は、学習量が増えるにつれて知的・創造能力の内容や精度が比例的に向上することが知られている。この一定量は現在のAI学習の常識量とは桁外れに多い10の22乗とされており、これ以上の学習量がなけ

元のページ  ../index.html#54

このブックを見る