人間のように「考える」AI:脳の「同期」を模倣するContinuous Thought Machineの可能性
もしAIが私たち人間のように、じっくりと考え、その思考の過程を見せてくれるとしたら?
実は、日本のAIスタートアップであるSakana AIが、この常識を覆す可能性を秘めた、Continuous Thought Machine (CTM) という新しいAIモデルを発表しました。彼らが注目したのは、驚くべきことに「脳の時間」という、これまで多くのAIモデルが見過ごしてきた要素です。
この記事では、CTMがどのようにしてこの「時間」を利用し、従来のAIと何が違うのか、そしてそれがAIの未来にどのような影響をもたらすのかを詳しく掘り下げていきます。

この記事の内容は上記のGPTマスター放送室でわかりやすく音声で解説しています。
従来のAIとCTMの根本的な違い:ニューロンの「時間」と「同期」への着目

現代のディープラーニングの核となる人工ニューラルネットワークは、生物の脳からインスピレーションを得て開発されました。しかし、その基礎となる人工ニューロンモデルは1980年代から本質的にはほとんど変化していません。
従来のモデルでは、ニューロンの出力は単純に「どれだけ強く発火しているか」という「発火量」だけで表現されてきました。これに対し、実際の生物学的研究では、ニューロンの「いつ発火するか」というタイミング情報や、複数のニューロンが協調して活動する「同期情報」が脳機能において決定的に重要であることが明らかになっています。
たとえば、「スパイクタイミング依存性可塑性」と呼ばれる現象では、あるニューロンが他のニューロンの発火に対してどのタイミングで反応するかが、脳の学習メカニズムの基盤となっています。CTMはこの生物学的知見を取り入れた画期的なモデルなのです。
CTMの革新的特徴:「思考」プロセスの可視化
CTMの最も革新的な特徴は、その「思考」プロセスを観察・可視化できる点にあります。
従来のAI
一般的なAIシステムは、例えば画像分類の場合、ニューラルネットワークに一度データを入力するだけで瞬時に結果を出力します。
CTMの場合
これに対しCTMは、タスク解決のために複数のステップを踏んで「思考」します。この思考プロセスはCTM内部の「思考次元」で実行され、静的データでも逐次的データでも同様に推論が可能です。つまり、人間が考えるように段階的に問題を解決していくのです。
CTMが示す多様なニューロンダイナミクス:生物の脳への類似性

CTMの内部で観察されるニューロンの活動ダイナミクスは、従来の人工ニューラルネットワークとは大きく異なります。LSTMのような古典的なAIモデルのニューロン活動は、比較的単調で多様性が低い傾向があります。一方、CTMは非常に多様なニューロンの振る舞いを示します。
たとえば、異なる周波数や振幅で振動するニューロンが見られます。中には、一つのニューロンが複数の周波数を示すこともあれば、タスクを解いている時だけ活動するニューロンもあります。
この多様なダイナミクスは、ソース記事でも「非常に多様なニューロンの振る舞いを持っていることを明確に学習している」と強調されています。そして、これらの振る舞いが完全に「創発的」であるという点は特筆に値します。
つまり、これらの多様な活動パターンは、CTMの設計時にあらかじめ組み込まれていたものではなく、タイミング情報をモデルに追加し、様々なタスクを学習した結果として自然に現れた副産物なのです。これは、複雑なシステムが単純な要素から予期せぬ振る舞いを生み出す「創発現象」の一例と言えるでしょう。
まとめ:なぜ脳に学ぶのか? CTMが切り拓くAIの未来と可能性

Sakana AIは、脳が持つ機能の一部をAIに取り入れないことは大きな機会損失だと考えています。2012年の「ディープラーニング革命」が、脳にインスパイアされたニューラルネットワークによって引き起こされたように、これからも脳からインスピレーションを得ることで、AIはさらなる進歩を遂げられるはずだと彼らは主張します。
CTMは、このAIと神経科学の間のギャップを埋め、より脳に近い振る舞いを示しつつも、実用的なAIモデルとしての能力を両立させる最初の試みです。詳細な情報やインタラクティブなデモは、彼らの公開しているInteractive Reportや技術レポート、コードで確認できます。
参考)Introducing Continuous Thought Machines