最新AIの思考は読めるのか?Sakana AIが生んだ新モデル「CTM」の驚き

AI活用ブログ
AI活用ブログ

脳の「同期」を模倣するContinuous Thought Machineの可能性

近年、AI技術は目覚ましい進化を遂げ、私たちの生活やビジネスに不可欠な存在となりつつあります。画像認識、自然言語処理、自動運転…驚くべき能力を示すAIですが、一方で「なぜそう判断したの?」と問われると、その思考プロセスがブラックボックス化しているという課題も指摘されてきました。まるで魔法のように答えを出すAIですが、その内部で何が起きているのか、人間には理解しにくいのが現状です。

しかし、もしAIが私たち人間のように、じっくりと考え、その思考の過程を見せてくれるとしたら? 実は、日本のAIスタートアップであるSakana AIが、この常識を覆す可能性を秘めた、Continuous Thought Machine (CTM) という新しいAIモデルを発表しました。彼らが注目したのは、驚くべきことに「脳の時間」という、これまで多くのAIモデルが見過ごしてきた要素です。

この記事では、CTMがどのようにしてこの「時間」を利用し、従来のAIと何が違うのか、そしてそれがAIの未来にどのような影響をもたらすのかを詳しく掘り下げていきます。この記事を読めば、最新AIの進化の方向性とその可能性について、より深く理解し、今後の技術動向を予測するヒントが得られるはずです。

この記事の内容は上記のGPTマスター放送室でわかりやすく音声で解説しています。


今なら助成金活用で最大75%OFFと大変お得にご利用いただける、AI・ChatGPT活用研修サービスがご好評をいただいています。ご興味のある方は以下のリンクから、助成金の活用方法やサービス内容が分かる資料をダウンロードいただけます。

AI・ChatGPT活用研修サービスの紹介資料ダウンロードはこちら(無料)

従来のAIとCTMの根本的な違い:ニューロンの「時間」と「同期」への着目

現代のAI、特にディープラーニングの中核をなす人工ニューラルネットワークは、生物の脳に触発されて生まれましたが、その基礎となる人工ニューロンモデルは、1980年代から大きく変わっていません。この従来のモデルでは、ニューロンの出力は単に「どれだけ強く発火しているか」という「発火量」を示す一つの値で表現されます。しかし、生物学的な脳の研究からは、ニューロンが「いつ発火するか」というタイミングの情報や、複数のニューロンが同期して活動すること(同期情報)が、脳の機能にとって極めて重要であることが強く示唆されています。例えば、特定のニューロンが他のニューロンの発火に対してどのようなタイミングで反応するかを示す「スパイクタイミング依存性可塑性」は、脳における学習の基礎となります。

Sakana AIは、この生物の脳におけるタイミング情報の重要性に着目し、AIの根本的な再設計を試みました。彼らが開発したCTMでは、人工ニューロンに自身の過去の振る舞いの履歴へアクセスできるようにしました。これにより、ニューロンは単に現在の状態だけでなく、過去の異なる時点からの情報に基づいて次の出力を決定できるようになります。さらに、CTMの主要な振る舞いは、これらのニューロン間の「同期」に基づいています。つまり、CTMはタスクを解決するために、タイミング情報を利用してニューロン同士が協調・同期することを学習するのです。Sakana AIは、このアプローチが、従来のAIモデルでは見られない、より豊かなダイナミクスと多様なタスク解決行動を生み出すと主張しています。この「時間」と「同期」への着目が、CTMを従来のAIと一線を画す決定的な違いであり、認知の中核にある重要な特徴を再考した結果なのです。CTMは、この新しい時間次元、豊かなニューロンダイナミクス、同期情報を活用してタスクについて「思考」し、回答を出す前にプランを立てることができるモデルです。

CTMの「思考」プロセス:人間のように考え、過程を見せる能力

CTMの最大の特徴の一つは、その「思考」プロセスを観察・可視化できる点です。従来のAIシステムが、例えば画像の分類をニューラルネットワークへの一回の入力で瞬時に行うのに対し、CTMはタスクを解決するために複数ステップをかけて「思考」することができます。この思考プロセスは、CTMの内部にある「思考次元」で完全に実行されます。データ自体は静的なものでも逐次的なものでも構わず、CTMは同じように推論できます。

この思考プロセスが最もよく現れるのが、CTMがタスクを解く際の「注意(アテンション)」の動きです。例えば、迷路を解くタスクでは、CTMは2次元の迷路画像を与えられ、脱出のためのステップ(左へ、右へなど)を出力します。これは、単に経路を視覚的に示すのではなく、迷路の構造を理解し、解決策をプランニングする必要がある難しい課題です。驚くべきことに、CTMは迷路を解く際に、まるで人間が迷路を辿るように、経路に沿って注意を動かす非常に解釈可能なアプローチを学習しました。この注意パターンを可視化することで、CTMが思考の各ステップで迷路のどの部分に注目しているのかを知ることができます。この行動は、CTMに明示的に設計されたものではなく、モデルのアーキテクチャから自然に創発したものです。さらに、より多くの思考ステップを与えると、訓練時よりも先まで経路を追跡し続けることが確認されており、一般的な解法を学習したことが示されています。

画像認識タスクでも同様です。CTMは、画像を一度に見るのではなく、複数ステップをかけて画像の異なる部分を調べながら判断を下します。これにより、AIの行動がより解釈可能になるだけでなく、精度も向上します。思考時間が長いほど、より正確な回答が得られます。また、CTMは簡単な画像には思考時間を短くすることで、エネルギーを節約する能力も示しました。ゴリラの画像を識別する際には、CTMの注意が目から鼻、口へと移動するパターンが見られ、これは人間の視覚的注意の動きと非常に似ています。これらの注意パターンは、モデルが分類にとって最も関連性が高いと判断した特徴を示しており、モデルの推論プロセスを理解するための窓となります。この解釈可能性は、モデルの決定を理解するだけでなく、潜在的なバイアスや失敗モードを特定・対処する上でも非常に価値があります。CTMは、ニューロンの同期自体から直接ステップを出力するなど、その内部のダイナミクスを利用してタスクを解決しています。

CTMが示す多様なニューロンダイナミクス:生物の脳への類似性

CTMの内部で観察されるニューロンの活動ダイナミクスは、従来の人工ニューラルネットワークとは大きく異なります。LSTMのような古典的なAIモデルのニューロン活動は、比較的単調で多様性が低い傾向があります。一方、CTMは非常に多様なニューロンの振る舞いを示します。例えば、異なる周波数や振幅で振動するニューロンが見られます。中には、一つのニューロンが複数の周波数を示すこともあれば、タスクを解いている時だけ活動するニューロンもあります。

この多様なダイナミクスは、ソース記事でも「非常に多様なニューロンの振る舞いを持っていることを明確に学習している」と強調されています。そして、これらの振る舞いが完全に「創発的」であるという点は特筆に値します。つまり、これらの多様な活動パターンは、CTMの設計時にあらかじめ組み込まれていたものではなく、タイミング情報をモデルに追加し、様々なタスクを学習した結果として自然に現れた副産物なのです。これは、複雑なシステムが単純な要素から予期せぬ振る舞いを生み出す「創発現象」の一例と言えるでしょう。

これらのCTMのニューロンダイナミクスは、従来のモデルよりも実際の生物の脳で測定されるダイナミクスに、より近いものがあると Sakana AI は指摘しています。これは、脳が持つ複雑な情報処理能力が、単にニューロンの活動量だけでなく、そのタイミングや同期によって生み出されているという生物学的な知見と一致します。CTMが示すこの多様性と創発的な振る舞いは、AIがより高度な認知能力を獲得するための重要なヒントになる可能性を秘めています。脳に学ぶことで、これまで思いもよらなかったような新しいAIの能力が引き出されるかもしれません。CTMは、このような「脳のような」振る舞いの初期の兆候を示しつつも、重要な問題を解決するための実用的なAIモデルとして機能することを目指しています。ニューロン間の同期がどのようにタスク解決に利用されるのか、例えば迷路解きでは同期情報から直接ステップを生成するなど、これは新しい種類の表現に基づいたモデルと言えます。

なぜ脳に学ぶのか? CTMが切り拓くAIの未来と可能性

人工ニューラルネットワークは、その名の通り脳にヒントを得て生まれましたが、驚くほどAI研究と神経科学の間の連携は薄いままです。AI研究者は、そのシンプルさ、効率的な訓練方法、そして継続的な成功から、1980年代に確立された比較的単純なモデルに留まる傾向があります。一方、神経科学者は脳のより正確なモデルを構築しますが、これは主に脳自体を理解するためであり、必ずしも優れた知能モデルを作ることを目的としていません。そして、これらの神経科学的な複雑なモデルは、現在の最先端AIモデルよりも性能が劣ることが多く、AI応用の観点からはあまり魅力的ではなかったという側面もあります。

しかし、Sakana AIは、脳が持つ機能の一部をAIに取り入れないことは大きな機会損失だと考えています。2012年の「ディープラーニング革命」が、脳にインスパイアされたニューラルネットワークによって引き起こされたように、これからも脳からインスピレーションを得ることで、AIはさらなる進歩を遂げられるはずだと彼らは主張します。CTMは、このAIと神経科学の間のギャップを埋め、より脳に近い振る舞いを示しつつも、実用的なAIモデルとしての能力を両立させる最初の試みです。

CTMが示した、迷路解きにおける解釈可能なプランニングや、画像認識における人間らしい注意の動き、そして多様で創発的なニューロンダイナミクス は、AIが単に高性能になるだけでなく、その思考プロセスが人間にとって理解しやすく、信頼できるものになる可能性を示しています。これは、AIの社会実装を進める上で極めて重要な要素です。また、脳のような効率性や、より複雑なタスクへの対応能力が期待できます。Sakana AIは、この自然にインスパイアされた方向性でモデル開発を進めることに興奮しており、AIコミュニティと神経科学コミュニティに対し、この有望な生物学と計算科学の交差点を探求することを呼びかけています。CTMのようなモデルは、生物の驚異的な能力を取り入れつつ、人工ニューラルネットワークの実用的な利点を維持するAIシステムへの一歩となるかもしれません。今後のさらなる研究と開発により、Continuous Thought MachineがAIの新たなフロンティアを切り拓いていくことに期待が高まります。詳細な情報やインタラクティブなデモは、彼らの公開しているInteractive Reportや技術レポート、コードで確認できます。


参考)Introducing Continuous Thought Machines

↑↑↑
この記事が参考になりましたら、上の「参考になった」ボタンをお願いします。

会社ではChatGPTは使えない?情報漏洩が心配?

ある日本企業に対する調査では、72%が業務でのChatGPT利用を禁止していると報告されています。社内の機密情報がChatGPTのモデルに学習されて、情報漏洩の可能性を懸念しているためです。

そのため、インターネットに接続されていないオンプレミス環境で自社独自の生成AIを導入する動きが注目されています。ランニングコストを抑えながら、医療、金融、製造業など機密データを扱う企業の課題を解決し、自社独自の生成AIを導入可能です。サービスの詳細は以下をご覧ください。

いますぐサービス概要を見る▶▶▶
この記事をシェアする
監修者:服部 一馬

フィクスドスター㈱ 代表取締役 / ITコンサルタント / AIビジネス活用アドバイザー

非エンジニアながら、最新のAI技術トレンドに精通し、企業のDX推進やIT活用戦略の策定をサポート。特に経営層や非技術職に向けた「AIのビジネス活用」に関する解説力には定評がある。
「AIはエンジニアだけのものではない。ビジネスにどう活かすかがカギだ」という理念のもと、企業のデジタル変革と競争力強化を支援するプロフェッショナルとして活動中。ビジネスとテクノロジーをつなぐ存在として、最新AI動向の普及と活用支援に力を入れている。

Chat Icon
タイトルとURLをコピーしました