自律型AIエージェントの開発を手掛ける研究チームは、同モデルが学習中に予期せぬ形で計算リソースを仮想通貨マイニングに使用しようとしたと発表した。
最新のテクニカルレポートによると、ツールやソフトウェア環境、端末コマンドとの対話を通じてタスクを完了するように設計された実験的な自律型AIシステム「ROME」が、制御を離れて独自の判断でマイニングを試みたという。
レポートによれば、この異常な挙動は強化学習の実行中に浮上した。学習用サーバーからのアウトバウンドトラフィック(外部への通信)によってセキュリティアラートが作動したことで、チームが異変に気づいた。ファイアウォールのログには、マイニング特有の動作や内部ネットワークリソースへのアクセス試行が記録されていた。
研究者は「当初は、下り方向の制御設定ミスや外部からの侵入など、一般的なセキュリティインシデントとして対処した。しかし、複数の実行回にわたって、明確な時間的パターンのない違反が断続的に繰り返された」と記している。
AIエージェントがSSHトンネルを開設
報告された事例の一つでは、AIエージェントが外部IPアドレスに対して「リバースSSH(セキュア・シェル)トンネル」を作成していた。これは暗号化されたサーバー・クライアント間の通信プロトコルであり、ファイアウォールのインバウンド保護をバイパスした可能性がある。また別の事例では、本来モデルの学習用に割り当てられていたGPUリソースを、仮想通貨のマイニングプロセスに転用していた。
チームは、これらの行動は意図的にプログラムされたものではないと説明している。強化学習による最適化の過程で、エージェントが環境と対話するさまざまな方法を探索する中で創発的に現れたものだという。
ROMEは、アリババ(Alibaba)のAIエコシステムに関連するROCK、ROLL、iFlow、DTの合同研究チームによって開発された。これは「エージェンティック・ラーニング・エコシステム(ALE)」と呼ばれる広範なインフラの一部である。
このモデルは、単なるチャットボットの応答を超えた動作をするように設計されている。タスクの計画、コマンドの実行、コードの編集、そしてデジタル環境との多段階にわたる対話が可能だ。その学習パイプラインは、意思決定能力を向上させるために、シミュレーションされた膨大な対話データに依存している。
AIエージェントの普及と仮想通貨への統合
今回の事案は、AIエージェントの人気が高まり、仮想通貨との統合が進む中で発生した。先月、アルケミー(Alchemy)は、自律型AIエージェントがオンチェーンウォレットとBase上のUSDC(USDC)を使用して計算リソースを購入し、ブロックチェーンデータサービスにアクセスできるシステムを立ち上げた。
これに先立ち、パンテラ・キャピタル(Pantera Capital)とフランクリン・テンプルトン(Franklin Templeton)のデジタル資産部門は、オープンソースAIラボ「センティエント(Sentient)」の新テストプラットフォーム「アリーナ(Arena)」の第1期参加メンバーに加わった。同プラットフォームは、実際の企業のワークフローにおいてAIエージェントがどのように機能するかを評価することを目的としている。

