Project Genieの概要
Project Genieは、Googleが開発した実験的な研究プロトタイプで、ユーザーが無限に多様なインタラクティブな世界を作成・探索できるツールです。このプロジェクトは、Genie 3という世界モデルを基盤としており、テキストや画像のプロンプトを使用してリアルタイムで環境を生成します。
主な機能
Project Genieでは、ユーザーがテキストプロンプトや画像を入力することで、フォトリアリスティックな世界を生成できます。生成された世界はリアルタイムで構築され、ユーザーが探索する際に周囲の風景が動的に展開します。また、キャラクターの作成やリミックスも可能で、インタラクティブな体験を提供します。
技術的基盤:Genie 3モデル
Genie 3は、Google DeepMindが開発した汎用世界モデル(general-purpose world model)で、テキスト記述からフォトリアリスティックな環境をリアルタイムで生成し、探索可能にします。このモデルは、autoregressive(自己回帰)アーキテクチャを採用しており、各フレームを過去のフレーム履歴とユーザーの最新アクションに基づいて逐次生成します。これにより、明示的な3D表現やハードコードされた物理エンジンに依存せずに、一貫性のある動的な世界を構築します。
主な技術仕様として、720p解像度(1280×720)で24フレーム毎秒(24 FPS)のリアルタイム生成を実現し、数分間の一貫性を維持します。Genie 3は、Genie 2と比較して一貫性とリアリズムが大幅に向上しており、初めてリアルタイムでのインタラクションを可能にした世界モデルです。物理法則や相互作用は、大量のビデオデータから学習された emergent(創発的)な特性として現れます。
このアプローチにより、ユーザーの移動や行動に応じて世界がその場で拡張・生成され、従来の静的3Dスナップショットとは異なり、動的なパスをリアルタイムで予測します。また、プロンプトによる世界イベントの変更(例:天候変更やオブジェクト追加)などの高度な制御性も特徴ですが、現在のProject Genieプロトタイプでは一部の機能が未実装です。
アクセスと利用条件
Project Genieは、Google AI Ultraのサブスクライバー向けに提供されており、米国在住の18歳以上のユーザーが利用可能です。Google Labsのウェブサイトからアクセスでき、FAQやサポートページが用意されています。
Project Genieの影響
Project Genieのリリースは、ビデオゲーム業界に影響を与え、関連企業の株価に変動を引き起こしました。このツールは、仮想世界の作成を容易にし、ゲーム開発の新たな可能性を示唆しています。
利用例
ユーザーは、例えば「魚としてキッチンから脱出する」といったプロンプトでインタラクティブなシナリオを作成できます。これにより、創造的な仮想体験が実現されます。
