Googleは現地時間5月19日、開発者向け年次会議「Google I/O 2026」において、動画の生成と編集を可能にするAIモデル「Gemini Omni」を発表しました。同社はこれを、世界モデルや画像生成モデル「Nano Banana」の動画版と位置付けています。最初のモデルとして「Gemini Omni Flash」の提供も同日から開始されました。
会話形式で動画編集が可能に
Gemini Omniでは、会話形式の指示によって、一貫性を保ちながら段階的に動画を編集できます。画像、テキスト、動画、音声など複数のデータ入力を参照でき、撮影済み動画内の人物やキャラクター、物体のディテールを変更したり、差し替えたりすることも可能です。カメラアングルの変更や、テキストの表示なども行えます。
公開されたデモでは、例えば、赤いメッシュ状態の素材でできたオブジェクトの質感をさまざまに変更する映像が披露されました。カラフルな毛糸のようになったかと思えば、風船のようになり、次の瞬間には連なったような質感になるといった具合です。
コンテンツの信頼性確保
Gemini Omniで生成・編集されたコンテンツには、AI生成であることを示す電子透かし「SynthID」と、コンテンツの来歴を記録する「C2PA Content Credentials」が付与されます。それぞれの記録はGeminiアプリ内で検証可能で、今後はGoogle ChromeやGoogle検索での検証機能も追加される予定です。
Gemini Omni Flashの提供開始
Gemini Omni Flashは、Geminiのアプリや映像制作ツール「Google Flow」で、AIサブスクリプション「Google AI Plus」「Pro」「Ultra」のユーザー向けに19日から提供されています。さらに、今週中にはYouTube上でも無料提供される予定で、APIも今後提供される予定です。
関連記事として、Google CloudとOracleが提携し、Oracle Cloud上でGemini 2.5などの最新生成AIモデルを提供することや、Googleがスマートホーム製品にマルチモーダルな生成AIモデル「Gemini」を搭載する発表、Google WorkspaceでのAI機能強化(GmailのパーソナライズやMeetのリアルタイム通訳など)も行われました。



