Gemini Omni登場——あらゆる入力から動画を生み出すGoogleの万能AI

🤖 Gemini Omniとは

テキスト・画像・音声・動画をまとめて入力し、最大10秒の動画を生成できる新AIモデル
チャットで話しかけるだけで動画を編集——キャラ・背景・動きの一貫性を保ちながら修正できる
全動画にSynthIDの電子透かしを自動付与、ディープフェイク対策も完備
有料「AI Ultra」加入者向けに即日公開。OpenAI「Sora」対抗の本命モデルとして注目

Gemini Omniとは何か
主な機能
現在の提供状況
まとめ
公式サイト・関連リンク

Gemini Omniとは何か

2026年5月20日、Googleは年次開発者会議「Google I/O 2026」において、新たなAIモデル「Gemini Omni」を発表しました。その名の通り、テキスト・画像・音声・動画のあらゆる入力を受け取り、そこから動画をはじめとする多様なコンテンツを生成できる「万能型マルチモーダルAI」です。

Gemini Omniは、Google DeepMindが開発した動画生成モデル「Veo」、画像編集モデル「Nano Banana」、インタラクティブ環境モデル「Genie」を統合した、次世代の生成AIです。

主な機能

あらゆる入力から動画を生成

Gemini Omniの最大の特徴は、入力の自由度の高さです。スケッチ・音声メモ・既存の動画クリップ・テキストを組み合わせて渡すだけで、統一感のある動画を生成します。「どんな場面を作りたいか」を自然な言葉で伝えれば、細部まで手動で指定する必要はありません。

会話式の動画編集

生成した動画は、チャットで話しかけるだけで修正できます。「背景を夜景に変えて」「キャラクターを別の人物に差し替えて」といった指示に対応し、キャラクターや背景・動きの一貫性を保ちながら編集できる点は、これまでのAI動画モデルが苦手としてきた領域です。

デジタルアバター作成

自分のアバターを作成して動画に登場させる機能も搭載。悪用（ディープフェイク）防止のため、専用オンボーディングで本人確認が必要な設計になっています。

SynthID透かしで安全性を確保

Gemini Omniで生成されたすべての動画には、Googleの電子透かし技術「SynthID」が自動で埋め込まれます。これにより、AI生成コンテンツであることを第三者が検証できるようになっています。

現在の提供状況

まず「Omni Flash」として、有料のAI Ultraサブスクライバー向けにGeminiアプリ・Google Flow・YouTube Shortsで即日利用可能になっています。最初のリリースでは最大10秒の動画生成が可能で、デベロッパー向けAPIは今後順次公開予定です。

まとめ

Gemini Omniは、これまでの「テキストを入力して画像を得る」という枠を大きく超え、あらゆるメディアを組み合わせて動画を創り出す新しい次元のAIです。OpenAIのSoraと並ぶ動画生成AIとして注目を集めており、クリエイターや開発者の制作プロセスを大きく変えていく可能性があります。AI動画生成の新時代が、いよいよ本格的に幕を開けたと言えそうです。