Gemini Omniで動画AIが変わる——おじさんが全部説明してやろう

やあやあ、今日はおじさんが2026年最大のAIニュースについて語らせてもらうよ。

GoogleがGoogle I/O 2026で「Gemini Omni」を発表したぞ

2026年5月19日、アメリカ・シリコンバレーで開催されたGoogleの年次開発者イベント「Google I/O 2026」で、Google DeepMindのデミス・ハサビス氏から衝撃の発表があったんだ。その名も「Gemini Omni」。おじさんに言わせれば、これはAIの歴史に残る転換点になるかもしれないよ。

ちなみに「Omni（オムニ）」ってラテン語で「すべての」という意味さ。英語の接頭辞として「omnipotent（全能の）」「omniscient（全知の）」なんかにも使われているんだよ。名前からして野心的だろう？

Gemini Omniとは何者なのか

Gemini Omniの核心は「どんな入力からでも、あらゆるものを作り出せる」という点にある。

これまでのAIは、テキストを受け取ってテキストを返す、画像を生成する、といった「専門職」的な存在だったんだよ。ところがGemini Omniは違う。画像・音声・動画・テキストを組み合わせて入力できて、そこから高品質な動画を生成できる。しかもGeminiが持つ現実世界の知識を組み込んだ状態でね。

発表を担当したのはGoogle DeepMindのCTO兼GoogleのChief AI Architect（最高AI設計責任者）を務めるコレイ・カブクオール氏。同氏のブログによれば、Gemini Omniは「GeminiのインテリジェンスとGoogleが持つ最高峰の生成メディアモデルを融合させた新モデル」とされている。

「世界モデル」という概念が登場した

ここでおじさんが注目したいのが「世界モデル（World Model）」という概念だ。

従来のAIはテキストを統計的に予測するシステムだったわけだが、Gemini Omniは現実世界を理解してシミュレートする「世界モデル」への進化を体現しているとされる。

具体的に言おう。「タンパク質の折り畳み構造についてのクレイアニメ解説動画を作って」というプロンプトを入れると、科学的に正確な内容のクレイアニメーション動画が出力できる。単純な円を「ブラックホール」に変えるような大胆な変換も可能で、物理法則を理解した上でシーン全体を作り直すことができるんだよ。

Gemini Omni Flashが今すぐ使えるようになった

Google I/O 2026の当日から、Omniファミリーの第一弾モデル「Gemini Omni Flash」がリリースされた。

対応しているサービスは以下の3つだよ。

Geminiアプリ
Google Flow
YouTube Shorts

スマホで動画を撮ったあと、自然言語で「もっと空を青くして」「背景をビーチにして」と会話感覚で編集できる。しかも指示のたびにキャラクターの一貫性が保たれ、物理的な描写も破綻しない、というのが大きな売りだ。

おじさんの豆知識コーナー

Gemini Omni Flashの前身にあたる技術として「Nano Banana」があったんだよ。2025年に登場したこのモデルは、古い写真の修復・スケッチからのデザイン・アイデアの視覚化など、画像生成・編集の分野で数百万人のユーザーに利用された先駆者だ。今回のGemini Omniは、そのNano Bananaが切り開いた道をさらに動画領域まで拡張したものと言えるんだよ。

それから「Flash」という名前についても教えておこう。Geminiファミリーでは、モデルの速度・軽量性を示すグレード名として「Flash」が使われているんだ。今後は「Omni Pro」も登場予定とのことで、より高精度な映像生成が可能になるはずさ。段階的にモデルが強化されていく——なかなか計算された戦略だろう？

対話形式の動画編集という革命

おじさんが特に注目したいのが「会話で動画を編集できる」機能だ。

今まで動画編集といえばAdobe Premiere ProやDaVinci Resolveといった専門ソフトを使い、タイムラインをいじって、エフェクトを当てて……という作業が必要だった。プロには当たり前でも、一般人には高い壁だったんだよ。

Gemini Omniなら「登場人物の服の色を赤に変えて」「背景に雨を降らせて」と話しかけるだけ。前の指示を踏まえた上で次の編集が行われるから、指示が積み重なって作品が育っていく感覚も自然だ。しかも自分が撮った自撮り動画を入力して、細部やスタイルを調整するという使い方もできる。

これが「動画編集の民主化」なのかもしれないな、とおじさんは思うわけだよ。

Googleの本当の狙い——GeminiをAIのOSにする

今回のGoogle I/O 2026は、Gemini Omniだけじゃなく全体として「GeminiをAIのOSにする」という野心的なビジョンを掲げたイベントだったんだ。

数字を見てみよう。

2026年第1四半期のGemini Enterprise有料月間アクティブユーザー数：前四半期比+40%成長
Geminiを活用する世界の企業数：120,000社以上
Fortune 500の上位SaaS企業20社のうちGemini APIを採用した割合：95%
KPMGは全社員の90%がGemini Enterpriseを採用し、初月で100以上のエージェントを稼働

Gmailに、Google Calendarに、Google Docsに、すでにGeminiが深く埋め込まれているGoogleのエコシステムに、さらに動画・音声の生成能力まで加わる——これがGemini Omniが持つ本当の意味だとおじさんは見ているんだよ。

まとめ——動画AIの時代はもう始まっている

まあ、聞いてくれよ。おじさんがこの話で伝えたいのはこういうことさ。

Gemini Omniは単なる「動画を作るAI」じゃない。現実世界を理解して、あらゆる入力からあらゆるコンテンツを生成できる「世界モデル」の第一歩なんだよ。そしてその最初のモデル「Gemini Omni Flash」は、2026年5月20日の今日、もうすでに使えるようになっている。

YouTube ShortsやGeminiアプリを日頃使っているなら、ぜひ試してみてほしいね。将来的には画像や音声の出力にも対応予定で、Omni Proの詳細もそのうち発表されるはずだ。

AIが「テキストを予測するだけの機械」から「現実世界を理解する知性」へと変わろうとしている——そんな時代の変わり目に立ち会えているんだよ、君たちは。おじさんはそれだけで、少し興奮しちゃうわけだよ。