
2025/10/16(木)
Google DeepMindが開発した最新の動画生成AI「Veo 3.1」が、ついにFlowプラットフォームで利用可能になりました。前バージョンのVeo 3.0でも十分に驚異的なクオリティを実現していましたが、3.1ではさらなる進化を遂げています。実際に様々な機能を試してみた結果、その圧倒的な表現力と自然さに改めて驚かされました。
今回は、Veo 3.1の新機能である参照画像を使った動画生成、フレーム指定による動画制作、そして動画素材のアップロード機能まで、実際の操作を通じて詳しく検証していきます。動画編集機能については一部制限があったものの、基本的な動画生成機能のクオリティは期待を大きく上回るものでした。
目次
Veo 3.1は「創造性のために設計されたビデオ生成モデル」として位置づけられており、従来のモデルと比較して格段に高いコントロール性を実現しています。
主要な新機能
これらの機能により、VOは参照素材をサウンド付きの完全なシーンにまとめることができ、従来の動画生成AIでは実現困難だった細かなディテールコントロールが可能になっています。
まず、テキストプロンプトのみを使用した基本的な動画生成を試してみました。以下のようなプロンプトで実際に生成を行いました:
プロンプト | 生成結果の特徴 |
「未来都市ドローン視点」 | 非常にシネマティックな映像が生成され、ライティングやシャドウの表現が秀逸 |
「侍×雨の戦闘」 | リアルワールドフィジックスに基づいた自然な動きと雨の表現 |
「近未来バイク&スピード感」 | スケール感とマッチングが優秀で、スピード感のある映像を実現 |
どのプロンプトでも、従来のAI動画生成では困難だった「アストニッシングディテール」と呼べるレベルの細部表現が実現されており、特にライティングとシャドウの自然さは驚異的でした。
Veo 3.1で最も革新的な機能の一つが、参照画像を使った動画生成です。実際にMidjourneyで作成したスライドテンプレート画像を使用してテストを行いました。
セミナー用のスライドテンプレート画像を入力として、「かっこよくズームアウト」するような動画を生成しました。結果として得られた映像は、元画像の構図やデザインを完璧に保持しながら、自然なカメラワークを実現していました。
さらに印象的だったのが、2つの画像を開始フレームと終了フレームとして指定する機能です。「AIと人間が一緒に仕事をしている様子」をテーマに、2つの異なる画像を指定して動画を生成しました。
この機能で生成された動画の自然さは特筆すべきレベルでした。2つの画像間の切り替わりが「すげえ自然」で、まるで実際に撮影されたかのような滑らかなトランジションを実現していました。従来のAI動画生成では、このような複数フレーム間の一貫性を保つことは非常に困難でしたが、Veo 3.1では seamless(シームレス)な結果を得ることができました。
Veo 3.1では既存の動画素材をアップロードして、それをベースにした新しい動画を生成する機能も提供されています。実際にテストを行いましたが、いくつかの制限があることが判明しました。
動画のアップロードを試みた際、特定のフォーマット(HEVC形式など)では対応していない場合があることが分かりました。これは現在のVeo 3.1の技術的制限の一つと考えられます。
動画編集機能についても試してみましたが、動画素材のアップロードができない状況では、この機能の詳細な検証は困難でした。ただし、基本的な動画生成機能のクオリティから判断すると、動画編集機能も同様に高い品質を期待できると思います。
Google Veo 3.1をFlowで実際に試した結果、以下の点が特に印象的でした:
一方で、動画素材のアップロード機能については、対応フォーマットの制限など、まだ改善の余地があることも確認できました。しかし、基本的な動画生成機能のクオリティは「相当クオリティー高い」と断言できるレベルに達しており、AI動画生成の新たな標準を確立したと言えるでしょう。
今後、動画編集機能の充実や対応フォーマットの拡張が進めば、Veo 3.1はプロフェッショナルな動画制作現場でも重要な役割を果たすツールになると期待されます。
本記事の内容は、以下の資料も参考にしています:
Google Veo 3.1はFlowプラットフォーム上で利用できます。Flowのインターフェース上で、テキストプロンプトを入力するか、参照画像、開始・終了フレームとなる画像をアップロードすることで動画を生成できます。
Veo 3.1では、参照画像を使って動画を生成できます。例えば、一枚の画像からズームイン・ズームアウトする動画を作ったり、開始フレームと終了フレームの2枚の画像を指定して、その間を自然につなぐ動画を生成したりできます。
Veo 3.1では、動画素材のフォーマットに制限があります。記事内ではHEVC形式の動画がアップロードできない場合があることが確認されています。対応フォーマットについては、Flowの公式情報を確認してください。
Veo 3.1は、ディテール表現、ライティング、シャドウの自然さにおいて、従来のAI動画生成モデルを上回る品質を実現しています。映画のような質感を持つシネマティックな動画を生成できる点が特徴です。
Veo 3.1は、動画生成に加えて、サウンドエフェクト、アンビエントノイズ、ダイアログなどの音声も自動で生成する機能を備えています。これにより、映像と音声を統合した完全なマルチメディアコンテンツを制作できます。
Workstyle Evolution代表。18万人超YouTuber&『ChatGPT最強の仕事術』著者。
株式会社Workstyle Evolution代表取締役。YouTubeチャンネル「いけともch(チャンネル)」では、 AIエージェント時代の必須ノウハウ・スキルや、最新AIツールの活用法を独自のビジネス視点から解説し、 チャンネル登録数は18万人超(2025年7月時点)。