【Gemini Veo3】AI動画で「日本人」が出ない問題を一発解決!静止画から作る2ステップ攻略法
Googleの最新動画生成AI「Veo3」。使ってみると分かりますが、日本語で指示を書いても「なぜかアメリカ人風の男性」が出てきてしまう……。そんな経験はありませんか?
今回は、1日3回という貴重な生成枠を無駄にせず、理想のキャラクターを100%の確率で動かすための「画像ベース生成」のテクニックを備忘録としてまとめます。

1. なぜあなたのAI動画は「外国人」になるのか?
02:45 検証:プロンプトだけで生成すると「アメリカ人」が出てくる問題
AI(Gemini/Veo3)の学習データには英語圏の情報が多いため、「競馬を応援する男」とだけ書くと、デフォルトで西洋風の人物が選ばれる傾向があります。 字幕でも触れましたが、日本語でどれだけ詳しく状況説明をしても、人物のアイデンティティを固定するのは非常に困難です。
失敗したプロンプト(直接生成)
「テレビ画面は最終コーナーを回る馬群。太ったおじさん、ソファの端に座り、食い入るように画面を見つめている……(以下略)」
→ 結果:特徴的なアメリカ人の男性が生成されてしまう。
2. 解決策:静止画を「設計図」にする2ステップ法
最も確実なのは、「先に理想の静止画を作り、それをVeo3に読み込ませる」という手法です。
ステップ1:静止画でキャラクターを固定
まず、画像生成AIで「動かしたいシーンの決定的な1枚」を作ります。
07:44 解決策:先に「日本人おじさん」の静止画を生成して固定する
使用した画像生成プロンプト(イメージ):
書類や空き缶が散らかったアパートの一室 太ったトレーナー姿の日本人男性 TVで競馬のレース中継を見ています TV画面には、最終コーナーを回った馬群(ばぐん)が表示されています

ステップ2:画像を添付してVeo3に「動き」を指示
生成された日本人の画像をVeo3にアップロードし、その画像に対して「どう動くか」だけを指示します。
動画生成時の指示(情景描写):
画面の馬が先頭に躍り出た瞬間。 おじさん、弾かれたように座椅子から少し腰を浮かせ、 新聞を丸めた手で膝をバシィッと叩く。
これにより、キャラクターの見た目(日本人であること)を維持したまま、躍動感のある動きを付けることに成功しました。
3. 未解決の課題と積み残し
今回の検証で見えてきた、現時点でのAI動画の限界です。
- 音声の日本語対応が不完全: 動画内で喋らせようとしましたが、日本語のイントネーションや声の質がまだ不自然(または英語風になる)という課題が残りました。
- 1日3回の制限: トライ&エラーが命のAI生成において、この回数制限はかなり厳しい「壁」です。
- 細かい動作の不一致: 「新聞で膝を叩く」といった複雑な道具との干渉は、まだAIが混乱しやすいポイントです。 ↓矢印、セリフを言わなかったり、うまく動画にできていませんが、作業手順が伝われば・・・ 10:14 実演:静止画を元にVeo3で動きをつける手順
4. 次回へのアドバイス・リメイク案
「映像は完璧だが、声がダメ」という現状を打破するために、以下のステップを提案します。
- ElevenLabsやVrewとの連携: Veo3で生成した「無音の高品質動画」に、音声合成AIで作った「リアルな日本語の叫び声」を後付けする。これが現在のAI動画制作の王道です。
- ショート動画への展開: 今回の「競馬おじさん」のようなキャラ立ちした映像は、TikTokやYouTubeショートと相性が抜群です。字幕と効果音を盛って15秒の物語にリメイクしてみてはどうでしょうか。
関連リンク
🔍 検索キーワード
💡 参考になりそうな情報
- Google公式:Veo の概要(英語) ※最新のサンプル動画や技術背景が確認できます。