こんにちは!今日は、動画生成AIを使ってちょっと挑戦的な動画制作に取り組んでいます。テーマは、1人の女の子がさまざまなポーズやアクションを披露しながら、複数のアングルで撮影されるというもの。
イメージとしては、1分ほどの短い動画で、女の子が一貫したキャラクターとして登場し、服装や雰囲気も統一された、ストーリー性のある映像を作りたいと考えています。
このアイデアを実現するには、複数のカットを組み合わせる必要がありますが、すべてのカットで同じ女の子が登場し、見た目や動きに統一感を持たせるのが重要です。
3Dモデルを使えば、こうした一貫性を保つのは比較的簡単かもしれません。でも、生成AIを使ってこれをやろうとすると、かなりハードルが高いと感じています。
最初に、いつものようにChatGPTに相談してみました。すると、「まず女の子の画像を生成し、それを基にダンスや動きをつける」という、一般的な方法を提案されました。
このアプローチは一見シンプルそうですが、実際にやってみると、なかなか思い通りにはいきません。
生成した女の子の動きが、私のイメージしていたものとズレてしまうんです。たとえば、特定のポーズやアクションをさせたいのに、動きが不自然だったり、明らかに意図したものと異なる結果になったり。どうしても「違和感」が拭えないんですよね。
生成AIで動画を作る場合、こうした細かい動きや一貫性をコントロールするには、かなり高度なテクニックが必要だと実感しています。
単に画像を動かすだけではなく、カメラアングルの変化やポーズの自然さ、キャラクターの統一感を維持するのは、想像以上に難しい挑戦です。
そこで、試行錯誤しながら進めていますが、生成AIの限界と可能性の両方を感じています。このプロジェクトを通じて、もっと生成AIの特性を理解し、イメージに近い動画を作れるようになりたいですね。
もし同じような挑戦をしている方がいたら、どんな工夫をしているのか、ぜひ聞いてみたいです!