ChatGPTとConoHa AI Canvasで検証:生成AIが変えるクリエイティブ制作

AIは今や、生活や仕事に欠かせない存在です。特にChatGPTに代表される対話型AIは、幅広いタスクをこなせる“万能アシスタント”として、多くの人に活用されています。

一方で、よりクリエイティブな作業――たとえば画像や動画の生成に特化したAIサービスも登場しています。『ConoHa AI Canvas』もその一つで、ビジュアルコンテンツに強みを持ち、創作の可能性をさらに広げてくれるのが特徴です。

今回、ConoHa AI Canvasには動画生成モデル「Wan2.2」と画像生成モデル「Qwen-Image」がプリインストールされ、すぐに利用できるようになりました。

本記事では、ChatGPTとConoHa AI Canvasで実際に生成した画像を比較しながら、それぞれのAIをどのように使い分けると効果的なのかを探っていきます。

1. 画像生成比較

今回は、以下のプロンプトを使用し、ChatGPTとConoHa AI CanvasのQwen-Imageで生成した画像を比較しました。

古民家の木造の軒先に座る若い女性。夏の暑い日差し。彼女はスイカを食べている。女性はGMOと青字で記載されたTシャツを着ている。横では古い扇風機が回っている。日本の田舎の夏らしい雰囲気。アニメ風、明るく爽やかでノスタルジックな描写。

1-1. ComfyUIの起動

起動方法はこちらの記事をご覧ください。

1-2. テンプレート選択

ComfyUIのメニューから「テンプレートを参照」を開きます。

「画像」を選択し、「Qwen-Image Text to Image」を開きます。

1-3. Qwen-Imageで画像生成

プロンプトを入力し、「実行する」をクリックします

1-4. ChatGPTで画像生成

ChatGPTにも同じプロンプトを入力し、画像を生成します。

1-5. 生成された画像の比較

Qwen-Imageで生成した画像

ChatGPTで生成した画像

生成時間: 180秒

生成時間: 90秒

ピクセル: 1328 x 1328

ピクセル: 1024 x 1536

※ブログ掲載用にサイズを調整し、クレジットを記載しています。

生成された画像の感想

 どちらの画像にもGMOのロゴは正確に描かれていますが、ChatGPTの方がより自然に背景になじみ、全体として違和感が少なく感じられます。扇風機も両方に描かれていますが、羽根は回転していません。一方で、Qwen-Imageはより立体的な表現がされているものの、左右の扉にずれがあり、全体の統一感という点ではChatGPTの方が優れています。

2. Qwen-Image Editで試すAI画像編集

次に、Qwen-Image Editを使用して生成した画像を編集しました。

2-1. テンプレート選択

テンプレートから「画像」を選択し、「Qwen-Image Edit」を開きます。

2-2. Qwen-Image Editで画像編集

先ほど生成した画像をアップロードし、プロンプトを入力します。

2-3. 生成された画像

アイスクリームを食べている

生成時間: 234秒

浴衣を着ている

Qwen-Image Editを利用した感想

 メインの人物については表情やポーズを変更できますが、背景の要素を細かく指定して変えるのは難しいようです。たとえば「扇風機を回す」や「背後の扉を同じ模様にする」といった指示は、まったく反映されませんでした。Qwen-Image EditがあればAIで自由自在に画像を編集できると思っていましたが、現状ではまだ限界があると感じました。

3. Wan2.2で広がる「画像から動画」の表現

最後に、Wan 2.2を使用して「画像から動画」を生成しました。

3-1. テンプレート選択

テンプレートから「ビデオ」を選択し、「Wan2.2 14B Image to Video」を開きます。

3-2. Wan2.2で動画生成

先ほど生成した画像をアップロードし、プロンプトと動画の長さを指定します。

動画の長さはフレーム数となります。今回は81フレーム(5秒)に設定しました。

3-3. 生成された動画

生成時間: 228秒

Wan2.2を利用した感想

 Wan2.2は、事前の評判が良かったため期待していましたが、その期待にしっかり応えてくれました。5秒間の動画を約4分で生成でき、生成速度としてはかなり高速な印象です。

 プロンプトで特に指定していないにもかかわらず、背景の鳥が自然に動いており、細部の作り込みに驚かされました。全体的に見ると、細かい部分にはまだ改善の余地があるものの、現時点でも十分に高い完成度を感じます。今後のアップデートによる進化に期待が高まります。

4. まとめ

 今回の検証では、ChatGPT・Qwen-Image・Wan 2.2といった生成AIツールの連携によって、テキストから動画までを一貫して制作できる可能性を確認しました。各モデルの特性を理解し、目的に応じて使い分けることで、より効率的かつ高品質な成果物が得られると感じます。今後は、生成精度や編集自由度の向上にも注目していきたいと思います。

ブログの著者欄

柳 匡哉

GMOインターネット株式会社

GPUを活用したホスティングサービスの基盤設計および開発を担当しています。オンプレミスとパブリッククラウドを組み合わせたハイブリッドインフラの設計・構築に携わっており、コンテナ技術やTerraform、Ansibleを活用した自動化・スケーラビリティの高い環境構築を得意としています。

採用情報

関連記事

KEYWORD

TAG

もっとタグを見る

採用情報

SNS FOLLOW

GMOインターネットグループのSNSをフォローして最新情報をチェック