たねやつの木
こんにちは、たねやつです。
AIによる画像編集・インペインティングで、「マスクした部分が思ったように補完されない…」という悩みは尽きません。しかし、Alibaba社が開発した「Qwen-Image-Edit」モデルは、プロンプト(指示文)を深く理解し、まるで魔法のように画像を編集してくれます。
先日、海外の掲示板Redditで、このモデルの能力を最大限に引き出すためのプロンプト術を網羅した「完全なプレイブック」が投稿され、大きな話題を呼びました。今回はその決定版ガイドを元に、Qwen-Image-Editをマスターするための全7カテゴリの編集テクニックとプロのコツを、実践的な例と共に徹底解説します!
- この記事でできること
- 事前に必要なもの
- Qwen-Image-Editプロンプト術:完全プレイブック
- 1. テキスト編集 (Text Edits)
- 2. 部分的な外見編集 (Local Appearance Edits)
- 3. 全体的なスタイル・意味の編集 (Global Style or Semantic Edits)
- 4. 微細な領域編集 (Micro / Region Edits)
- 5. 人物・アイデンティティの制御 (Identity & Character Control)
- 6. ポスター・合成デザイン (Poster & Composite Design)
- 7. カメラとライティングの制御 (Camera & Lighting Controls)
- 精度を上げるプロのヒント
- 最後に
- 参考・引用
- Qwen-Image-Editの7つの主要な編集カテゴリをマスターできる
- テキスト編集、スタイル変換、人物制御、照明変更など、高度なタスクのプロンプトが書けるようになる
- 編集精度を劇的に向上させるためのプロのヒントを学べる
- ComfyUIにQwen-Image-Editを導入し、基本的なインペインティングワークフローが組めていること。
このモデルの性能はプロンプトの質に大きく依存します。以下の7つのカテゴリを参考に、的確な指示を与える練習をしてみましょう。
1. テキスト編集 (Text Edits)元のスタイル(フォント、サイズ、色、遠近感)を維持したまま、テキストを追加・置換します。
- 例: Replace the sign text with 'GRAND OPENING'. Keep original font, size, color, and perspective.
- 日本語訳: 「看板のテキストを『GRAND OPENING』に置き換えて。元のフォント、サイズ、色、遠近感は維持して。」
オブジェクトの小さな変更(アイテムの削除、服の色の変更など)を行います。
- 例: Turn the jacket into red leather. Preserve folds, stitching, and lighting.
- 日本語訳: 「このジャケットを赤い革製に変えて。シワや縫い目、光の当たり方は維持して。」
中核となる構造は維持しつつ、画像全体のスタイルを変更します。
- 例: Re-render this scene in a Studio Ghibli art style.
- 日本語訳: 「このシーンをスタジオジブリのアートスタイルで再描画して。」
テキスト内の1文字を修正するなど、定義された領域内の非常に細かい変更を行います。
5. 人物・アイデンティティの制御 (Identity & Character Control)キャラクターのアイデンティティを維持したまま、別の場所に配置したり、入れ替えたりします。
- 例: Place the same character in a desert environment. Keep hairstyle, clothing, and facial features identical.
- 日本語訳: 「同じキャラクターを砂漠の環境に配置して。髪型、服装、顔の特徴は同一に保って。」
既存のタイポグラフィに合わせたスローガンを追加するなど、グラフィックデザインのタスクを実行します。
7. カメラとライティングの制御 (Camera & Lighting Controls)シーンの照明を操作したり、異なるカメラレンズをシミュレートしたりします。
- 例: Relight the scene with a warm key light from the right.
- 日本語訳: 「右からの暖かいキーライトでシーンを照らし直して。」
上記のプロンプトに、以下のヒントを組み合わせることで、編集の精度がさらに向上します。
- 変更しない部分は「Keep everything else unchanged」: 意図しない変更を防ぐため、「他のすべては変更しないで」という一文を追加するのは非常に効果的です。
- 詳細な指示で精度を上げる: テキスト編集なら「フォント、サイズ、配置を維持して (Preserve font, size, and alignment)」のように、維持したい要素を具体的に指示します。
- 複雑な編集は分割する: 1つの複雑なプロンプトで全てを行おうとせず、「服の色を変える」「背景を変える」のように、複数の簡単な編集を連鎖させて行いましょう。
- ネガティブプロンプトを活用する: 「歪んだテキスト (no warped text)」のように、望まない結果をネガティブプロンプトで指定することで、歪みなどを防ぐことができます。
今回は、Qwen-Image-Editを使いこなすための「完全なプレイブック」を紹介しました。
見ての通り、このモデルは非常に多機能ですが、その能力を引き出すには「何を」「どうしたいのか」を具体的に、構造化して伝えることが不可欠です。まるで優秀なアシスタントに指示を出すようにプロンプトを書くことで、これまで不可能だったレベルの画像編集が手軽に実現できます。
ぜひこのガイドを片手に、魔法のような画像編集の世界を探求してみてください。
参考・引用- https://www.reddit.com/r/StableDiffusion/comments/1n1n81o/qwenimageedit_prompt_guide_the_complete_playbook/