Intel Vision 2024 のエンタープライズ AI アート展

AI

この記事は、The Parallel Universe Magazine 57 号に掲載されている「Enterprise AI Art Exhibition at Intel Vision 2024」の日本語参考訳です。原文は更新される可能性があります。原文と翻訳文の内容が異なる場合は原文を優先してください。


parallel_v57_03

Intel Vision 2024 のエンタープライズ AI アート展では、参加者がインテル® Gaudi® AI アクセラレーターでオープンソースの Stable Diffusion モデルを実行して、独自のアート作品を作成するデモが実施されました。このデモの特筆すべき点は、参加者がリアルタイムで作品を作成する Few-Shot 学習の実践的な応用を通して、創造性と革新性を育むため企業環境で AI をどのように活用できるかを具体的に示したことです。

この記事では、このデモについて説明し、自分で実行する方法も紹介します。

デモの概要

Stable Diffusion に基づくカスタムアート作品を作成して、インテル® Gaudi® プロセッサーおよびソフトウェア・スタックの機能を紹介しました。デモでは、DreamBooth (英語) ファインチューニング手法を使用して、限られた画像セットで Dreamlike Diffusion (英語) と呼ばれる Stable Diffusion 1.5 モデルのバリエーションをファインチューニングし、最小限のデータでパーソナライズされたアートを生成できることを示しました。インテル® Gaudi® プロセッサーと optimum-habana (英語) により、必要な計算能力が提供され、高速なモデル・トレーニングが行われました。

ベースモデルは、Stable Diffusion 1.5 ベースの Dreamlike Diffusion 1.0 です。DreamBooth ファインチューニングは、Stable Diffusion のようなテキストから画像への変換モデルを、被写体のわずか数枚 (3~5 枚) の画像でパーソナライズする方法です。このデモでは、Stable Diffusion 1.5 の DreamBooth ファインチューニングにより、独自の画像からカスタムアートを作成できるようにします。

結果として得られるファインチューニングされたモデルは、以下に示すようなユーザープロンプトに基づいて、ユニークなアート作品を生成できます。


プロンプト:a dreamlike vision of the universe swirling within close-up side portrait of solo gaudigeekatintel, fluid, constellations and nebulae, dreamlike art, fantasy, star trek aesthetic, vibrant pastel color aesthetic, concept art, sharp focus, flawless skin, pastel colors, digital painting, hd, dramatic lighting, trending in art station
(gaudigeekatintel の横顔をクローズアップした肖像画の中に渦巻く幻想的な宇宙、流体、星座と星雲、幻想的なアート、ファンタジー、スタートレックの美学、鮮やかなパステルカラーの美学、コンセプトアート、鮮明、完璧な肌、パステルカラー、デジタル絵画、HD、ドラマチックな照明、ArtStation のトレンド)

Intel Vision 2024 のデモの録画はこちら (英語) から視聴できます。

チュートリアル:独自の Stable Diffusion アートを作成する

DreamBooth ファインチューニング

デモでは、Stable Diffusion 1.5 の DreamBooth ファインチューニングを使用して、独自の画像 (512 x 512 解像度にサイズ変更) のカスタムアートを作成します。4 つの環境変数を設定する必要があります。

  1. MODEL_NAME: Dreamlike Diffusion 1.0 モデル (dreamlike-art/dreamlike-diffusion-1.0) に設定します。これは、dreamlike.art (英語) によって作成された高品質のアートでファインチューニングされた Stable Diffusion 1.5 です。

  2. INSTANCE_DIR: 3~5 枚の入力画像を含むディレクトリーに設定します (例:/home/art_studio/gaudigeekatintel/) 。入力画像は、背景が無地で、適切な照明が当たり、肩の高さで 512 x 512 にサイズ変更された被写体の正面、右側面、左側面の画像です (以下のサンプル画像を参照) 。被写体の参照または名前は、できるだけ一意である必要があります (例:「gaudigeekatintel」) 。ここでは、モデルのアーティファクトの作成にこの参照名を使用します。

  3. OUTPUT_DIR: ファインチューニングされたモデルの保存先ディレクトリーに設定します (例:/home/art_studio/dd_model_gaudigeekatintel) 。

  4. CLASS_DATA_DIR: トレーニングするクラスの画像を含むディレクトリーに設定します。このチュートリアルでは、DreamBooth ファインチューニングで人物画像を生成するために使用する男性と女性のサンプル画像をダウンロードします。Kaggle データセット (英語) から JPEG 形式の「男性」と「女性」の画像をそれぞれ約 50 枚選択し、/home/art_studio/person という名前のディレクトリーに保存します。


タイトルとURLをコピーしました