kikukawa's diary

都内で活動するシステムエンジニアが書いてます。 興味を持った技術やハマったポイント、自分用メモをつけてます。 最近はweb中心

Stable Diffusionを始める前に知っておくべきこと

はじめに

この記事は、 Makuake Advent Calendar 2023 3日目の記事です。

Stable Diffusionを始める前に知っておくべきこと

遅ればせながら、今年に入ってようやくStable Diffusionを触り始めました。 この辺最初から知ってたらよかったなと思うことをまとめました。

環境について

AIでイラストを描く方法はいくつかあります。
自分のパソコンのスペックや予算、作成頻度などよく考えて選定した方がいいと思います。

  • 自分のパソコンにStable Diffusion環境を作る
  • Google Colabなど実行環境をレンタルしてそこにStable Diffusion環境を作る
  • AIイラストを生成できるサイトを使う
  • 専用アプリをインストールする

一つずつ見ていきます。

自分のパソコンにStable Diffusion環境を作る

最も自由度が高い方法ですが、知識、時間、お金(PCのスペック)が必要になります。
昔に比べインストーラーなどが整ってきているので、構築自体の難易度は下がっているますが、 エラーなどに出会った場合自分で解決しなければいけません。 ちょっと試してみたいといったレベルでは、この手段を取らない方がいいでしょう。
その反面、一度構築してしまえば、何度でも実行できますし、バッチで寝ている間に実行させるみたいなこともできます。

Google Colabなど実行環境をレンタルしてそこにStable Diffusion環境を作る

自分のパソコンに環境を作る時と同じく知識は必要になってきます。 ですが、手元に高性能のパソコンがない、ディスクの容量を圧迫したくない、自分のパソコンの環境を汚したくないなどの場合には選択肢に入ると思います。
Google Colabの使い方を知っている人なら、情報もそこそこあるのでそこまで困ることはないかなという印象です。Colabが一番情報が多いので、Colabで作るのが無難です。
ただ、Colabの制限が入ってくるので、自分のPCで作るような自由さはありません。

AIイラストを生成できるサイトを使う

無料から有料までAIでイラストを作成できるサイトがたくさんあります。 多くの場合は、生成できる数が限られていたり、使用するモデルなどが制限されたりしています。 同時に多くの人が生成した画像とそのキーワード(プロンプト)が、一緒に公開されているので自分で作るときの参考になります。 目的にあったサイトを見つけられれば、少ない労力で画像が生成できます。

専用アプリをインストールする

iOSAndroid向けに専用アプリが出ています。 タブレット用のアプリが多いですが、スマホで実行できるものもあります。 スマホタブレットで実行するためそもそも数をこなすには向いてません。 出先でちょっと作ってみたいという感じに使うのが良さそうです。

用語について

最低限知っておいた方が良い用語です。 簡単な説明なので、正確ではありません。正確な情報は別途調べてください。

  1. モデル:
    • 生成する画像の系統を決めるものです
    • まず、これを決めてから細かいことを決めていきます
    • 色々なサイトにモデルがあるので自分が作りたい画像の系統に似たモデルを探しましょう
  2. Lora:
    • メインのモデルと併用するサブ的なモデルです
    • Loraを使わずに画像生成することもできます
  3. txt2img:
    • プロンプトと呼ばれるテキストの羅列で画像を生成する方法です
    • プロンプトの書き方や順番で作成したい絵を誘導します
  4. img2img:
    • 元画像を用意して、その画像を加工する形で画像を作成する方法です
    • txt2img同様にプロンプトで作成したい絵を誘導します
  5. プロンプト(ポジティブプロンプト):
    • 画像を生成する命令文です
    • カンマ区切りで複数の命令を同時に指定できます
    • 命令に沿った絵を生成しますが、必ずしも狙った通りにはなりません
  6. ネガティブプロンプト:
    • ポジティブプロンプトとは逆に、「こうなってほしくない」ことを命令します