yikegaya’s blog

仕事関連(Webエンジニア)と資産運用について書いてます

「Stable Diffusion AI画像生成ハンドブック」を読んだ感想

「Stable Diffusion AI画像生成ハンドブック」を読んで面白かったので軽く内容のメモと感想書きます。

画像生成AIについての本で開発者目線でも面白かったけど、ITリテラシー低めの人が画像生成AI試したいと思った時に手に取るのもアリな本だったと思う。

最近画像生成AIのサービスが増えてきているけどどうやらこの「stable-diffusion」というOSSの画像生成AIモデルが裏で使われていることが多いっぽい。 コード、モデルが非公開のものではChatGPTのOpen AI社など企業が開発した画像生成AIモデルもあるけどOSSでは現状これが有名。

使うには?

自分で環境構築する場合

OSSなので手元のmacにgit cloneしてコマンド叩いたら使える。。かと思ったらGPU搭載のマシンが必要っぽいのでGPU搭載のPCを買ってくるかクラウドサービスを使わないとダメそう

Google Colabatory」というクラウドサービスを使えば時間制限はあるけど無料で動作させることができる

stable-diffusionを動作させるWebサービスやアプリを使う

stable-diffusionを使えるサービスが本書で幾つか紹介されていて日本語対応したものも幾つかあるっぽい

自分はとりあえず公式サイトにリンクされてた「DreamStudio」ってやつを使ってみました DreamStudioは生成した枚数に対する従量課金製だが最初は無料で使える

使ってみて

使い方は英語で欲しい画像のキーワードを入力 or 生成元になる画像+キーワード入力する形

例えば「cyberpank city」と入力するとサイバーパンクっぽい町の絵を作ってくれる。

生成したい画像のキーワード(プロンプト)と除外キーワード(ネガティブプロンプト)を色々と試しながら自分のイメージに近づけていく感じっぽい。

モデルの追加

美少女アニメキャラのアバターが欲しい。。と思ってもStable Difinittionは日本のアニメーション風の画像を作るのは苦手だったりする。その場合自分の好みの画風を学習したモデルを追加して対応することができる。

日本風のアニメ画像を作りたければ本書では「でりたモデル」というモデルの追加が推奨されている。

感想

開発者目線

  • 開発者目線では自由に使える高性能な機械学習モデルって面白いんでとりあえずGoogle Colabatoryで環境構築したり自分のサービスにそれを組み込めないか設計したりはしてみたい。

    画像生成を試した一般ユーザ目線

  • プロンプト指定しても自分のイメージと若干違ったり細かいところをカスタマイズしたくなったりで当面はこれに高度なデザイナーの仕事が奪われることはまだしばらくはないかな?という印象。
  • 高度なデザイナーの仕事っていうのは自社のブランドを大きく左右するプロモーションのデザインだったりゲーム、映画、アニメの画像だったり。
  • 他にも上手い使い方はありそう。本書では塗り絵を作ったり3Dモデルのテクスチャを作ったりデザインのアイデア出しに使ったりといった事例が紹介されてました。
  • ただSNSに使うアイコンが欲しいからクラウドワークスで発注。。みたいな軽めの要件は徐々に奪われてくのかも。