この記事のポイント
- Stable Diffusionは、テキストプロンプトから高品質な画像を生成できるAIツール
- オープンソースで提供され、ローカルPCでの利用や各種クラウドサービスでの利用が可能
- Diffusionモデルを使用し、ノイズから徐々に画像を生成する革新的な技術を採用
- 商用利用は基本的に可能だが、利用するサービスや方法によって条件が異なる
- 料金は無料から有料まで幅広く、ユーザーのニーズに合わせて選択可能
監修者プロフィール
坂本 将磨
Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。
AIが生み出す芸術的な画像の創造に革命をもたらした「Stable Diffusion」とは一体どういったサービスなのでしょうか。
本記事では、ユーザーの指示に従って自在に画像を生成するAI、「Stable Diffusion」の魅力を、具体例を交えながら分かりやすく解説していきます。 その技術背景や応用範囲、オープンソースとしてのアクセシビリティ、商用利用の可否、さらには無償から有償までのサービス利用料金に至るまで、幅広く掘り下げていきます。
また、Stable Diffusionの活用方法や、ご自身にぴったり合うプランを選定するためのヒントもご紹介しています。これから使い始める方にとって最適な内容となっておりますので、ぜひ最後までご覧ください。
「AIをマーケティングに活用したいけど、具体的な方法がわからない」とお悩みではありませんか?
AI Marketerなら、効率的なコンテンツ制作と多チャネル展開が簡単に実現できます。
⇒AI Marketerの資料を見てみる
目次
Stable Diffusionとは
Stable Diffusionは、画像生成AIの一種です。
百聞は一見に如かずということで、さっそくどんなことが出来るのか確認していきましょう。
例えば、以下の画像はStableDiffusionを使って生成されています。
StableDiffusionで生成した画像
この画像を生成するために必要としたのは、以下の文章です。
浜辺で夕日を眺める若者を遠くから見ている場面。
たったこれだけの文章で、このような驚くほど美しい画像が生成されるのです。
この時に使用した文章を「プロンプト」と呼び、このプロンプトを巧みに操ることで、必要とする画像を容易に作り出すことができるのが画像生成AIの魅力です。
最近では、プロンプトに文章だけではなく、画像や音声を使えるAIも登場してきているほど、生成AIは移り変わりが早いです。そんな生成AIの流れに大きな衝撃を与えたのは、深層学習モデルの一つである「Diffusion Model(拡散モデル)」です。
Stable Diffusionを利用することで、このDiffusionモデルによる画像生成を体験できます。
Stable Diffusionの変遷
Stable Diffusionは、Stability AI社によってリリースされました。
そもそも背景を辿っていけば、画像生成AIのブームは2021年頃を始まりとしており、ごく最近のことなのです。
画像生成AIは、2021年にOpenAIから発表されたサービス「DALL-E」が画期的であることから、注目が集まっていました。
しかし、OpenAIとは名ばかりにOpen(=開く)されることなく、広く人々にとって快適に使えるようにはなりませんでした。
そんな中、世界中の画像生成AIに熱狂する人々が、民間的に立ち上げたのが「LAION」プロジェクトです。このプロジェクトは、「画像生成AIを民主化すること」を目的にインターネット上で結成された、分散型自律組織です。
そこでは、ビッグ・テック(Google,Apple,Meta,Amazon.com,Microsoft)に依存しない方法での努力が積み重ねられていきます。
LAION の説明画像 (参考:LAION
そこでは、「LAION 5B」というデータセットなど、画像生成AIを開発するための成果が生み出されました。
この「LAION」プロジェクトの成果を利用する形で、登場したのが、「Midjourney」や「Stability AI」などの企業です。
その中でも、Stability AIが「LAION」プロジェクトの意志を引き継ぐような形で、Stable Diffusionをオープンソースでリリースしました。
Stable Diffusionの使い方
Stable Diffusionはオープンソースとして無料で配布されており、ユーザー各自のPCで動かすことができます。
ただ、自分のPCにインストールしたり、動かしたりするためには、「一定以上のパソコンの機能(GPU/メモリ/ストレージ etc..)」や「ITに関する基礎的な知識」が必要になってきます。そのため、初心者にとっては取っ付き辛い側面にあります。
しかし、そういった部分をプロバイダー側が負担し、ユーザーは「ブラウザ上でテキストや画像を入力したり、パラメーターを設定するだけで利用できるようなサービス」が各社からリリースされています。
それらは無料で使えるものから有料のものまで幅広く展開されており、それぞれで出来ることや使いやすさが変わってくるため、自身のニーズや予算に沿ったサービスを選定する必要があります。
このように、Stable Diffusionを使う方法には「ローカル(ユーザーのPC上)で利用する方法」と、「企業が提供するWebサービスを利用する方法」の2種類があります。
以下の記事で、「各サービスの種類」や「それぞれの使い方」について詳しく紹介しています。ぜひ合わせてお読みください。
➡️Stable Diffusionの使い方!初心者でもわかりやすく解説
Stable Diffusionの技術背景
画像を生成すると一口にいっても、StableDiffusionには、様々な技術が詰め込まれています。
その中でも、画像生成の軸となっているのは、先ほど触れた「Diffusionモデル」という深層学習モデルです。
これまで、画像生成AIの領域では、Transformer(トランスフォーマー)という深層学習モデルを軸に画像が生成されていました。
TransformerモデルとDiffusionモデルは、画像を生成する方法は全く異なります。
Transformerモデル:関連性や順序の理解
Transformerモデルはもともとテキストデータの処理に用いられてきた技術です。
画像生成におけるTransformerの利用は、画像を一連のピクセルやパッチ(小さな画像の断片)として扱い、これらの間の関連性や順序を理解しようとすることに焦点を当てています。
つまり、文章の流れや文脈の理解能力を、画像の構造や要素間の関係性の理解に応用しています。
Transformerを用いた画像生成モデルは、画像内の各部分がどのように関係し合っているかを深く理解することにより、詳細で複雑な画像を生成する能力を持ちます。
Transformerモデルにおける画像生成プロセスのイメージ
Diffusionモデル:徐々にノイズを取り除くプロセス
それに対して、Diffusionモデルは、全く異なるアプローチを取ります。このモデルは、最初に完全なランダムノイズ(意味のない画像/白紙)から出発し、徐々にこのノイズを取り除くプロセスを経て目的の画像を生成します。
このプロセスは、実際に絵を描く人が細部を修正しながら徐々に全体像を形成していく過程に似ています。
Diffusionモデルは、ランダムノイズの中から徐々に意味のある構造を取り出し、ユーザーが入力したテキストの説明に合った画像を段階的に「描き上げる」ことができます。
Diffusionモデルにおける画像生成プロセスのイメージ
Stable Diffusionの商用利用や著作権について
Stable Diffusionは基本的に商用利用可能ですが、実際に使用する際にはいくつか注意が必要です。
先ほど紹介したようにStable Diffusionを利用する方法はいくつかありますが、企業が提供するサービスを利用する際には、サービスごとに異なる利用規約が設けられている場合があります。
たとえば、「無料プランでは商用利用が禁止されているが、有料プランにアップグレードすることで商用利用が許可される」という場合もあります。
このように、具体的な使用状況や運用方法次第で、商用利用の可否が変わってくる場合があります。
サービスを適切に活用し、トラブルを避けるためには、あらかじめ詳細な利用規約を確認しておく必要があります。
【関連記事】
➡️Stable Diffusionの商用利用を解説!モデルやライセンス別の確認方法も
Stable Diffusion料金について
先ほどの商用利用の場合と同様に、料金についても一律の説明は難しいです。
自分のPCにStableDiffusionをインストールして使う場合は、基本的に費用はかかりませんが、PCの性能を補填する場合など、間接的に費用が発生する可能性はあります。
一方、企業が提供するサービスを利用する際は、企業ごとに料金体系や提供機能が異なります。無料で利用できる基本プランと、高度な機能が使える有料プランが用意されていたり、生成物の量に応じた従量課金制のケースもあります。
以下の図表では、各サービスの料金と費用を比較しています。
サービス名 | 料金 | 機能 |
---|---|---|
Stable Diffusion Online | ・クレジットの範囲内で無料 | ・画像生成 |
Dream Studio | ・クレジットの範囲内で無料 ・従量課金制 |
・画像生成 ・画像の詳細設定 |
Mage.space | ・無料 ・有料プランでは利用可能なモデル数が増加 |
・画像生成 ・画像の詳細設定、 ・モデル変更(有料) |
Hugging Face | ・無料 | ・画像生成のみ |
Leonaldo AI | ・クレジットの範囲内で無料 ・有料プランごとに機能が変わる |
・画像生成 ・画像の詳細設定 ・モデル変更(有料) ・その他のカスタム機能 |
ここでは、各サービスの概要のみ紹介しています。
以下の記事では「それぞれのサービスで出来ること」、「利用方法ごとの料金体系」をくわしく解説していますので、ぜひあわせてお読みください。
➡️Stable Diffusionの料金は?無料サービスやクラウド料金を徹底比較!
まとめ
この記事を通じて、StableDiffusionの多様な利用方法やその仕組みについて紹介しました。
StableDiffusionはオープンソースであるため、利用可能なサービスや導入方法には幅広い選択肢があり、初めて触れる方にとってはどの道を選ぶべきか迷うこともあるでしょう。
また、商用での使用や料金体系もサービスごとに異なるため、これらの点を踏まえて自分にとって最適な方法を見つけ出すことが重要です。
そこで重要なのは、まず「自分がどのような目的やユースケースでStableDiffusionを活用したいのか」をはっきりと定めることです。
自身のニーズを明確化すれば、適切な情報を集めやすくなり、効率的な導入が可能になるでしょう。
例えば、個人の創作活動で使うのであれば、無料で自身のPCにインストールする方法を検討するのが適切かもしれません。一方、企業での商用利用を見据えるのであれば、有料サービスを比較検討する必要がでてくるはずです。
このようにニーズをしっかりと定めた上で、オープンソースのメリットであるフレキシビリティの高さを最大限に活かし、目的に合った最適な利用形態を見つけていくことが大切になります。
そうすることで、StableDiffusionの可能性を最大限に引き出し、創造性を存分に発揮できるはずです。オープンソースならではの自由度の高さを享受できるようになるでしょう。