2024-12-09

Stable Diffusionとは？使い方や料金体系、無料で使う方法を徹底解説

この記事のポイント

Stable Diffusionは、テキストプロンプトから高品質な画像を生成できるAIツール
オープンソースで提供され、ローカルPCでの利用や各種クラウドサービスでの利用が可能
Diffusionモデルを使用し、ノイズから徐々に画像を生成する革新的な技術を採用
商用利用は基本的に可能だが、利用するサービスや方法によって条件が異なる
料金は無料から有料まで幅広く、ユーザーのニーズに合わせて選択可能

監修者プロフィール

坂本将磨

フォローする

Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域：自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。

AIが生み出す芸術的な画像の創造に革命をもたらした「Stable Diffusion」とは一体どういったサービスなのでしょうか。

本記事では、ユーザーの指示に従って自在に画像を生成するAI、「Stable Diffusion」の魅力を、具体例を交えながら分かりやすく解説していきます。その技術背景や応用範囲、オープンソースとしてのアクセシビリティ、商用利用の可否、さらには無償から有償までのサービス利用料金に至るまで、幅広く掘り下げていきます。

また、Stable Diffusionの活用方法や、ご自身にぴったり合うプランを選定するためのヒントもご紹介しています。これから使い始める方にとって最適な内容となっておりますので、ぜひ最後までご覧ください。

「AIをマーケティングに活用したいけど、具体的な方法がわからない」とお悩みではありませんか？
AI Marketerなら、効率的なコンテンツ制作と多チャネル展開が簡単に実現できます。
⇒AI Marketerの資料を見てみる

Stable Diffusionとは

Stable Diffusionの変遷

Stable Diffusionの使い方

Stable Diffusionの技術背景

Transformerモデル：関連性や順序の理解

Diffusionモデル：徐々にノイズを取り除くプロセス

Stable Diffusionの商用利用や著作権について

Stable Diffusion料金について

まとめ

Stable Diffusionとは

Stable Diffusionは、画像生成AIの一種です。
百聞は一見に如かずということで、さっそくどんなことが出来るのか確認していきましょう。

例えば、以下の画像はStableDiffusionを使って生成されています。
SD_example
StableDiffusionで生成した画像

この画像を生成するために必要としたのは、以下の文章です。

浜辺で夕日を眺める若者を遠くから見ている場面。

たったこれだけの文章で、このような驚くほど美しい画像が生成されるのです。
この時に使用した文章を「プロンプト」と呼び、このプロンプトを巧みに操ることで、必要とする画像を容易に作り出すことができるのが画像生成AIの魅力です。

最近では、プロンプトに文章だけではなく、画像や音声を使えるAIも登場してきているほど、生成AIは移り変わりが早いです。そんな生成AIの流れに大きな衝撃を与えたのは、深層学習モデルの一つである「Diffusion Model(拡散モデル)」です。

Stable Diffusionを利用することで、このDiffusionモデルによる画像生成を体験できます。

Stable Diffusionの変遷

Stable Diffusionは、Stability AI社によってリリースされました。
そもそも背景を辿っていけば、画像生成AIのブームは2021年頃を始まりとしており、ごく最近のことなのです。

画像生成AIは、2021年にOpenAIから発表されたサービス「DALL-E」が画期的であることから、注目が集まっていました。
しかし、OpenAIとは名ばかりにOpen（=開く）されることなく、広く人々にとって快適に使えるようにはなりませんでした。

そんな中、世界中の画像生成AIに熱狂する人々が、民間的に立ち上げたのが「LAION」プロジェクトです。このプロジェクトは、「画像生成AIを民主化すること」を目的にインターネット上で結成された、分散型自律組織です。

そこでは、ビッグ・テック（Google,Apple,Meta,Amazon.com,Microsoft）に依存しない方法での努力が積み重ねられていきます。

LAION
LAION の説明画像 (参考:LAION

そこでは、「LAION 5B」というデータセットなど、画像生成AIを開発するための成果が生み出されました。
この「LAION」プロジェクトの成果を利用する形で、登場したのが、「Midjourney」や「Stability AI」などの企業です。

その中でも、Stability AIが「LAION」プロジェクトの意志を引き継ぐような形で、Stable Diffusionをオープンソースでリリースしました。

Stable Diffusionの使い方

Stable Diffusionはオープンソースとして無料で配布されており、ユーザー各自のPCで動かすことができます。

ただ、自分のPCにインストールしたり、動かしたりするためには、「一定以上のパソコンの機能（GPU/メモリ/ストレージ etc..）」や「ITに関する基礎的な知識」が必要になってきます。そのため、初心者にとっては取っ付き辛い側面にあります。

しかし、そういった部分をプロバイダー側が負担し、ユーザーは「ブラウザ上でテキストや画像を入力したり、パラメーターを設定するだけで利用できるようなサービス」が各社からリリースされています。

それらは無料で使えるものから有料のものまで幅広く展開されており、それぞれで出来ることや使いやすさが変わってくるため、自身のニーズや予算に沿ったサービスを選定する必要があります。

このように、Stable Diffusionを使う方法には「ローカル(ユーザーのPC上)で利用する方法」と、「企業が提供するWebサービスを利用する方法」の2種類があります。

以下の記事で、「各サービスの種類」や「それぞれの使い方」について詳しく紹介しています。ぜひ合わせてお読みください。
➡️Stable Diffusionの使い方！初心者でもわかりやすく解説

Stable Diffusionの技術背景

画像を生成すると一口にいっても、StableDiffusionには、様々な技術が詰め込まれています。

その中でも、画像生成の軸となっているのは、先ほど触れた「Diffusionモデル」という深層学習モデルです。

これまで、画像生成AIの領域では、Transformer（トランスフォーマー）という深層学習モデルを軸に画像が生成されていました。
TransformerモデルとDiffusionモデルは、画像を生成する方法は全く異なります。

Transformerモデル：関連性や順序の理解

Transformerモデルはもともとテキストデータの処理に用いられてきた技術です。

画像生成におけるTransformerの利用は、画像を一連のピクセルやパッチ（小さな画像の断片）として扱い、これらの間の関連性や順序を理解しようとすることに焦点を当てています。

つまり、文章の流れや文脈の理解能力を、画像の構造や要素間の関係性の理解に応用しています。

Transformerを用いた画像生成モデルは、画像内の各部分がどのように関係し合っているかを深く理解することにより、詳細で複雑な画像を生成する能力を持ちます。
transformer_image
Transformerモデルにおける画像生成プロセスのイメージ

Diffusionモデル：徐々にノイズを取り除くプロセス

それに対して、Diffusionモデルは、全く異なるアプローチを取ります。このモデルは、最初に完全なランダムノイズ（意味のない画像/白紙）から出発し、徐々にこのノイズを取り除くプロセスを経て目的の画像を生成します。
このプロセスは、実際に絵を描く人が細部を修正しながら徐々に全体像を形成していく過程に似ています。

Diffusionモデルは、ランダムノイズの中から徐々に意味のある構造を取り出し、ユーザーが入力したテキストの説明に合った画像を段階的に「描き上げる」ことができます。
Diffusion_image
Diffusionモデルにおける画像生成プロセスのイメージ

Stable Diffusionの商用利用や著作権について

Stable Diffusionは基本的に商用利用可能ですが、実際に使用する際にはいくつか注意が必要です。

先ほど紹介したようにStable Diffusionを利用する方法はいくつかありますが、企業が提供するサービスを利用する際には、サービスごとに異なる利用規約が設けられている場合があります。
たとえば、「無料プランでは商用利用が禁止されているが、有料プランにアップグレードすることで商用利用が許可される」という場合もあります。

このように、具体的な使用状況や運用方法次第で、商用利用の可否が変わってくる場合があります。
サービスを適切に活用し、トラブルを避けるためには、あらかじめ詳細な利用規約を確認しておく必要があります。

Stable Diffusion料金について

先ほどの商用利用の場合と同様に、料金についても一律の説明は難しいです。

自分のPCにStableDiffusionをインストールして使う場合は、基本的に費用はかかりませんが、PCの性能を補填する場合など、間接的に費用が発生する可能性はあります。

一方、企業が提供するサービスを利用する際は、企業ごとに料金体系や提供機能が異なります。無料で利用できる基本プランと、高度な機能が使える有料プランが用意されていたり、生成物の量に応じた従量課金制のケースもあります。

以下の図表では、各サービスの料金と費用を比較しています。

サービス名	料金	機能
Stable Diffusion Online	・クレジットの範囲内で無料	・画像生成
Dream Studio	・クレジットの範囲内で無料・従量課金制	・画像生成・画像の詳細設定
Mage.space	・無料・有料プランでは利用可能なモデル数が増加	・画像生成・画像の詳細設定、・モデル変更（有料）
Hugging Face	・無料	・画像生成のみ
Leonaldo AI	・クレジットの範囲内で無料・有料プランごとに機能が変わる	・画像生成・画像の詳細設定・モデル変更（有料）・その他のカスタム機能