AI総合研究所

SHARE

X(twiiter)にポストFacebookに投稿はてなブックマークに登録URLをコピー

FLUX.1とは?使い方や料金、プロンプトを徹底解説!【画像生成AI】

この記事のポイント

  • Flux.1は高速処理、ローカル利用、オープンソースを特徴とする最新の画像生成AIモデル
  • Pro、Dev、Schnellの3モデルから選択可能で、用途に応じた利用が可能
  • Grok-2との統合により、より簡単にアクセスでき、多機能なAIツールとして進化
  • 他の画像生成AIと比較して高品質なリアリズムを実現し、プロンプトへの忠実度が高い
  • 商用利用や活用シーン、注意点まで幅広く解説し、実践的な利用方法を提供

監修者プロフィール

坂本 将磨

Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。

画像生成AIの最新技術を体感したい方や、よりリアルなビジュアルコンテンツを求めている方にとって、Flux.1は注目すべき存在です。
高速処理、ローカルでの動作、オープンソースという利点を持ち、またプライバシーを重視するユーザーにも適したサービスです。

この記事では、テキストから高品質な画像を生成できるAIモデル「Flux.1」についての概要から始め方、利用時のコツ、そしてどのシーンで活用できるかについて、詳しく解説していきます。
Flux.1は、多様なモデルを選択できるため、一人ひとりのニーズに合わせた使い方が可能です。

さらに、Grok-2との統合によって、よりアクセスしやすく、多機能なAIツールとしても進化しています。ぜひご一読ください。

「AIをマーケティングに活用したいけど、具体的な方法がわからない」とお悩みではありませんか?
AI Marketerなら、効率的なコンテンツ制作と多チャネル展開が簡単に実現できます。
AI Marketerの資料を見てみる

FLUX.1とは

Flux.1とは
Flux.1とは?(Flux.1で作成)

Flux.1は、Black Forest Labsによって開発された、テキストから画像を生成する最新のAIモデルです。
ローカルで動作するよう設計されており、MLXアーキテクチャを活用しています。

特徴 説明
モデル選択 Pro、Dev、Schnellの3モデルから選択可能。
高速処理 「Schnell」モデルは2秒以内で高品質画像生成。ビデオ制作やライブに適する。
ローカル処理 プライバシー保護、オフライン使用、低遅延を実現。
オープンソース Apache 2.0ライセンスで公開。自由なアプリ・ツール開発が可能。
高パフォーマンス リアルな画像生成と高精度なテキスト描画が特徴。

Stable Diffusionとの関係

Flux.1は、Stable Diffusionの開発者が設立した「Black Forest Labs」によって提供されています。
Stable Diffusionは、すでに広く認知されている技術ですが、Flux.1はその技術をさらに発展させたものです。

Stable Diffusionと同様に、Flux.1もテキストから画像を生成する機能を持っており、より詳細な描写や高速な処理が可能となっています。

Grokへの統合

Grok-2でのFlux.1の利用開始
Grok-2にFlux.1が統合
Grok-2にFlux.1が統合

2024年8月のアップデートで、Grok-2にFlux.1が統合されました。
今後Flux.1はGrok-2の一部として使用可能です。それに伴うメリットを以下で解説します。

  • 簡単なアクセスと利用
    以前はFlux.1を利用するには特定のサイトやプラットフォームを通じてアクセスする必要がありましたが、Grok-2に統合されたことで、ユーザーはGrokのインターフェースから直接Flux.1を利用できるようになりました。
    これにより、手軽に高品質な画像を生成できるようになりました。

  • 多機能なAIツールとしての進化
    Grok-2との統合により、Grokは対話型AIだけでなく、画像生成もできる多機能なツールへと進化しました。
    ユーザーはテキストによる対話と画像生成の両方をスムーズに利用できるようになり、クリエイティブなプロジェクトでより豊かな表現が可能になりました。

  • プライバシーと安全性の向上
    ローカル処理の特徴を活かし、ユーザーのデータが外部サーバーに送信されることなく、デバイス内で全ての処理が行われます。
    これにより、プライバシーが保護され、より安全な環境で画像生成が行えます。


FLUX.1のモデル一覧

FLUX.1には、用途やニーズに応じて異なる特性を持つ3つのモデルが提供されています。それぞれのモデルの概要は以下の通りです。

モデル 速度 画像品質 商用利用 メモリ使用量 対象ユーザー 対応プラットフォーム
schnell ◎◎ 個人向け Hugging Face、GitHub、Replicate、fal.ai、mystic、deepinfra
dev 要問い合わせ 個人向け Hugging Face、Replicate、fal.ai、mystic、deepinfra
pro ◎◎ 企業向け、API経由で利用可 Replicate、fal.ai、mystic

FLUX.1 [schnell]

最も高速なモデルで、個人利用や開発者向けに最適です。
Apache 2.0ライセンスの下、オープンソースで公開されているため、Hugging FaceやGitHubから入手し、自分のコンピュータ上でモデルを実行することが出来ます。

また、Replicate・fal.ai・mystic・deepinfraなどのプラットフォームでも利用可能です。

FLUX.1 [dev]

非商用向けのモデルで、FLUX.1 [pro]を元に開発されています。
FLUX.1 [dev]は、FLUX.1 [pro]に匹敵する品質とプロンプトへの従順性が特徴です。Hugging Faceで入手可能でReplicate、fal.ai・mystic・deepinfraなどで直接試すことが出来ます。

FLUX.1 [pro]

FLUX.1シリーズで最も高性能なモデルです。最新の画像生成技術を持っており、リアルで高品質な画像を生成します。
主にAPIを通じて利用可能で、特定のパートナー企業(Replicate、fal.ai、mystic)のプラットフォームでアクセスできます。また、企業向けのカスタマイズソリューションも提供しています。

参考:black forest labs.


FLUX.1の料金

利用方法 利点 欠点
FLUX.1 [schnell](ローカル利用) 無料で使用可能 初期設定に手間がかかる場合がある
APIベースのプラットフォーム利用 セットアップが簡単で、すぐにサービスを利用できる 利用に料金が発生することが多い

FLUX.1 [schnell]バージョンはオープンソースで提供されているため、無料で使用することができます
必要な依存関係のインストールや、ローカル環境でのモデルの適切な動作を確保するための設定などが必要になることが考えられます。

一方で、APIベースのプラットフォームを利用する場合は、セットアップが簡単で、すぐにサービスを利用できる利点がありますが、その分、利用には料金が発生することが多いです。ローカルでの利用はコストがかからない代わりに、初期設定の手間をどう受け入れるかが重要なポイントとなります。

【プラットフォーム別料金表】

モデル Replicate fal.ai mystic.ai deepinfra AIML
Pro $0.055/画像 $0.05/MP $0.055/画像 - $0.0525/画像
Dev $0.03/画像 $0.025/MP 月額会費あり $0.02 x (幅/1024) x (高さ/1024) x (反復処理/25) $0.0263/画像
Schnell $0.003/画像 $0.003/MP 月額会費 $0.002 x (幅/1024) x (高さ/1024) x 反復処理 $0.0032/画像


メガピクセルと画像単位は同じではない点に注意しましょう。

  • メガピクセル (MP)」
    画像の解像度を表す単位で、100万ピクセル(1,000 x 1,000ピクセル)を意味します。
    例えば、1メガピクセルの画像は、縦と横のピクセル数を掛け合わせた結果が100万ピクセルになります。

  • 画像
    1つの画像そのものを単位とするものです。画像の解像度に関係なく、画像1枚に対する料金を指します。

またdeepinfraも生成される画像の幅、高さ、そして処理にかかる計算量に応じて料金が変動します。


FLUX.1の使い方

Flux.1を始める際に、おすすめの方法は2つあります。

1.APIベースのプラットフォームを利用する方法
2.Grokを使用する方法

APIベースのプラットフォームを利用する方法

Flux.1をAPI利用サービスを用いて使用する際、BlackForest社公認のプラットフォームがおすすめです。

以下の4つが公式に認められています。

  1. fal.aiにアクセスし、GitHubアカウントと連携する
    fal.aiにアクセスし、GitHubアカウントと連携
    fal.aiにアクセスし、GitHubアカウントと連携


  1. Model Galleryに移動し、FLUX.1 [pro]を選択
    Model Galleryに移動し、FLUX.1 [pro]を選択
    Model Galleryに移動し、FLUX.1 [pro]を選択

  2. プロンプトと詳細設定の入力
    プロンプトと詳細設定の入力
    プロンプトと詳細設定の入力

各項目について
各項目は目的に応じて微調整することをおすすめしますが、以下の推奨設定だと多くの場合バランスの良い結果が得られるようになっています🙌

設定項目 説明 推奨設定
Image Size (画像サイズ) 画像のアスペクト比と解像度を指定 任意( 1024 x 1024 等)
Num Inference Steps (推論ステップ数) 画像生成時のステップ数。多いほど高品質だが、処理時間も長くなる 40-50
Seed (シード) 同じシード値を使うと、同じプロンプトで同じ画像が生成されます。 任意(特にない場合ランダムでOK)
Guidance Scale (CFG) (ガイダンススケール) プロンプトへの忠実度を調整します。高いほど忠実ですが、創造性が制限されることも。 7
Sync Mode (同期モード) 同期的か非同期的に生成するかを指定します。非同期だとバックグラウンドで生成されます。 オフ
Num Images (生成画像数) 一度に生成する画像の枚数を指定します。 1
Safety Tolerance (安全性許容度) 画像生成時の安全性チェックの厳しさを指定します。高いほど厳しくなります。 2


  1. 結果の確認

結果の確認
luxurious bouquet of white North Pole flowers for AIRI, soft greenery, delicate accents, on a table in a sunlit room, warm sunlight, golden glow, "Happy Birthday AIRI" message card, high-end sophisticated atmosphere

この花束はAI総研が運営しているXのAIRIちゃんに因んで作成しています。

日々Xで有益なAI情報を更新しているので、興味のある方はフォローして頂けると幸いです🙌

Grokで使用する方法

GrokでのFlux.1生成画面
GrokでのFlux.1生成画面

GrokでFlix.1を使用できるのは、X PremiumおよびPremium+に加入しているアカウントのみが対象ですが、非常に簡単に生成できるのでおすすめです。

  1. Xの有料アカウントに登録する
  2. Grokを開く
  3. チャット上で生成


Grokで画像生成する方法については以下の記事で詳しく解説しています。
▶️Grokとは?最新版Grok2や、画像生成機能の使い方をわかりやすく解説


FLUX.1で理想の画像を生成するコツ

ChatGPTでプロンプトを生成している画像
ChatGPTでプロンプトを生成している画像

  1. プロンプトを詳細かつ具体的に設定する
    Fluxはプロンプトに忠実な画像生成が得意です。明確で具体的な指示を出すことで、理想に近い画像を得やすくなります。シンプルかつ具体的なビジュアル要素を含めてプロンプトを作成しましょう。

  2. リアルな質感とディテールを強調する
    Fluxはリアルな質感やディテールを再現する能力に優れています。高級感のある製品や自然物など、リアルが求められる画像を生成する際に、その強みを活かせます。

  3. 生成AIやツールを活用してプロンプトを最適化する
    プロンプトの最適化や生成AIを活用することで、より洗練された画像を効率的に生成できます。フィードバックを基にプロンプトを微調整し、最適な結果を得るための設定を見つけましょう。


【プロンプト付き】FLUX.1の生成例

ここではFlux.1のサイトで紹介されている画像の生成例をプロンプトと合わせて紹介します。

プロンプト

Epic artwork of a massive brutalist building floating above a favela in a tropical landscape, the large brutalist building has large wires and cables hanging from it, cinematic art

(日本語訳)
巨大なブルータリズム建築が熱帯の風景に浮かんでいるエピックなアートワーク。大きなブルータリズム建築には、太いワイヤーやケーブルが垂れ下がっている。映画のような芸術作品。

ブルータリズム建築の例
ブルータリズム建築の例

プロンプト

Macro photography of a drop in the shape of a water cat. The photo has professional lighting and pastel colors. The surface of the water is reflective and the smooth blurred background helps the drop stand out. Water drop cat

(日本語訳)
水滴が水のネコの形をしているマクロ写真。写真にはプロフェッショナルな照明が使用され、パステルカラーが特徴。水面は反射しており、滑らかにぼかされた背景が水滴を際立たせている。水のネコ。

水滴の形をした猫の例
水滴の形をした猫の例

プロンプト

donut jesus hybrid mythical creature

(日本語訳)
ドーナツとイエスのハイブリッド神話生物。

ドーナツの例
ドーナツの例

プロンプト

beautiful anime artwork, a cute anime girl’s silhouette, double exposure, iridescent nebula galaxy, black background, ethereal glow, bloom, hdr

(日本語訳)
美しいアニメアートワーク、かわいいアニメ少女のシルエット、ダブルエクスポージャー、虹色の星雲銀河、黒い背景、幽玄な輝き、ブルーム、HDR

アニメ風
アニメ風

プロンプト

a photo of a beautiful street in Freiburg with a tram passing by and people walking about and riding bikes

(日本語訳)
フライブルクの美しい街並みを写した写真。トラムが通り過ぎ、人々が歩いたり自転車に乗ったりしている

フライブルク
フライブルクの街並み


FLUX.1と他の画像生成AIとの比較

ここではFlux.1の他によく使われているAI画像生成モデルを使用し、同プロンプトでの比較結果を紹介します。

なお、プロンプトの作成方法は後ほど紹介しますが、気になる方は以下のリンクからジャンプしてください🛫
▶️Flux.1で理想の画像を生成するコツ

使用したのは以下の4つのモデルです。

【風景】

Fluxと他の画像生成AIとの比較2
プロンプト:"highly detailed, hyper-realistic sea cave with vibrant blue water, sunlight streaming through entrance, illuminating crystal-clear water, shimmering reflections on cave walls, turquoise water, glowing with sunlight, underwater rocks, smooth sandy bottom, cave interior in shadow, jagged rock formations, natural arches, serene and awe-inspiring ocean beauty, light play on water surface"

【人物】

Fluxと他の画像生成AIとの比較4
プロンプト:"highly detailed, hyper-realistic 20-year-old Japanese woman with deep brown, slightly wavy, shoulder-length hair, wearing a simple yet elegant sleeveless white dress, gentle expression, soft features, smooth clear skin, dress of light flowing fabric with lace hem, standing in serene garden, soft natural light"

【動物】

Fluxと他の画像生成AIとの比較5
プロンプト:"world's tiniest white Pomeranian puppy with a cute little face, walking down a charming cobblestone street lined with colorful flowers in bloom, quaint picturesque town, pastel-colored buildings, small shops with flower boxes, soft warm sunlight, gentle shadows, fluffy fur, whimsical and heartwarming atmosphere, capturing pure joy and innocence of the tiny puppy in an idyllic setting"

【腕時計プロモーション】

Fluxと他の画像生成AIとの比較1
プロンプト:"A hyper-realistic promotional image of a luxury women's wristwatch, adorned with delicate diamonds and rose gold accents. The watch is designed with an elegant, feminine touch, featuring a slender band and a sparkling dial set with fine jewels. The logo "AI souken" is prominently displayed on the watch face. The background is softly blurred, with warm, ambient lighting that highlights the watch's intricate details and shimmering gemstones. The overall image exudes sophistication, elegance, and timeless femininity, making it perfect for a high-end jewelry campaign"

以下の点が明らかになっているのがお分かりいただけたと思います。

  • 特にFlux.1とMidjourneyが非常に高品質
  • Flux.1はリアルさとプロンプトに対する忠実度が高く、プロモーションに最適
  • Midjourneyも高品質で、特に華やかさとスタイルの点で優位性がある

Microsoft DesignerとAdobe Fireflyもそれぞれ独自の特徴を持ちますが、リアルでプロンプトの再現性を求める場合にはFlux.1が最も優位であると言えます。

公式による他モデルとのテスト結果

Flux.1のレーダーチャート
Flux.1のレーダーチャート

ここではFlux.1と他モデルの比較結果を説明します。
以下のベンチマークを見ていきましょう。

項目 Flux.1 [Pro] Midjourney V6.0 DALL-E 3 HD SD3-Ultra
1.プロンプトへの忠実さ ◉◉
2.視覚的品質 ◉◉
3.サイズ・アスペクトの多様性
4.出力の多様性
5.文字の生成 ◉◉
  1. プロンプトへの対応(Promot Following)
    先ほど見たように、Flux.1は、プロンプトに従って画像を生成する能力が高く、特にプロンプトの複雑な指示にも一貫して適応できる点で優れています。

  2. 視覚的品質(Visual Quality)
    画像の視覚的な質においても、Flux.1は非常に高い評価を受けています。特に生成された画像のリアルさや細部の表現力に強みがあります。

  3. サイズ/アスペクトの多様性(Size/Aspect Variability)
    画像のサイズやアスペクト比に関しても、Flux.1は高い柔軟性を持つため、さまざまなメディアやフォーマットに対応する必要があるマーケティングや広告キャンペーンにおいて有用です。

  4. 出力の多様性(Output Diversity)
    Flux.1は、生成できる画像のバリエーションも豊富であり、様々なスタイルや内容に柔軟に対応が可能です。

  5. 文字の生成(Typography)
    Flux.1は、タイポグラフィに関しても安定しており、テキストを含む画像の生成においても強みを発揮します。この点においては現時点で最も優れているモデルです。

FLUX.1利用時の注意点

これらの点が、FLUX.1がMidjourneyと比較した際に弱みとなり得る点です。

ただし、両サービスにはそれぞれ長所があり、用途によって適切な選択は異なることは留意しましょう。

  1. 芸術的な生成
    FLUX.1はリアルさと正確なプロンプトの忠実さに重点を置いているのに対し、Midjourneyは創造的な柔軟性と芸術的表現に優れています。

そのため、芸術性のある、豊かな出力結果をを重視するプロジェクトには、Midjourneyの方が良い結果を出す場合が多いです(下記画像参照)

Flux.1の注意点1
Watercolor painting of a cute and beautiful girl with short hair wearing a yukata, The artwork features pastel colors, light blue eyes, and a white background, showcasing a charming anime character design

Flux.1の注意点2
children's book illustration of an anthropomorphic cabbage rhinoceros, full body shot, with a green and white color scheme, suitable for children's picture books'

  1. ユーザーコミュニティの規模
    FLUX.1はローンチ後というのもあり、Midjourneyと比べてユーザー数がまだかなり少ないです。Grokとの連携も加わり、今後ユーザー数の増加が予想されますが、現時点ではコミュニティサポートや、トラブルシューティングのためのリソースが、Midjourneyに比べて限られています。

  2. ビルトイン機能の制限
    新しいサービスであるFLUX.1は、Midjourneyと比較してAI画像編集機能が少ないです。
    MidjourneyはInpainting(画像修復)機能やBlend(異なる複数(2~5枚)の画像を組み合わせて新しい画像を生成)など、Midjourney内で使用できるツールをより多く提供しています。この点においても複雑な画像操作タスクにおいてより汎用性が高いと言えます。


FLUX.1の活用シーン

FLUX.1の活用シーン(flux.1で作成)
FLUX.1の活用シーン(flux.1で作成)

様々な活用が期待できるFlux.1では、以下の使用方法がおすすめです。
Midjourneyや他の画像生成AIモデルと組み合わせて、ニーズに合った最適な使用方法を見つけていきましょう👀

  1. 製品のプロモーション
    高級腕時計/ジュエリー/車など、プロモーション画像を作成する際、Flux.1では製品の質感やディテールを忠実に再現できるため、魅力的なビジュアルを作成する事ができます。

  2. アイデア出しと視覚化
    新製品やデザインのアイデアを視覚化する際、Flux.1を使用することで、初期段階でのイメージを具体的に見える形にできます。これにより、製品やデザインを実行するかどうかの判断が迅速かつ効率的に行えます。

  3. Grokと組み合わせてのコンテンツ制作とXでの発信
    シーン: Grokを使ってコンテンツの生成や編集を行い、Flux.1でリアルなビジュアルを作成することで、X(旧Twitter)での効果的な発信が可能です。これにより、短期間で高品質なコンテンツを作成し、広範囲に情報を発信することができます。

  4. Midjourneyで生成した画像の再挑戦
    Midjourneyで生成した画像が思ったほどリアルでなかった場合、Flux.1を使って再度試してみることで、よりリアルで納得のいく結果を得ることができます。Flux.1の得意分野であるリアリズムを活かして、期待に応える画像を生成できます。


まとめ

本記事では、最新の画像生成AIであるFlux.1について、その特徴や活用シーン、他の画像生成AIとの比較を通じてご紹介しました。

Flux.1は、そのリアルさとプロンプトへの忠実さで際立っており、特に高品質なプロモーション画像やビジュアライゼーションに適しています。また、Grokとの統合により、X(旧Twitter)でのコンテンツ発信がより効果的に行えるようになり、クリエイティブなプロジェクトにおいて大きな力を発揮します。

これからの画像生成AI分野において、Flux.1は非常に有力なツールとして更にユーザーが増加していく事が予想されます。簡単無料で使用可能なので、ぜひ一度試してみてください。

AI活用のノウハウ集「AI総合研究所」サービスご紹介資料

「AI総合研究所 サービス紹介資料」は、AI導入のノウハウがないというお客様にも使いやすい最先端のAI導入ノウハウを知れる資料です。

資料ダウンロード
監修者

坂本 将磨

Microsoft AIパートナー、LinkX Japan代表。東京工業大学大学院で技術経営修士取得、研究領域:自然言語処理、金融工学。NHK放送技術研究所でAI、ブロックチェーン研究に従事。学会発表、国際ジャーナル投稿、経営情報学会全国研究発表大会にて優秀賞受賞。シンガポールでのIT、Web3事業の創業と経営を経て、LinkX Japan株式会社を創業。

関連記事

AI導入の最初の窓口。

お悩み・課題に合わせて活用方法をご案内いたします。
お気軽にお問合せください。

AI総合研究所 Bottom banner

ご相談
お問い合わせは
こちら!