FLUX.1は、Stable Diffusionの開発陣が立ち上げたBlack Forest Labsが2023年6月30日に発表した最新の画像生成AIモデルです。高品質な画像生成と優れたプロンプト追従性、多様な出力を特徴としています。今回はその概要と、オンラインデモでの試用結果をご紹介します。
FLUX.1の概要
FLUX.1とは何なのか?
FLUX.1は、画像生成AIモデルと呼ばれるものです。そのため、Stable Diffusionや、MidjourneyといったAIツールのことではないです。(私はFLUX.1を知った当初、それを勘違いしておりました。)
画像生成AIモデルとは、画像生成AIにおけるアルゴリズムとパラメータの集合体のことです。車でいうとエンジン、人でいうと脳に相当するものです。このモデルを交換することで、様々なスタイルの作品を作り出せるのが、Stable Diffusionのような画像生成AIツールの特徴です。
FLUX.1のバリエーション
FLUX.1には3つのバリエーションが提供されています。
- FLUX.1 [pro]: 最高性能を誇るモデル。APIやパートナー経由で利用可能。
- FLUX.1 [dev]: 非商用アプリケーション向けのオープンウェイトモデル。HuggingFaceで利用可能。
- FLUX.1 [schnell]: ローカル開発や個人利用に最適化された高速モデル。Apache2.0ライセンスで公開。
FLUX.1の性能と技術的な特徴
性能
Black Forest Labsは、FLUX.1が以下の点で他の画像生成AIを上回ると説明しています。
- 視覚品質
- プロンプトの追従性
- サイズ/アスペクト比の可変性
- タイポグラフィ
- 出力の多様性
技術的な特徴
・120億のパラメータ
・マルチモーダルおよび並列拡散トランスフォーマーブロックのハイブリッドアーキテクチャ
・「フローマッチング」と呼ばれるDiffusionモデルを一般化する手法の採用
・回転位置埋め込みと並列アテンションレイヤーの組み込み
つまり、FLUX.1は大量の情報を効率よく処理し、高品質な画像を素早く生成できる先進的なAIモデルだと言えます。これらの技術革新により、従来のAIモデルよりも優れた性能を発揮することができるといわれています。
FLUX.1の使用方法
FLUX.1は様々な方法で利用できます。
- Hugging Faceのオンラインデモを利用する
- ComfyUIを使ってローカル環境で動かす
- Google Colabを使ってクラウド上で実行する
FLUX.1を試用してみる
では、3つの方法を検証してみたいと思います。
Hugging Faceのオンラインデモを試す
まずは、一番お手軽な方法のご紹介です。Hugging Faceの下記URLに接続し、プロンプトを指定し、Runボタンを押します。
今回指定したプロンプトは「1cute girl japanese comic style, wearing white dress , background summer beach.」というシンプルなもの。数秒間から10秒程度でかなり忠実なイラストを生成してくれました。

まとめ
✔ まとめ
-
本記事では、最新の画像生成AIモデル FLUX.1について、その概要とオンラインデモによる試用結果をお伝えしました。次回は、ComfyUIを使用した利用について記事にさせて頂きたいと思います。
おすすめ!情報メディア学修士, 応用情報技術者
Wikipedia国際会議, 人工知能学会, 情報処理学会, 自然言語処理学会, 人文科学とコンピューターシンポジウムへのへの論文寄稿および受賞歴あり。扱ったことのあるプログラミング言語は、C, C++, COBOL, アセンブリ言語, Pascal, Java, Python, JavaScript等。特に言語に依存することなく必要に応じて使用します。

コメント