دنیای تولید تصویر با هوش مصنوعی تا همین اواخر بین دو قطب تقسیم شده بود: ابزارهای بسته و گران مثل Midjourney، یا مدلهای اوپنسورس با کیفیت پایینتر مثل نسخههای اولیه Stable Diffusion. اما Flux از Black Forest Labs این معادله را بههم زد — مدلی متنباز با کیفیتی که مستقیماً با Midjourney رقابت میکند.
در این راهنما توضیح میدهیم Flux چیست، چطور کار میکند، چه تفاوتی با رقبا دارد و چطور کاربران ایرانی میتوانند از آن بهره ببرند.
Flux دقیقاً چیست
Flux یک مدل تولید تصویر از متن (text-to-image) است که توسط Black Forest Labs توسعه داده شده — همان تیمی که قبلاً Stable Diffusion را ساخته بودند. این مدل در چند نسخه عرضه شده:
- Flux.1 Pro — نسخه تجاری با بالاترین کیفیت، از طریق API در دسترس
- Flux.1 Dev — نسخه توسعهدهندگان با وزنهای آزاد، برای استفاده غیرتجاری
- Flux.1 Schnell — نسخه سریع و سبک، کاملاً اوپنسورس با لایسنس Apache 2.0
تفاوت اصلی Flux با نسل قبلی مدلها: معماری جدید مبتنی بر Transformer (نه U-Net سنتی)، درک بهتر از prompt های پیچیده، و خروجیهایی که از نظر جزئیات و واقعگرایی یک سر و گردن بالاتر هستند.
چطور کار میکند
Flux از معماری DiT (Diffusion Transformer) استفاده میکند. به زبان ساده:
۱. شما یک prompt متنی مینویسید (مثلاً «یک قهوهخانه سنتی ایرانی در غروب آفتاب، سبک عکاسی سینمایی») ۲. مدل از نویز تصادفی شروع میکند و مرحلهبهمرحله آن را به تصویری تبدیل میکند که با توصیف شما مطابقت دارد ۳. در هر مرحله، Transformer متن شما را تفسیر میکند و تصویر را اصلاح میکند
نتیجه: تصاویری با رزولوشن بالا، جزئیات دقیق، و درک عمیق از مفاهیم پیچیده مثل نور، بافت و ترکیببندی.
ویژگیهای کلیدی
کیفیت خروجی بالا
Flux در بنچمارکهای مختلف (ELO rating، ارزیابی انسانی) با Midjourney v6 و DALL-E 3 رقابت مستقیم دارد. بهخصوص در تولید چهرههای واقعگرایانه، متن داخل تصویر، و صحنههای پیچیده عملکرد فوقالعادهای دارد.
سرعت تولید
نسخه Schnell در کمتر از ۲ ثانیه روی GPU مناسب تصویر تولید میکند. حتی نسخه Dev هم نسبت به Stable Diffusion XL سریعتر است.
وزنهای آزاد و LoRA
چون وزنهای مدل در دسترس هستند، میتوانید:
- مدل را روی سبک خاص خودتان fine-tune کنید
- از LoRA های آماده جامعه استفاده کنید (هزاران LoRA در Civitai و HuggingFace)
- مدل را روی سرور خودتان اجرا کنید بدون وابستگی به API
درک بهتر از Prompt
Flux از T5-XXL بهعنوان text encoder استفاده میکند که درک بسیار بهتری از جملات طولانی و پیچیده فارسی/انگلیسی دارد. دیگر لازم نیست prompt های عجیب و غریب بنویسید — جملات طبیعی هم خوب کار میکنند.
سبک واقعگرایانه
Flux بهصورت پیشفرض به سمت فوتورئالیسم تمایل دارد. برای عکاسی محصول، پرتره، و تصاویر تبلیغاتی بدون نیاز به تنظیمات خاص نتایج عالی میدهد.
مقایسه Flux با رقبا
| ویژگی | Flux Pro | Midjourney v6 | DALL-E 3 | Stable Diffusion XL | Leonardo AI |
|---|---|---|---|---|---|
| کیفیت تصویر | عالی | عالی | خوب | خوب | خوب+ |
| سرعت | بسیار بالا | متوسط | بالا | متوسط | بالا |
| اوپنسورس | بله (Dev/Schnell) | خیر | خیر | بله | خیر |
| LoRA/Fine-tune | بله | خیر | خیر | بله | محدود |
| متن در تصویر | عالی | خوب | عالی | ضعیف | متوسط |
| قیمت API | ~$0.03/تصویر | $10/ماه | $20/ماه (ChatGPT Plus) | رایگان (لوکال) | $12/ماه |
| کنترل سبک | بالا | بالا | محدود | بالا | متوسط |
خلاصه مقایسه:
- Midjourney هنوز در سبکهای هنری و زیباییشناسی خاص خودش برتری دارد، ولی بسته و گران است.
- DALL-E 3 ادغام عالی با ChatGPT دارد ولی کنترل کمتری روی خروجی میدهد.
- Stable Diffusion XL اوپنسورس است ولی کیفیت پایهاش از Flux پایینتر است.
- Leonardo AI رابط کاربری خوبی دارد ولی مدلهایش به قدرت Flux نمیرسند.
- Flux بهترین ترکیب کیفیت + آزادی + سرعت را ارائه میدهد.
چه کسانی از Flux استفاده میکنند
- طراحان گرافیک — تولید سریع concept و mockup بدون نیاز به عکاسی
- توسعهدهندگان اپلیکیشن — تولید asset برای بازی و اپ
- بازاریابان دیجیتال — ساخت تصاویر تبلیغاتی بدون هزینه عکاسی
- هنرمندان دیجیتال — ترکیب سبک شخصی با قدرت AI از طریق LoRA
- محققان — آزمایش و توسعه مدلهای جدید روی پایه Flux
کاربردهای عملی برای کاربران ایرانی
تولید محتوای بصری برای کسبوکار
اگر فروشگاه اینترنتی دارید و بودجه عکاسی حرفهای ندارید، Flux میتواند تصاویر محصول، بنر تبلیغاتی و محتوای شبکههای اجتماعی تولید کند. کافی است محصول خود را توصیف کنید و چند ثانیه صبر کنید.
طراحی UI/UX
قبل از شروع طراحی نهایی، میتوانید با Flux سریع چند concept بصری تولید کنید. مثلاً «صفحه لندینگ یک اپلیکیشن فینتک ایرانی با رنگهای آبی و طلایی» و ایدههای اولیه را ببینید.
تولید محتوا برای شبکههای اجتماعی
برای اینستاگرام و تلگرام، تصاویر یونیک و جذاب تولید کنید بدون نگرانی از کپیرایت. هر تصویر Flux اورجینال است.
آموزش و تحقیق
دانشجویان و محققان ایرانی میتوانند نسخه اوپنسورس Flux را روی Google Colab یا سرور شخصی اجرا کنند و بدون هزینه API آزمایش کنند.
ساخت LoRA اختصاصی
اگر سبک بصری خاصی دارید (مثلاً مینیاتور ایرانی، معماری اصفهان، یا سبک خاص برند خودتان)، میتوانید یک LoRA آموزش دهید و تصاویر نامحدود در آن سبک تولید کنید.
نحوه دسترسی
برای استفاده از Flux چند راه دارید:
۱. API مستقیم — از طریق پلتفرمهایی مثل Replicate، fal.ai یا Together AI ۲. رابطهای وب — سایتهایی مثل Flux.1 AI که رابط گرافیکی ارائه میدهند ۳. لوکال — نصب روی کامپیوتر شخصی با ComfyUI یا Automatic1111 (نیاز به GPU حداقل 12GB VRAM) ۴. اشتراک پلتفرم — از طریق راها با تومان یا تتر
قیمتگذاری
- نسخه Schnell: کاملاً رایگان و اوپنسورس
- نسخه Dev: رایگان برای استفاده غیرتجاری
- نسخه Pro (API): حدود $0.03 تا $0.05 به ازای هر تصویر
- پلتفرمهای واسط: معمولاً $10 تا $30 در ماه بسته به حجم استفاده
برای کاربران ایرانی، خرید اشتراک API مستقیم به دلیل تحریمها مشکل است. از طریق راها میتوانید با تومان یا تتر اشتراک بگیرید.
جمعبندی
Flux نشان داد که مدلهای اوپنسورس میتوانند با بهترین ابزارهای تجاری رقابت کنند. اگر به دنبال ابزاری هستید که هم کیفیت بالا داشته باشد، هم آزادی عمل بدهد و هم مقرونبهصرفه باشد، Flux بهترین انتخاب در ۲۰۲۶ است.
برای خرید اشتراک Flux Pro و دسترسی به API بدون محدودیت، به صفحه Flux در راها مراجعه کنید.




