هوش مصنوعی تبدیل متن به تصویر Flux معرفی شد
Black Forest Labs از هوش مصنوعی Flux رونمایی کرده که با 12 میلیارد پارامتر بزرگترین مدل متنباز تبدیل متن به تصویر تا امروز است. Flux میتواند تصاویری ارائه دهد که با نمونههای میدجرنی قابلرقابت هستند و احتمالاً بتواند هر مدل دیگری را که تاکنون در دسترس قرار گرفته، متنباز یا بسته، شکست دهد.
براساس گزارش Decrypt، هوش مصنوعی Flux در سه نسخه ارائه میشود: Flux Dev که متنباز است و برای توسعهدهندگان در دسترس قرار میگیرد. Flux Schnell که تا 10 برابر عملکرد سریعتری دارد و تحت مجوز Apache 2 منتشر میشود. Flux Pro نیز که نسخه متنبسته است و میتوان از طریق API از آن استفاده کرد.
یکی از تفاوتهای اصلی Flux با میدجرنی در این است که Flux متنباز است و میتوان آن را روی سیستمی نسبتاً خوب هم اجرا کرد. دو نسخه Flux Dev و Flux Schnell اکنون برای دانلود در Hugging Face در دسترس قرار دارند.
سازندگان Flux میگویند در تستهای بنچمارک، این مدل 12 میلیارد پارامتری در تولید تصویر از مدلهایی مانند Dall-E 3 (HD)، میدجرنی v6.0 و SD3 Ultra در بخش کیفیت بصری، وفاداری به پرامپت کاربر، تایپوگرافی و تنوع خروجی، بهتر عمل میکند. البته همانطور که در تصویر بالا مشاهده میکنید، هرچند Flux از برخی جنبهها مانند نورپردازی بهتر از میدجرنی عمل میکند، اما زن یک پا اضافه دارد.
بااینحال، اگر بخواهید روی سیستم خود از مدل متنباز Flux استفاده کنید، نیاز به پردازشگر گرافیکی قدرتمندی دارید. این مدل حدود 23 گیگابایت حجم دارد؛ یعنی به حدود 24 گیگابایت VRAM نیاز خواهید داشت. البته شما میتوانید از پلتفرمهای آنلاین مانند NightCafe و Based Labs نیز برای تولید تصاویر در Flux استفاده کنید.
بهطورکلی، نسخه پرو Flux میتواند رقیب خوبی برای میدجرنی و سایر مدلهای پولی باشد. بااینحال، باتوجهبه اینکه مدلهای جدید، مانند Auraflow یا Flux، بسیار سنگیناند، افرادی که پردازشگرهای گرافیکی متوسطی دارند، میتوانند سراغ SD3 یا حتی نسخههای سبکتر SDXL بروند.