Black Forest Labs به تازگی از هوش مصنوعی قدرتمند Flux رونمایی کرده است. این مدل با داشتن 12 میلیارد پارامتر، عنوان بزرگ‌ترین مدل متن‌باز تبدیل متن به تصویر را از آن خود کرده و به عنوان یک رقیب جدی برای مدل‌های تجاری مانند میدجرنی مطرح شده است

یکی از مهم‌ترین تفاوت‌های Flux با میدجرنی، متن‌باز بودن آن است. این ویژگی به توسعه‌دهندگان اجازه می‌دهد تا به کد منبع این مدل دسترسی داشته و آن را بر روی سیستم‌های خود اجرا کنند. البته برای اجرای روان Flux، به یک کارت گرافیک قدرتمند نیاز است.
در تست‌های مقایسه‌ای، Flux عملکرد بسیار خوبی از خود نشان داده و در برخی موارد از مدل‌های تجاری مانند Dall-E 3 و میدجرنی نیز پیشی گرفته است. با این حال، همانند هر مدل هوش مصنوعی دیگری، Flux نیز دارای محدودیت‌هایی است و در برخی موارد ممکن است نتایج غیرمنتظره‌ای تولید کند.

با ظهور مدل‌های قدرتمندی مانند Flux، آینده هوش مصنوعی تولید تصویر بسیار امیدوارکننده به نظر می‌رسد. این مدل‌ها نه تنها به هنرمندان و طراحان کمک می‌کنند تا ایده‌های خود را به واقعیت تبدیل کنند، بلکه می‌توانند در حوزه‌های مختلفی مانند آموزش، بازاریابی و سرگرمی نیز کاربرد داشته باشند.

دیدگاهتان را بنویسید