Black Forest Labs به تازگی از هوش مصنوعی قدرتمند Flux رونمایی کرده است. این مدل با داشتن 12 میلیارد پارامتر، عنوان بزرگترین مدل متنباز تبدیل متن به تصویر را از آن خود کرده و به عنوان یک رقیب جدی برای مدلهای تجاری مانند میدجرنی مطرح شده است
یکی از مهمترین تفاوتهای Flux با میدجرنی، متنباز بودن آن است. این ویژگی به توسعهدهندگان اجازه میدهد تا به کد منبع این مدل دسترسی داشته و آن را بر روی سیستمهای خود اجرا کنند. البته برای اجرای روان Flux، به یک کارت گرافیک قدرتمند نیاز است.
در تستهای مقایسهای، Flux عملکرد بسیار خوبی از خود نشان داده و در برخی موارد از مدلهای تجاری مانند Dall-E 3 و میدجرنی نیز پیشی گرفته است. با این حال، همانند هر مدل هوش مصنوعی دیگری، Flux نیز دارای محدودیتهایی است و در برخی موارد ممکن است نتایج غیرمنتظرهای تولید کند.
با ظهور مدلهای قدرتمندی مانند Flux، آینده هوش مصنوعی تولید تصویر بسیار امیدوارکننده به نظر میرسد. این مدلها نه تنها به هنرمندان و طراحان کمک میکنند تا ایدههای خود را به واقعیت تبدیل کنند، بلکه میتوانند در حوزههای مختلفی مانند آموزش، بازاریابی و سرگرمی نیز کاربرد داشته باشند.