تحولی جدید در ChatGPT: تولید تصاویر با هوش مصنوعی بدون نیاز به DALL-E

به گزارش «نبض فناوری» به نقل از انگجت، اعلام کرده است که کاربران بهزودی میتوانند مستقیماً در ChatGPT تصاویر تولید کنند.
این قابلیت برای کاربران نسخههای رایگان، Plus، Pro و Team در دسترس خواهد بود و به عنوان ابزار پیشفرض در مدل GPT-4o جایگزین DALL-E میشود. علاوه بر ChatGPT، این ویژگی به هوش مصنوعی تبدیل متن به ویدیو «سورا» نیز اضافه خواهد شد.
OpenAI اعلام کرده که این سیستم میتواند تصاویر باکیفیت را بر اساس پرامپتهای متنی، مکالمات و حتی فایلهای آپلودشده تولید کند. یکی از ویژگیهای کلیدی این ابزار، امکان ویرایش و تغییر تصاویر موجود با استفاده از توضیحات کاربر است. همچنین، این شرکت بهبودهایی در درک متنی و پردازش نوشته در تصاویر ایجاد کرده است.
کاربردهای این ابزار هم برای کاربران شخصی و هم حرفهای تعریف شده است. به عنوان مثال، میتوان از آن برای طراحی اینفوگرافیکها، تصاویر تبلیغاتی برای شبکههای اجتماعی و محتوای متنی تصویری (مانند تصویر فوق) استفاده کرد. OpenAI همچنین مدعی است که مدل جدید توانایی بالایی در تولید تصاویر واقعگرایانه با دقت بالا در نور، سایه و بافت دارد.
این قابلیت مبتنی بر مدل GPT-4o است که سال گذشته معرفی شد. حرف o در نام آن مخفف omni به معنای چندوجهی بودن مدل است، که به قابلیتهای چندرسانهای آن اشاره دارد. این مدل میتواند بر روی فایلهای آپلودشده تغییراتی اعمال کند و مفاهیم بصری را با توجه به زمینه مکالمه ایجاد نماید. این بهروزرسانی جدید، گام دیگری در مسیر توسعه هوش مصنوعی همهجانبه است که مدیرعامل OpenAI، سم آلتمن، اخیراً درباره آن صحبت کرده بود./ایتنا