معرفی GPT-4o با قابلیت تولید تصاویر و پردازش چندرسانهای

به گزارش «نبض فناوری» به نقل از ورج، OpenAI، شرکت پیشرو در حوزه هوش مصنوعی، از مدل نوین GPT-4o رونمایی کرد. این مدل که با نام GPT-4 Omni شناخته میشود، تواناییهای خیرهکنندهای در پردازش چندرسانهای دارد و میتواند همزمان از متن، تصویر و صدا برای تعامل با کاربران استفاده کند.
برخلاف نسخههای قبلی، GPT-4o این امکان را فراهم کرده که کاربران تنها با نوشتن یک دستور متنی، تصاویر منحصربهفردی خلق کنند، این ویژگی که پیشتر در مدل DALL·E وجود داشت، حالا بهصورت یکپارچه در ChatGPT ادغام شده است.
از دیگر قابلیتهای کلیدی این مدل میتوان به پاسخدهی سریعتر، پشتیبانی از مکالمات طبیعیتر و امکان تجزیهوتحلیل فایلهای آپلود شده همچون عکس و PDF اشاره کرد. این بهروزرسانی هم برای کاربران رایگان و هم اشتراکی در دسترس است و ممکن است محدودیتهایی داشته باشد.
کارشناسان معتقدند GPT-4o گام بزرگی در رقابت با هوش مصنوعی گوگل (Gemini) و متا (Meta AI) برداشته است./ایمنا