کد خبر: ۴۵۱۸۷
|
۰۹ فروردين ۱۴۰۴ | ۱۰:۰۰

معرفی GPT-4o با قابلیت تولید تصاویر و پردازش چندرسانه‌ای

شرکت OpenAI مدل جدیدی از هوش مصنوعی به نام GPT-4o را معرفی کرد که با قابلیت‌های پیشرفته پردازش متن، تصویر و صدا، تحولی بزرگ در فناوری چت‌بات‌ها ایجاد کرده است.

 به گزارش «نبض فناوری» به نقل از ورج، OpenAI، شرکت پیش‌رو در حوزه هوش مصنوعی، از مدل نوین GPT-4o رونمایی کرد. این مدل که با نام GPT-4 Omni شناخته می‌شود، توانایی‌های خیره‌کننده‌ای در پردازش چندرسانه‌ای دارد و می‌تواند هم‌زمان از متن، تصویر و صدا برای تعامل با کاربران استفاده کند.

برخلاف نسخه‌های قبلی، GPT-4o این امکان را فراهم کرده که کاربران تنها با نوشتن یک دستور متنی، تصاویر منحصربه‌فردی خلق کنند، این ویژگی که پیش‌تر در مدل DALL·E وجود داشت، حالا به‌صورت یکپارچه در ChatGPT ادغام شده است.

از دیگر قابلیت‌های کلیدی این مدل می‌توان به پاسخ‌دهی سریع‌تر، پشتیبانی از مکالمات طبیعی‌تر و امکان تجزیه‌وتحلیل فایل‌های آپلود شده همچون عکس و PDF اشاره کرد. این به‌روزرسانی هم برای کاربران رایگان و هم اشتراکی در دسترس است و ممکن است محدودیت‌هایی داشته باشد.

کارشناسان معتقدند GPT-4o گام بزرگی در رقابت با هوش مصنوعی گوگل (Gemini) و متا (Meta AI) برداشته است./ایمنا

ارسال نظرات