کد خبر: ۴۲۴۹۵
|
۲۳ شهريور ۱۴۰۳ | ۱۲:۰۰

اولین مدل هوش مصنوعی OpenAI با قابلیت استدلال با نام o1 منتشر شد [تماشا کنید]

مدل شایعه‌شده «توت‌فرنگی» سرانجام معرفی شد و OpenAI می‌گوید که این مدل در حل مسائل پیچیده‌تر موفق است.

به گزارش خبرنگار «نبض فناوری» به نقل از دیجیاتو،OpenAI مدل هوش مصنوعی جدیدی با نام o1 را معرفی کرده که اولین مدل این استارتاپ از سری مدل‌های دارای قابلیت «استدلال» برای پاسخ‌دادن به سؤالات پیچیده‌تر است. علاوه‌براین، یک نسخه کوچک‌تر و ارزان‌تر از آن با نام o1-mini نیز منتشر شده است. در شایعات مربوط به این استارتاپ، به این مدل با نام «توت‌فرنگی» اشاره شده بود.

o1 گام مهمی برای OpenAI در جهت هدف تولید مدل‌های هوش مصنوعی شبیه انسان است. این مدل نسبت به مدل‌های قبلی در نوشتن کد و حل مسائل چند مرحله‌ای بهتر عمل می‌کند، اما گران‌تر و کُندتر از GPT-4o است. همچنین OpenAI از o1 به‌عنوان یک نسخه «پیش‌نمایش» نام برده است تا بر نوظهور بودن آن تأکید داشته باشد.

ویدیوی زیر قابلیت o1 در تولید کد مربوط به یک بازی ویدیویی از دستور متنی ساده را نشان می‌دهد:

هزینه و زمان دسترسی به مدل o1

کاربران ChatGPT Plus و Team هم‌اکنون به o1 و o1-mini دسترسی دارند و کاربران Enterprise و Edu در اوایل هفته آینده به آن دسترسی پیدا می‌کنند. همچنین OpenAI قصد دارد o1-mini را در دسترس تمام کاربران رایگان ChatGPT قرار دهد، اما هنوز زمان آن را اعلام نکرده است.

برای توسعه‌دهندگان این مدل با قیمت تقریباً بالایی ارائه شده است و API آن به ازای هر 1 میلیون توکن ورودی 15 دلار و به ازای هر 1 میلیون توکن خروجی 60 دلار هزینه دارد. برای مقایسه، GPT-4o به ازای هر 1 میلیون توکن ورودی 5 دلار و به ازای هر 1 میلیون توکن خروجی 15 دلار هزینه دارد.

همچنین روش آموزش این مدل نسبت به مدل‌های قبلی OpenAI متفاوت است، هرچند این استارتاپ در مورد جزئیات آن توضیحی دقیقی ارائه نکرده است. «جری تورک»، سرپرست تحقیقات OpenAI، می‌گوید که o1 با استفاده از یک الگوریتم بهینه‌سازی‌شده کاملاً جدید و مجموعه داده‌های آموزشی جدیدی که به‌طورخاص برای آن طراحی شده‌اند، آموزش داده شده است.

درواقع برای o1 از تکنیکی با نام «یادگیری تقویتی» استفاده شده است که باعث می‌شود مدل با پاداش و جریمه مسائل را به تنهایی حل کند. سپس مانند انسان‌ها که مشکلات را با مرور مرحله‌به‌مرحله پردازش می‌کنند، از یک «زنجیره فکر» برای پردازش سؤالات استفاده می‌کند.

با وجود این روش آموزش جدید، OpenAI می‌گوید که این مدل دقیق‌تر عمل می‌کند و توهم کمتری دارد.

ویدیوی زیر قابلیت استدلال این مدل را نشان می‌دهد:

طبق توضیحات OpenAI، مهم‌ترین نکته‌ای که این مدل جدید را نسبت به GPT-4o متمایز می‌کند، توانایی آن در حل مسائل پیچیده، مانند کدنویسی و ریاضی است که بسیار بهتر از مدل‌های قبلی عمل می‌کند و همچنین توضیح استدلال آن است. درعین‌حال، o1 در بسیاری از حوزه‌ها به‌اندازه GPT-4o توانایی ندارد. o1 در دانش واقعی درباره جهان به خوبی عمل نمی‌کند و همچنین توانایی مرور وب یا پردازش فایل‌ها و تصاویر را ندارد.

ارسال نظرات
در آخرین گزارش درآمد «آسیاتک» در کدال، افزایش درآمد و فروش ۴۳ درصدی «آسیاتک» در ۶ ماهه ۱۴۰۳
وبگردی