کد خبر: ۳۷۱۴۶
|
۰۵ شهريور ۱۴۰۲ | ۱۰:۴۷

درک تصاویر و دستورات پیچیده توسط این مدل هوش مصنوعی

شرکت چینی علی بابا دو مدل را با استفاده از هوش مصنوعی مولد توسعه داده که قادر به انجام مکالمات پیچیده و درک تصاویر هستند.

به گزارش «نبض فناوری»، گجت‌نو اعلام کرد، در حالی که غول‌های فناوری مانند اپن ای آی و گوگل مدل‌های زبان بزرگ (LLM) را برای رقابت در فضای پررونق هوش مصنوعی مولد راه‌اندازی می‌کنند، شرکت چینی علی بابا 2 مدل هوش مصنوعی جدید را راه‌اندازی کرده که می‌توانند مکالمات پیچیده را انجام دهند و تصاویر را درک کنند.

2 مدل غول فناوری چینی با نام های Qwen-VL و Qwen-VL-Chat برای محققان، دانشگاهیان و شرکت ها در دسترس خواهد بود تا آنها بتوانند برنامه های هوش مصنوعی خود را بدون نیاز به آموزش سیستم ها توسعه دهند.

ویژگی های مدل های هوش مصنوعی علی بابا

به گفته علی‌بابا، در حالی که Qwen-VL می‌تواند به پرسش‌های مرتبط با تصاویر مختلف پاسخ دهد و شرح تصاویر ایجاد کند، Qwen-VL-Chat می‌تواند در تعامل‌های پیچیده شرکت کند. به عنوان مثال، می‌تواند چندین ورودی تصویر را با هم مقایسه کند و به چندین دور سؤال پاسخ دهد.

سایر وظایفی که Qwen-VL-Chat می تواند انجام دهد شامل نوشتن داستان، ایجاد تصاویر بر اساس عکس هایی است که کاربر وارد می کند و حل معادلات ریاضی نشان داده شده در یک تصویر است.

پیش از این خبری نشان داد که هوش مصنوعی در طول ۱ سال بیشتر از همه تصاویر تولید شده توسط انسان در طی 150 سال عکس تولید کرده است.

تا به حال، شرکت‌ها بر تولید محتوا بر اساس ورودی متن توسط انسان تمرکز کرده‌اند، اما Qwen-VL-Chat، تقریباً شبیه آخرین نسخه چت جی پی تی، می‌تواند تصاویر را تجزیه و تحلیل کند و به متن پاسخ دهد. این دو مدل بر روی مدل بزرگ زبانی این شرکت به نام Tongyi Qianwen که در اوایل سال جاری منتشر شد، توسعه یافته اند.

این خبر بلافاصله پس از آن منتشر شد که غول اینترنتی کره جنوبی ناور از HyperCLOVA X، مجموعه ابزارهای هوش مصنوعی و اپلیکیشن چت بات CLOVA X خود رونمایی کرد.

ناور گفت که این محصول جستجوهای مبتنی بر هوش مصنوعی را برای کاربران فراهم می کند و خدمات سفارشی را برای شرکت ها ارائه می دهد. CLOVA X با هدف بهبود جستجوی وب، خرید آنلاین و خدمات ناوبری راه اندازی شده است.

این شرکت همچنین گفت که در حال همکاری با سامسونگ برای توسعه تراشه جدیدی است که جهت پشتیبانی از توسعه فناوری هوش مصنوعی آن کوچکتر و کارآمدتر خواهد بود. ناور همچنین در حال برنامه ریزی برای افتتاح یک مرکز داده جهت خدمات HyperCLOVA X در ماه نوامبر(آبان-آذر) است.

علاقه به هوش مصنوعی مولد و ربات های گفت و گو، ترس‌هایی را در مورد نابودی مشاغل ایجاد کرده است، مشابه آنچه که در زمان معرفی خط مونتاژ متحرک در اوایل دهه 1900 و پس از رایانه‌های بزرگ در دهه 1950 پدیدار شد. با این حال، مطالعه ارائه شده توسط سازمان بین المللی کار نشان داده بیشتر مشاغل و صنایع فقط تا حدی در معرض اتوماسیون هستند و بنابراین احتمال بیشتری وجود دارد که به جای جایگزینی، با هوش مصنوعی تکمیل شوند، به این معنی که مهمترین تأثیر فناوری احتمالاً کارافزایی است.

از زمانی که شرکت اپن ای آی ربات گفت و گوی مولد خود را منتشر کرده است بسیاری از شرکت ها تلاش کردند تا از غافله مسابقه هوش مصنوعی مولد عقب نمانند و بسیاری دیگر از ربات چت جی پی تی در محصولات خود مانند ماشین ها و دوچرخه ها استفاده کردند.

منبع/ فارس

ارسال نظرات
آخرین وضعیت بازار رمزارزهای جهان در 25 اردیبهشت 1403 نرخ تسلط بازار بیت‌کوین چه میزان است؟
«آبادیران»، بستر نقش آفرینی دانش بنیان‌ها در تحقق گفتمان مردمی‌‌کردن اقتصاد دهقانی خبر داد: برنامه‌های حمایتی ویژه معاونت علمی برای توسعه نوآوری‌های فراگیر اجتماعی
آخرین وضعیت بازار رمزارزهای جهان در 24 اردیبهشت 1403 وام مسکن با پشتوانه بیت‌کوین
در اعتراض به دستمزدها؛ کارمندان اپل اعتصاب می‌کنند
آخرین وضعیت بازار رمزارزهای جهان در 23 اردیبهشت 1403 پیش‌بینی روند قیمت بیت‌کوین
درمان دقیق تر بیماری‌ها؛ هوش مصنوعی گوگل داروساز می‌شود
آخرین وضعیت بازار رمزارزهای جهان در 22 اردیبهشت 1403 سقوط بیت‌کوین و اتریوم
وبگردی