کد خبر: ۴۳۹۰۰
|
۰۷ دی ۱۴۰۳ | ۱۵:۰۰

یکی از قوی‌ترین مدل‌های «هوش مصنوعی باز» رونمایی شد

شرکت «دیپ‌سیک» از مدل جدید هوش مصنوعی خود رونمایی کرده است که به نظر می‌رسد یکی از قوی‌ترین مدل‌های هوش مصنوعی باز تا به امروز باشد.

به گزارش «نبض فناوری» به نقل از تک کرانچ، مدل جدید هوش مصنوعی «دیپ‌سیک وی۳» (DeepSeek V ۳) که توسط شرکت «دیپ‌سیک» ابداع شده است، به توسعه‌دهندگان امکان می‌دهد تا آن را برای بیشتر اپلیکیشن‌ها از جمله اپلیکیشن‌های تجاری دانلود و اصلاح کنند.

 دیپ‌سیک وی۳ می‌تواند طیف گسترده‌ای از کار‌ها و وظایف مبتنی بر متن را مانند کدنویسی، ترجمه و نوشتن مقاله و ایمیل با توجه به درخواست انجام دهد.

براساس آزمایش‌های داخلی شرکت دیپ‌سیک، دیپ‌سیک وی۳ هم از مدل‌های قابل دانلود «باز» در دسترس و هم از مدل‌های «بسته» هوش مصنوعی که فقط از طریق API قابل دسترسی هستند، بهتر عمل می‌کند. در زیرمجموعه‌ای از رقابت‌های کدنویسی که در پلتفرم «کدفورسز «(Codeforces) میزبانی می‌شوند، دیپ‌سیک وی۳ توانست بهتر از مدل‌های دیگر مانند «Llama ۳.۱، ۴۰۵ B» شرکت «متا» (Meta)، «GPT-۴ o» شرکت «اوپن‌ای‌آی» (OpenAI) و «Qwen ۲.۵، ۷۲ B» شرکت «علی‌بابا» (Alibaba) عمل می‌کند.

دیپ‌سیک گفت که دیپ‌سیک وی۳ روی یک مجموعه داده متشکل از ۱۴.۸ تریلیون توکن آموزش دیده است. در علم داده، توکن‌ها برای نمایش بیت‌های داده خام استفاده می‌شوند. یک میلیون توکن معادل حدود ۷۵۰ هزار کلمه است.

اگرچه دیپ‌سیک وی۳ کاربردی‌ترین مدل نیست، اما از برخی جهات یک دستاورد به شمار می‌رود. دیپ‌سیک توانست این مدل را با استفاده از مرکز داده پردازنده‌های گرافیکی H ۸۰۰ شرکت «انویدیا» (Nvidia) در حدود دو ماه آموزش دهد. این شرکت خاطرنشان کرد فقط ۵.۵ میلیون دلار برای آموزش دیپ‌سیک وی۳ هزینه کرده که کسری از هزینه توسعه مدل‌هایی مانند GPT-۴ است./ایسنا

برچسب ها: دیپ سیک
ارسال نظرات
گزارش نبض فناوری از عملکرد شرکت توسن، درآمد ۱۱۹ میلیارد تومانی "توسن" در دی ماه سالجاری
بی توجهی مسئولان به زنگ هشداری که به صدا در آمده؛ ورود صرافی‌های رمزارز به ظاهر خارجی به بازار ایران!