هوش مصنوعی جدیدی که میتواند متنهای ۱۰ هزار کلمهای تولید کند
به گزارش نبض فناوری به نقل از دیجیاتو، تیمی از محققان هوش مصنوعی در دانشگاه چینهوا چین مدل زبانی بزرگی به نام «LongWriter» ساختهاند که به ادعای سازندگان میتواند خروجی متنی تا ۱۰ هزار کلمه تولید کند. باتوجهبه اینکه مدلهای رایج فعلی میتوانند تا حدود ۲ هزار کلمه خروجی تولید کنند، LongWriter در زمینه نگارش متنهای طولانی بسیار کارآمدتر خواهد بود. همچنین این مدل متنباز است و توسعهدهندگان میتوانند آن را بهبود دهند.
براساس گزارش Tech Xplore، حداکثر خروجی متنی مدلهای هوش مصنوعی فعلی تقریباً ۲۰۰۰ کلمه است. محققان احتمال میدهند این امر به این دلیل باشد که این مدلها با مطالب کوتاه آموزش دیدهاند. محققان میخواستند ببینند اگر مدل خود را با استفاده از مطالب طولانیتر آموزش بدهند، خروجی آن نیز طولانی خواهد شد یا خیر.
هوش مصنوعی LongWriter با خروجی ۱۰ هزار کلمهای
محققان برای آزمایش ایده خود ابتدا مدل ۹ میلیارد پارامتری را با استفاده از مجموعهای از دادههای معمولی که شامل مطالبی با طول کمتر از ۲۰۰۰ کلمه بود، آموزش دادند. همانطور که انتظار میرفت، این مدل هنگام گفتگو، نمیتوانست متونی طولانیتر از ۲۰۰۰ کلمه تولید کند.
در مرحله بعد، محققان دادههایی را جمعآوری کردند که مجموعهای به نام LongWriter-6k است و ۶۰۰۰ مطلب مکتوب با طول ۲۰۰۰ تا ۳۲ هزار کلمه دارد. سپس آنها LLM خود را با استفاده از مجموعه داده جدید آموزش دادند و دریافتند با این کار، طول مطالب خروجی تقریباً به ۱۰ هزار کلمه افزایش مییابد.
این مدل جدید متنباز است و در GitHub نیز منتشر شده. با چنین مدلی کاربران بهتر میتوانند در زمینههای مختلف مقاله، کتاب یا فیلمنامه تولید کنند. البته باتوجهبه اینکه چنین مدلی میتواند یک اثر مکتوب کامل تولید کند، محققان میگویند باید ملاحظات اخلاقی را نیز در نظر گرفت.
مدتی پیش نیز OpenAI از مدل GPT-4o Long Output رونمایی کرد که به کاربران امکان میدهد پاسخهای طولانی، بهاندازه رمانی ۲۰۰ صفحهای، دریافت کنند.