کد خبر: ۱۷۵۳۷
|
۰۲ خرداد ۱۴۰۰ | ۲۰:۲۰

هوش مصنوعی جدید فیسبوک بدون نیاز به رونویسی گفتار را تشخیص می‌دهد

فیس بوک مدعی است روشی برای ساخت ابزارهای تشخیص گفتار ابداع کرده که به داده‌های رونویسی‌شده نیازی ندارد.

تشخیص گفتار یکی از فاکتورهای کلیدی هوش مصنوعی در طرح و برنامه‌های شرکت‌های بزرگ دنیای فناوری است. فیس بوک امروز اعلام کرده که به دستاوردی مهم در زمینه آموزش این سیستم‌ها در یادگیری زبان‌های جدید دست یافته است. این شرکت مدعی است روشی برای ساخت ابزارهای تشخیص گفتار ابداع کرده که به داده‌های رونویسی‌شده نیازی ندارد.

به گفته فیس بوک، سیستم جدید آن‌ها می‌تواند شکل فعلی این فناوری را که به ورودی‌های متن-به-گفتار متکی است، متحول کند. زمانبرترین پروسه در شرایط موجود گوش دادن به صحبت‌ها و تبدیل آن‌ها به نوشتار است. این فرآیند باید برای هر زبان تکرار شود. ولی سیستم جدید فیس بوک به‌طور مستقیم از خود گفتارهای صوتی تعلیم می‌بیند و بدون نیاز به نوشتار سعی می‌کند متوجه حرف‌ها شود.

مدل جدید فیس بوک اساسا مبتنی بر یک چرخه بازخوردی میان «شبکه‌های زایای دشمن‌گونه» (GAN) کار می‌کند که از یک «زایا» و یک «تفکیک‌کننده» تشکیل شده است. زایا نمونه‌هایی از الگوهای گفتاری را ارائه می‌کند که ممکن است کاملا بی‌معنا به نظر برسند. ولی در ادامه این داده‌ها به تفکیک‌کننده ارائه می‌شوند تا شبیه نوعی مترجم عمل کند.

هوش مصنوعی جدید فیسبوک بدون نیاز به رونویسی گفتار را تشخیص می‌دهد

در عین حال، فیس بوک متون اضافه‌ای را که توسط انسان‌ها نوشته شده به سیستم می‌دهد تا در استخراج تفاوت‌های میان نتایج کامپیوتری و واقعی به زایا کمک کند. این فرآیند این قدر ادامه پیدا می‌کند تا خروجی زایا شبیه متن واقعی شود.

فیس بوک می‌گوید این راهکار به آن‌ها اجازه داده تا بدون هیچ گونه داده‌ حاشیه‌نویسی‌شده بتوانند سیستمی برای تشخیص گفتار بسازند. این شرکت همین حالا آزمایش مدل جدید خود را که با نام Wav2vec-U شناخته می‌شود روی زبان‌های سواحلی، قرقیزی و تاتار کریمه‌ای آغاز کرده است. این زبان‌ها تاکنون ابزار باکیفیتی برای تشخیص گفتار نداشته‌اند.

آزمایش‌های فیس بوک از کاهش ۶۳ درصدی خطاها خبر داده. این شرکت می‌گوید دستاورد آن‌ها می‌تواند تشخیص گفتار را برای زبان‌ها و لهجه‌های بیشتری در سراسر دنیا ممکن کند. بیش از ۷۶ درصد از ۲.۸۵ میلیارد کاربر ماهانه فیسبوک در خارج از آمریکا و اروپا هستند. بنابراین دستیابی به قابلیت ترجمه خودکار برای ایجاد ارتباط موثرتر میان تمامی مردم دنیا امری ضروری به حساب می‌آید.

منبع/ دیجیاتو 

ارسال نظرات
گزارش نبض فناوری از شرکت توسعه سامانه‌های نرم افزاری نگین، رشد درآمد ۲۹ درصدی «توسن» در دوره یکماهه اسفند ۱۴۰۲
آخرین وضعیت بازار رمزارزهای جهان در 29 فروردین 1403 صعود اندک بیت‌کوین
پیش از برگزاری انتخابات؛ ایکس در هندوستان دردسر درست کرد
وبگردی