فناوری اطلاعات

May 23, 2023
15:23 سه شنبه، 2ام خردادماه 1402
کد خبر: 145608

مدل هوش مصنوعی گفتاری متا با قابلیت تشخیص بیش از 4 هزار زبان متن‌باز شد

متا مدل هوش مصنوعی متفاوتی به نام MMS دارد که می‌تواند در بیش از 1100 زبان تبدیل متن به گفتار داشته باشد.
 
 
 
 
متا یک مدل زبانی هوش مصنوعی دارد که تقلیدی از GPT نیست. این شرکت پروژه‌ای به نام «گفتار چندزبانی عظیم» (MMS) را ساخته است که می‌تواند بیش از 4000 زبان را شناسایی کند و در بیش از 1100 زبان تبدیل متن به گفتار داشته باشد.
 
متا امروز اعلام کرد که پروژه MMS را متن‌باز می‌کند تا به حفظ تنوع زبانی کمک و محققان را به توسعه این زیرساخت‌ها تشویق کند. در بیانیه این شرکت آمده است: «ما امروز به‌صورت عمومی مدل‌ها و کدهای خود را به اشتراک می‌گذاریم تا بقیه افراد جامعه محققان هم بتوانند روی تلاش‌های ما کار کنند. امیدواریم که با این تصمیم مشارکت کوچکی در حفظ تنوع زبانی شگفت‌آور جهان داشته باشیم.»
 
مدل‌های تشخیص گفتار و تبدیل متن به گفتار معمولاً باید روی هزاران ساعت صدا با برچسب‌گذاری‌های مشخص آموزش داده شوند. این برچسب‌گذاری‌ها برای یادگیری ماشینی بسیار مهم‌اند چون به الگوریتم‌ها اجازه می‌دهند به‌درستی داده‌ها را دسته‌بندی و درک کنند.
 
بااین‌حال، برای زبان‌هایی که به‌طور گسترده در دنیا استفاده نمی‌شوند و خیلی از آن‌ها در معرض خطر ازبین‌رفتن قرار دارند، متا می‌گوید چنین داده‌هایی وجود ندارند. درنتیجه این شرکت از شیوه‌ای نامتداول برای گردآوری داده‌های صوتی استفاده کرده است.
 
هوش مصنوعی متا روی چه داده‌هایی آموزش داده شده است؟
متا می‌گوید برای انجام این کار از صداهای ضبط‌شده از ترجمه متن‌های مذهبی بهره گرفته است: «ما به سراغ متن‌های مذهبی نظیر انجیل رفتیم که به بسیاری از زبان‌ها ترجمه شده و ترجمه‌های آن به‌طور گسترده برای تحقیق درزمینه ترجمه از روی متن مورد مطالعه قرار گرفته است. این ترجمه‌ها دارای صداهای ضبط‌شده‌ای از افراد است که آن‌ها را به زبان‌های مختلف خوانده‌اند.» درنتیجه متا با کمک این داده‌ها که البته برچسب‌گذاری نشده بودند، توانست زبان‌های مدل خود را به بیش از 4000 عدد برساند.
 
غول دنیای فناوری می‌گوید اگرچه منبع آموزش مدل هوش مصنوعی آن‌ها متون مذهبی بوده است، اما این اتفاق باعث نشده که این مدل سوگیری مذهبی پیدا کند. متا ادعا می‌کند که دلیل این عدم سوگیری استفاده از رویکرد «دسته‌بندی زمانی پیوندگرا» (CTC) است که در مقایسه با مدل‌های زبانی بزرگ (LLM) محدودیت‌های بسیار بیشتری دارد.
 
بااین‌حال، متا یادآور شده است که مدلش بی‌نقص نیست. برای مثال، این مدل می‌تواند در تبدیل گفتار به نوشتار دچار اشتباه شود، اما این شرکت امیدوار است که با کمک جامعه متن‌باز بتواند هرچه بیشتر مدل خود را بهینه‌سازی کند.
  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.