هوش مصنوعی

March 29, 2024
10:18 جمعه، 10ام فروردینماه 1403
کد خبر: 163380

نخستین تجربه توسعه مدل‌های زبان بزرگ متناسب با فرهنگ آسیایی

منبع: همکاران سیستم

غول‌های فناوری توسعه دهنده فناوری هوش مصنوعی مولد (GenAI) تمایل فراوان دارند تا مدل‌های مربوط به داده‌های منطقه‌ای و محلی را با یکدیگر ترکیب کنند تا در نهایت سطح گسترده‌تری از کاربران جهانی را تحت پوشش قرار دهند و بازتاب وسیع‌تر بین کاربران داشته باشند.

«لانرس لیو» مدیر نوآوری هوش مصنوعی شرکت AI Singapore در این خصوص توضیح داد که به عنوان مثال سیستم ادغام زبان‌های برنامه نویسی منطقه جنوب شرق آسیا در یک شبکه (SEA-LION) در یک مدل زبان بزرگ (LLM) به هوش مصنوعی مولد کمک می‌کند پاسخ‌های دقیق‌تر را ارایه دهد.

او در این زمینه به همراه گروه خود آزمایشی را انجام داده است که طی در مورد انتخابات اخیر در آسیا سوالاتی مطرح می‌شود و این سوالات به صورت همزمان از سیستم SEA-LION و یک پلتفرم عمومی مجهز به سیستم هوش مصنوعی مولد پرسیده می‌شود تا نتایج انتخابات در هر دو سیستم پیش بینی شود. این بررسی نشان داد سیستم SEA-LION نتایج انتخابات را دقیق‌تر پیش بینی کرده است.

سیستم SEA-LION روی دو مدل پایه‌ای اجرا می‌شود که یکی از آنها با 3 میلیارد پارامتر و مدل دیگر با 7 میلیارد پارامتر به کار گرفته می‌شوند. داده‌های آموزشی این سیستم در مجموع از 981 میلیارد توکن زبان تشکیل شده‌اند که سیستم هوش مصنوعی مرکزی آنها را به عنوان قطعاتی از کلمات ایجاد شده پس از شکستن متن در جریان فرآیند توکن سازی تعریف می‌کند. این قطعات 623 میلیارد توکن انگلیسی، 128 میلیارد توکن آسیای جنوب شرقی و 91 میلیارد توکن چینی را شامل می‌شود.

«لانرس لیو» توضیح داد بیشتر ابزارهای توسعه یافته در حوزه هوش مصنوعی مولد غیرآسیایی هستند و از این رو ممکن است سوگیری داده‌ها وجود داشته باشد. مدل‌های زبان بزرگ از جمله SEA-LION از نظر فرهنگی ملاحظات بیشتری را شامل می‌شوند و در نهایت پاسخ‌های تولید شده توسط هوش مصنوعی مولد ترکیب منطقه را بهتر منعکس می‌کند.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.