هوش مصنوعی

March 6, 2025

22:54 پنجشنبه، 16ام اسفندماه 1403

کد خبر: 187479

مدل‌های زبان بزرگ بدون دخالت انسان کارآمدتر هستند

مطالعه مشترک جدید توسط دانشگاه هنگ کنگ و دانشگاه برکلی کالیفرنیا نشان داد زمانی که مدل‌های زبان بزرگ (LLM) برای ایجاد راهکارهای خود رها شوند، بهتر تعمیم میابند. این یافته‌ها که در اصل برای مدل‌های زبان بزرگ و مدل‌های زبان بینایی (VLM) به دست آمده است، یکی از باورهای اصلی در حوزه هوش مصنوعی را به چالش می‌کشد و آن هم اینکه مدل‌ها به نمونه‌های آموزشی با برچسب‌های دستی نیاز دارند تا بتوانند راهکارهای مورد نیاز خود را بیابند.

محققان در مطالعه جدید در واقع دریافتند مدل‌های آموزشی در بسیاری از نمونه‌های دست ساز می‌توانند در تعمیم داده‌های دیده نشده، اثرات نامطلوب بر توانایی مدل زبان بزرگ ایجاد کنند.

برای مدت طولانی فرآیند تنظیم دقیق نظارت شده (SFT) به عنوان استاندارد طلایی برای آموزش LLM و VLM مورد استفاده قرار گرفته است. هنگامی که یک مدل روی داده‌های متن و تصویر خام از قبل آموزش داده شده به کار گرفته می‌شود، سازمان‌ها و آزمایشگاه‌های هوش مصنوعی آن را روی مجموعه بزرگی از داده‌ها شامل نمونه‌های دست‌ساز در قالب پرسش/پاسخ یا درخواست/پاسخ آموزش می‌دهند. سپس فرآیند تنظیم دقیق نظارت شده به کار گرفته می‌شود و مدل‌ها از این طریق می‌توانند مراحل آموزشی اضافه از جمله یادگیری تقویتی از بازخورد انسانی (RLHF) را طی کنند تا ترجیحات ضمنی انسان را بر اساس سیگنال‌هایی مانند رتبه بندی پاسخ‌ها یا دوست داشتن/نپسندیدن پاسخ‌های مدل بیاموزند.

سیستم تنظیم دقیق نظارت شده در هدایت رفتار مدل به سمت انواع وظایفی که سازندگان مدل آن را طراحی کرده‌اند، بسیار موثر است. با این حال جمع آوری داده‌ها فرآیندی کند و پرهزینه است که برای بسیاری از شرکت‌ها و آزمایشگاه عملی نخوهد بود.

با این وجود در مطالعه جدید مشخص شد مدل‌های زبان بزرگ و مدل‌های زبان بینایی در بسیاری از موارد می‌توانند بدون استفاده از نمونه‌های دست ساز انسانی، به تنهایی تصمیم گیری کنند و در بهترین حالت داده‌ها را تعمیم دهند.

منبع: venturebeat.com

در این زمینه از آرشیو ایستنا:

مشترک شوید!

برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.