ساخت مدل جدید هوش مصنوعی که از اشباهات خود یاد میگیرد
محققانی از مرکز آسیایی تحقیقات مایکروسافت، دانشگاه پکن و دانشگاه شیان جیائوتنگ موفق شدند تکنیک جدیدی را برای بهبود توانایی مدلهای زبان بزرگ (LLM) توسعه دهنده که در آن هوش مصنوعی برای حل مسایل ریاضی میتواند از اشتباهات خود یاد بگیرد و کاملا مشابه نحوه یادگیری انسان عمل کند.
محققان بر اساس یک مقاله تحقیقاتی که نتایج آن طی هفته جاری منتشر شده است، یک استراتژی پیشگام به نام یادگیری از اشتباهات (LeMa) را تشریح کردهاند که هوش مصنوعی را برای اصلاح اشتباهات خود آموزش میدهد و در نهایت منجر به افزایش تواناییهای استدلالی میشود.
محققان در این اقدام از فرآیندهای یادگیری انسان الهام گرفتند که در آن دانشجو از اشتباهات خود درس میگیرد تا عملکرد آتی خود را بهبود بخشد.
نویسندگان این مقاله توضیح دادند: «دانشجوی انسانی را در نظر بگیرید که نتوانسته است یک مسئله ریاضی را حل کند. او از اشتباهی که مرتکب شده و فرآیندی که طی آن توانسته است این اشتباه را اصلاح کند، یاد میگیرد». آنها سپس این مفهوم را برای مدلهای زبان بزرگ اعمال کردند و از دادههای صحیح و اشتباه تولید شده توسط GPT-4 برای تنظیم دقیق آنها استفاده کردند.
محققان در گام نخست مدلهایی مانند LLaMA-2 را در اختیار گرفتند که مسیرهای استدلالی ناقص را برای مسئلههای ریاضی به کار میگیرد. سپس فناوری GPT-4 خطاها را در فرآیند استدلالی شناسایی کرد، آنها را توضیح داد، و مسیر استدلال اصلاح شده را ارایه کرد. محققان از دادههای تصحیح شده برای آموزش بیشتر مدلهای اصلی استفاده کردند.