رئیس هوش مصنوعی متا میگوید مدلهای زبانی هیچگاه به هوشی در سطح انسان دست نمییابند
مدیر ارشد هوش مصنوعی متا میگوید مدلهای بزرگ زبانی که مغز متفکر محصولات هوش مصنوعی مولد از جمله ChatGPT را تشکیل میدهند هیچوقت به توانایی استدلال و برنامهریزی انسانی دست پیدا نمیکنند، از این رو او برای رسیدن به «هوش ماورایی» در ماشینها رویکرد بسیار متفاوتی دارد.
به گزارش فایننشال تایمز، یان لیکان، پژوهشگر ارشد هوش مصنوعی در شرکت متا، مالک فیسبوک و اینستاگرام، میگوید LLMها «درک بسیار محدودی از منطق دارند… جهان فیزیکی را درک نمیکنند، حافظه پیوسته ندارند، قادر به تحقق هیچ تعریف معقولی از استدلال نیستند و امکان برنامهریزی ندارند.»
او در مصاحبه ای با فایننشال تایمز گفت که تکیه کردن بر LLM برای رسیدن به هوش انسانی رویکرد درستی نیست زیرا این مدلها تنها در صورتی میتوانند پاسخ درستی به پرامپتها ارائه کنند که دادههای آموزشی درستی داشته باشند و درنتیجه «بسیار غیرمطمئن» محسوب میشوند.
او در عوض در حال توسعه نسل کاملا جدیدی از سیستم های هوش مصنوعی است که امیدوار است هوشی در سطح انسان را برای ماشینها محقق کند. به گفته او تحقق این چشمانداز شاید ۱۰ سال زمان ببرد.
متا برای رقابت با دیگر شرکتهای فناوری از جمله مایکروسافت، اوپنایآی و گوگل، میلیاردها دلار به توسعه مدلهای بزرگ زبانی و هوش مصنوعی مولد اختصاص داده است.
لیکان تیمی با حدود ۵۰۰ نیرو را در آزمایشگاه تحقیقات بنیادی هوش مصنوعی یا (Fair) تحت رهبری خود دارد. این تیم در پی ساخت نوعی هوش مصنوعی است که همانند انسانها منطق خود را توسعه داده و سازوکار جهانی را بیاموزد. رویکرد متا برای یادگیری از جهان واقعی به عنوان «مدلسازی جهان» شناخته میشود.
چشمانداز مد نظر مدیر هوش مصنوعی متا را میتوان هدفی خطرناک و یک قمار پرهزینه برای غول شبکه اجتماعی دانست. متا در حال حاضر با فشار جدی از سوی سرمایهگذاران روبرو است تا هوش مصنوعی را به بازدهی مالی برساند.
متا ماه گذشته پس از آنکه مارک زاکربرگ، مدیرعامل شرکت، از افزایش مخارج و تبدیل شرکت به «شرکت پیشتاز هوش مصنوعی در جهان» سخن گفت، حدود ۲۰۰ میلیارد دلار از ارزش بازار خود را از دست داد. سرمایهگذاران نگران افزایش چشمگیر هزینهها و بازدهی محدود این فناوری هستند.
لیکان میگوید: «ما در نقطهای قرار داریم که از نظرمان در شرف ساخت سیستمهای بعدی هوش مصنوعی مولد هستیم.»
در حالی مدیر هوش مصنوعی متا از رویکرد متفاوت شرکت و تیم خود میگوید که فعالان هوش مصنوعی برای توسعه مدلهای بزرگ زبانی و پیشرفت آنها تلاش میکنند. چهرههای شناخته شدهای مثل سم آلتمن، مدیرعامل اوپنایآی، باور دارند که توسعه مدلهای زبانی گامی حیاتی برای رسیدن به هوش مصنوعی عمومی یا AGI است. هوش مصنوعی عمومی به سیستمی گفته میشود که توانمندیهای ذهنی آن مساوی یا فراتر از انسانها است.
اوپنایآی به تازگی از یک مدل زبانی سریعتر و بهتر به نام GPT-4o رونمایی کرد و گوگل نیز هوش مصنوعی «چندوجهی» خود به نام Project Astra را به نمایش گذاشت که به لطف نسخه بهبود یافتهای از مدل زبانی جمنای میتواند به صورت زنده به سوالات در ویدیو، صوت و متن پاسخ دهد.
متا نیز به تازگی از مدل زبانی جدید خود یا Llama 3 رونمایی کرده است. نیک کلگ، رئیس امور بینالملل متا، میگوید این مدل زبانی «توانمندیهای بسیار بهتری همچون استدلال دارد.» برای مثال این سیستم علاوه بر اینکه میتواند تشخیص دهد فردی که نشانههایی مثل سردرد، خشکی گلو و آبریزش بینی دارد احتمالا سرما خورده است، اما به حساسیتهای احتمالی که ممکن است دلیل این نشانهها باشند نیز واقف است.
با این حال لیکان پیشرفت در این حوزه و مدلهای زبانی را اولویت اصلی نمیداند. او میگوید خوب است که ایدههای مختلفی را برای رسیدن به هوش انسانی امتحان کنیم زیرا «ابهامات و اکتشافات زیادی در این زمینه وجود دارد و درنتیجه نمیتان گفت کدام یک موفق میشود یا در آخر انتخاب خواهد شد.»
لیکان اولین بار مقاله مربوط به چشمانداز مدل سازی جهان یا World Modelling را در سال ۲۰۲۲ منتشر کرد و متا از آن زمان تا به امروز دو مدل تحقیقاتی را براساس این رویکرد عرضه کرده است.
لیکان میگوید یکی از رویکردها نسبت به مدل سازی این است که ساعتها ویدیو در اختیار سیستم قرار میگیرد و به عمد فریمهایی از آن حذف میشوند، سپس هوش مصنوعی باید اتفاق بعدی را پیش بینی کند. این کار برای تقلید از کودکانی است که با گذشت زمان و مشاهده جهان اطراف خود دانش خود را کسب میکنند.
با این حال یکی از کارکنان سابق بخش هوش مصنوعی متا این رویکرد را «مبهم» تعریف میکند و یکی دیگر از کارکنان فعلی هم میگوید آزمایشگاه Fair باید خود را به عنوان یک رقیب جدی برای دیگر گروههای تحقیقاتی از جمله دیپمایند گوگل به اثبات برساند.