هوش مصنوعی

December 23, 2024
11:28 دوشنبه، 3ام دیماه 1403
کد خبر: 180549

بن‌بست OpenAI در توسعه نسل بعدی مدل‌های زبان

منبع: پیوست

گزارشی از وال‌استریت ژورنال می‌گوید بزرگترین استارت‌آپ هوش مصنوعی جهان در توسعه نسل بعدی مدل‌های زبانی خود با مشکلات جدی روبرو است و تلاش‌های این شرکت را به ویژه نبود داده‌های کافی محدود کرده‌اند. این نشریه در گزارش خود مدعی است که توسعه مدل جدید به نام GPT-5 که در داخل شرکت با کد‌نام اوریون (Orion) به دلیل مشکلات متعدد از جمله نبود داده‌های کافی با تاخیر طولانی مواجه شده است.

افراد مطلع به وال‌استریت ژورنال می‌گویند از آغاز این پروژه بیش از ۱۸ ماه می‌گذرد و قرار بود توسعه نسل جدید مدل‌های زبانی،‌ پیشرفت بزرگی را در زیرساخت ChatGPT رقم بزند. در حالی که مایکروسافت، بزرگترین سرمایه‌گذار اوپن‌ای‌آی، در میانه سال ۲۰۲۴ منتظر توسعه مدل جدید بوده است اما به نظر تلاش‌های اوپن‌ای‌آی به بن‌بست خورده‌اند.

سم آلتمن، مدیرعامل اوپن‌ای‌آی، و شرکتش در نوامبر ۲۰۲۲ با عرضه ChatGPT جهان فناوری را به طور کامل دگرگون کردند و موجی از نوآوری‌ها را در دو سال گذشته تجربه کرده‌ایم.

زیرساخت این چت‌بات محبوب را مدل‌های زبانی تشکیل می‌دهند و این مدل‌ها برای توسعه و پیشرفت به مقدار زیادی داده نیاز دارند. اولین مدل‌های این شرکت (پیش از عرضه ChatGPT) تنها با چند میلیون پارامتر آموزش دیده‌ بودند اما طی چند سال، تعداد پارامتر‌های آموزشی این مدل‌ها به شکل تصاعدی افزایش یافت به گونه‌ای که تعداد پارامتر‌ها از ۱۱۷ میلیون در GPT-1 به ۱۷۵ میلیارد پارامتر در GPT-3 رسید.

اوپن‌ای‌آی در مارس ۲۰۲۳ جدیدترین مدل زبانی خود را با نام GPT-4 منتشر کرد و از همان تاریخ در حال کار روی مدل بعدی با نام GPT-5 است.

مدل‌های زبانی همچنین علاوه بر مقدار زیادی داده، به زیرساخت گسترده‌ای برای آموزش نیاز دارند و به طور کلی هزینه سرسام آوری برای استارت‌آپ‌های هوش مصنوعی دارند.

با اینکه به گفته آلتمن، آموزش مدل GPT-4 چیزی حدود ۱۰۰ میلیون دلار برای این استارت‌آپ هزینه داشت، انتظار می‌رود که هزینه آموزش برای مدل‌های آینده از یک میلیارد دلار عبور کند و بنابراین شکست اوپن‌ای‌آی در این مسیر با اتلاف هزینه چشمگیری همراه است.

وال‌استریت ژورنال می‌گوید اوپن‌ای‌آی از اواسط سال ۲۰۲۳ برای آموزش مدل بعدی خود آماده شده است اما از آنجایی که فرایند آموزش مدل بعدی بسیار زمان‌بر و هزینه‌بر است، تلاش‌های این شرکت طبق برنامه پیش نرفته است.

پژوهشگران اوپن‌ای‌آی سعی کردند تا با یک سری تغییرات فنی پروژه اوریون را تقویت کنند اما در نهایت به این نتیجه رسیدند که به داده‌های متنوع و با کیفیت‌تری برای آموزش مدل جدید نیاز است و چنین داده‌هایی در محیط عمومی اینترنت یافت نمی‌شود.

شاید همین مساله باعث شده است که اوپن‌ای‌آی به تازگی با چندین ناشر بزرگ برای استفاده از داده‌های آنها در روند آموزش‌ و پاسخ‌های ChatGPT قرارداد منعقد کند.

طبق گفته وال‌استریت ژورنال، اوپن‌ای‌آی برای رفع این مشکل حتی به توسعه داده‌های مصنوعی یا داده‌های ساخته هوش مصنوعی برای آموزش اوریون روی آورده است. تحقیقات نشان داده است که چرخه تولید داده توسط هوش مصنوعی برای استفاده در روند آموزش هوش مصنوعی ممکن است به عملکرد نادرست و پاسخ‌‌های نامفهوم منتهی شود.

مسیری که به مدل‌های استدلال محور منتهی شد
با اینکه اوپن‌ای‌آی بیش از یک سال است که مدل زبانی جدیدی را معرفی نکرده است اما این شرکت در حوزه دیگری مشغول پیشروی است.

این استارت‌آپ به تازگی از مدل متفاوتی به نام o1 و پس از آن o3 رونمایی کرد که عملکرد متفاوتی نسبت به مدل‌های پیشین این شرکت دارند.

این مدل‌های استدلال محور، پیش از پاسخ به درخواست کاربران فرایندی شبیه به فکر کردن را پشت سر می‌گذارند و پس از پشت سر گذاشتن چند مرحله که به کمی زمان نیاز دارد، پاسخ عمیق‌تری در اختیار کاربر می‌گذارند که به گفته اوپن‌ای‌آی برای موضوعاتی مثل برنامه‌ریزی و حل مشکلات پیچیده مناسب است.

مدل‌های استدلال محور در پشت زمینه چندین پاسخ برای یک سوال ارائه می‌کنند و سپس برای انتخاب بهترین گزینه این پاسخ‌ها را تجزیه‌تحلیل می‌کنند. این مدل‌ها عملکرد بهتری در وظایف پیچیده مثل برنامه‌ریزی تجاری یا ساخت یک پازل حروف دارند.

پژوهشگران اوپن‌ای‌آی سعی دارند که با این دسته از مدل‌های استدلال محور مشکل داده‌های مصنوعی را برطرف کنند.

با این حال پژوهشگران اپل پیش از این مقاله‌ای را منتشر کرده‌اند که مدعی است مدل‌های استدلال محور از جمله o1،‌ بیشتر از اینکه استدلال واقعی داشته باشند، در واقع الگوهای موجود در داده‌های حقیقی را تقلید می‌کنند.

اوپن‌ای‌آی چند روز پیش از نسخه جدیدی به نام o3 نیز برای مدل‌های استدلال محور خود رونمایی کرد. براساس گزارش وال‌استریت ژورنال، این مدل‌های استدلال‌محور قرار است پیش‌نیاز لازم برای توسعه مدل‌ زبانی بعدی یا پروژه اوریون را فراهم کنند. با این حال اوپن‌ای‌آی هنوز اشاره‌ای به نسل بعدی مدل زبانی خود یا GPT-5 نکرده است و مشخص نیست که بن‌بست مدل‌های زبانی این شرکت چه زمانی برطرف خواهد شد.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.