هوش مصنوعی

March 20, 0621

۱۰:۳۰ چهارشنبه، ۱۵ام فروردینماه ۱۴۰۳

کد خبر: 163660

اینترنت برای شرکت‌های هوش مصنوعی بیش‌از‌حد کوچک است

منبع: Zoomit

به‌نظر می‌رسد که داده‌های موجود در اینترنت برای توسعه‌ی مدل‌های هوش مصنوعی کافی نیستند.

شرکت‌های هوش مصنوعی هرچقدر که به ساخت مدل‌های بزرگ‌تر و بهتر ادامه می‌دهند، بیشتر با مشکلی خاص مواجه می‌شوند: اینترنت به‌اندازه‌ی کافی بزرگ نیست تا همه‌ی داده‌های لازم را فراهم کند.

داده‌ها نقش محوری در توسعه‌ی هوش مصنوعی ایفا می‌کنند. هر‌چه داده‌های بیشتری برای آموزش مدل هوش مصنوعی استفاده شود، آن سیستم هوشمندتر می‌شود. درمقابل، به‌نظر می‌رسد که داده‌های طبیعی (تولیدشده‌ی انسان) منابع محدودی هستند و ممکن است روزی تمام شوند.

مؤسسه‌ی آینده‌پژوهی Epoch AI پیش‌بینی کرده است که شرکت‌های هوش مصنوعی احتمالاً تا سال ۲۰۲۶ با کمبود داده‌های آموزشی متنی باکیفیت مواجه خواهند شد.

به‌‌گزارش روزنامه‌ی وال استریت ژورنال، ازآنجاکه رشد محتواهای موجود در اینترنت سریع نیست، برخی از شرکت‌ها در حال جست‌وجوی منابع جایگزین برای آموزش مدل‌ها هستند و به‌ گزینه‌هایی مانند زیرنویس ویدئو‌ها یا حتی اطلاعات ساخته‌شده با هوش مصنوعی مولد فکر می‌کنند.

گفته می‌شود که OpenAI مدل GPT-5 را به‌کمک زیرنویس‌ ویدئوهای عمومی یوتیوب توسعه داده است. مدتی پیش میرا موراتی، مدیر ارشد فناوری OpenAI، از پاسخ به این پرسش که «آیا از محتواهای یوتیوب برای آموزش مدل هوش مصنوعی سورا (Sora) استفاده شده است؟»، خودداری کرد.

به‌کارگیری داده‌های ساختگی برای تعلیم مدل‌های هوش مصنوعی موضوع بحث فراوانی در ماه‌های اخیر بوده است و بعضی از پژوهشگران دریافته‌اند که آموزش مدل هوش مصنوعی مبتنی‌بر داده‌هایی که قبلاً هوش مصنوعی دیگر تولید کرده‌اند، می‌تواند به فروپاشی مدل یا خلق نتایج معیوب منجر شود.

بعضی از شرکت‌ها مانند OpenAI و Anthropic، خالق مدل هوش مصنوعی Claude، به‌دنبال تولید محتواهای ساختگی باکیفیت‌تری هستند تا از شکل‌گیری مدلی جلوگیری کنند که با داده‌های بی‌ارزش آموزش دیده باشد. با‌این‌حال، هیچ‌کدام از آن‌ها جزئیات دقیق پروژه‌هایشان را فاش نکرده‌اند.

آنتروپیک هنگام رونمایی Claude 3 گفت که این مدل براساس داده‌هایی که خودشان تولید کرده‌اند، آموزش دیده است. جرد کاپلان، دانشمند ارشد آنتروپیک، نیز در مصاحبه با وال استریت ژورنال اعلام کرد که معتقد است برای داده‌های ساختگی نیز کاربردهای زیادی وجود دارد.

مجله‌ی هاروارد بیزینس ریویو می‌نویسد: «در پنج سال آینده، اپلیکیشن‌ها و دستگاه‌ها کمتر مصنوعی و بیشتر هوشمند خواهند شد. آن‌ها کمتر به یادگیری از کلان‌داده‌ها و بیشتر به استدلال از کل به جزء وابسته خواهند بود که شبیه روش انسان‌ها در حل مسائل و انجام وظایف است. قدرت استدلال می‌تواند کاربردهای گسترده‌تری برای هوش مصنوعی فراهم کند.»

در این زمینه از آرشیو ایستنا:

مشترک شوید!

برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.