هوش مصنوعی

February 18, 2024
13:01 یکشنبه، 29ام بهمنماه 1402
کد خبر: 161006

مدل جدید هوش مصنوعی متا با تماشای ویدیو‌ها یاد می‌گیرد

منبع: Peivast

محققان متا مدل تازه‌ای را منتشر کردند که روند آموزشی متفاوت از مدل‌های بزرگ زبانی دارد. این مدل با تماشای ویدیو و خیلی شبیه‌تر به انسان و موجودات زنده یاد می‌گیرد. مدیر هوش مصنوعی متا پیشتر به محدودیت‌های هوش مصنوعی امروز در مقایسه با انسان و دیگر موجودات زنده اشاره کرده بود و این نوآوری شاید گام بزرگی به سوی آینده باشد.

در چند روزی که گذشت سه غول هوش مصنوعی از نوآوری‌های خود رونمایی کردند. اوپن‌ای‌آی از مولد ویدیویی به نام سورا پرده برداشت و گوگل هم جمینی ۱.۵ را عرضه کرد. شرکت متا هم که رویکردی متن‌باز را برخلاف دو شرکت دیگر در پیش گرفته حالا از مدلی به نام V-JEPA رونمایی کرده و می گوید روش یادگیری آن شبیه‌تر به موجودات زنده است.

به گفته متا این مدل گامی در جهت ساخت سیستم‌هایی است که می‌توانند جهان فیزیکی را درک کنند زیرا قابلیت یادگیری از ویدیو را دارد. مدل‌های زبانی بزرگ معمولا براساس تعداد زیادی جمله و عبارت آموزش داده می‌شوند و در روند آموزش مدل یاد می‌گیرد که چطور جاهای خالی و پنهان شده یک جمله را پر کند. به این ترتیب می‌تواند رفته‌رفته یک سری از کلمات را در محتمل‌ترین حالتش کنار هم بچیند و جملاتی معنادار تشکیل دهد.

یان لکان، رئیس هوش مصنوعی متا که پیشتر به محدودیت‌های تکیه بر محتوای متنی و یادگیری از این طریق اشاره کرده بود می‌گوید اگر مدل‌های هوش مصنوعی بتوانند به جای کلمه از تصویر ویدیویی استفاده کنند، سرعت یادگیری بیشتر می‌شود.

او می‌گوید: «هدف ما ساخت ماشین هوش مصنوعی پیشرفته‌ای است که شبیه‌تر به انسان‌ها یاد بگیرد و مدل‌های داخلی جهان اطراف را تشکیل داده و بتواند یاد بگیرد، خود را انطباق دهد و به گونه‌ای کارآمد برای تکمیل وظایف پیچیده برنامه‌ریزی کند.»

یکی از نکات جالب روند یادگیری مدل این است که ویدیو‌های به کار رفته در روند آموزش نشانه‌گذاری نشده‌اند. در فرایند یادگیری بخشی از تصویر و زمان ویدیو از چشم مدل پنهان می‌شود و بدون نشانه‌گذاری این مدل می‌آموزد که بخش پنهان شده احتمالا چه چیزی بوده است (اگر یک انسان ابتدای افتادن سیب از درخت و سپس سیبی روی زمین را ببیند، به راحتی می‌تواند بخش نادیده را تصور و پازل را تکمیل کند.)

نکته مهم دیگر اینکه V-JEPA یک مدل مولد نیست و مدلی مفهومی از جهان تولید می‌کند. محققان متا می‌گویند V-JEPA، پس از یک پیش آموزش با استفاده از مخفی کردن بخش‌ها و زمان‌هایی از ویدیو «در شناسایی و درک روابط پیچیده بین اشیا تبحر پیدا می‌کند.»

لکان معتقد است که ناتوانی مدل‌های بزرگ زبانی در یادگیری به واسطه دیدن و شنیدن، سرعت حرکت به سمت هوش مصنوعی عمومی یا ابزاری هوشمندتر از انسان را کاهش می‌دهد.

گام بعدی متا پس از V-JEPA، اضافه کردن صوت به تصویر است که در نتیجه آن بعد تازه‌ای از داده‌ها در اختیار مدل قرار می‌گیرد. به گفته غول شبکه اجتماع، این مدل براساس جواز غیرتجازی Creative Commons عرضه شده تا محققان بتوانند آن را بررسی کنند و حتی توانمندی‌های آن را توسعه دهند.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.