فناوری اطلاعات

February 25, 2023

18:54 شنبه، 6ام اسفندماه 1401

کد خبر: 143412

متا از هوش مصنوعی LLaMA رونمایی کرد؛ قدرتمندتر از GPT-3 شرکت OpenAI

مدل زبانی بزرگ متا می‌تواند روی یک GPU اجرا شود و به منابع پردازشی بسیار کمی نیاز دارد.

شرکت متا در واکنش به ترند داغ ابزارهای هوش مصنوعی از مدل زبانی بزرگی به نام LLaMA رونمایی کرد که اگرچه حدود 10برابر کوچک‌تر از مدل GPT-3 شرکت OpenAI است، ولی به ادعای متا، می‌تواند بهتر از آن عمل کند. البته این مدل جدید چت‌باتی نیست که کاربران بتوانند با آن حرف بزنند؛ درعوض برای کارهای تحقیقاتی کاربرد دارد.

متا در پستی در وبلاگ خود مقاله‌ای را منتشر کرده است که می‌گوید مدل LLaMA مثل سایر مدل‌های زبانی بزرگ، دنباله‌ای از کلمات را به‌عنوان ورودی دریافت و کلمه بعدی را پیش‌بینی می‌کند. این غول فناوری می‌گوید این مدل روی 20 زبان جهانی و با کمک داده‌های عمومی وب‌سایت‌هایی مثل ویکی‌پدیا، arXiv ،Stack Exchange ،C4 و CCNet آموزش داده شده است.

متا در مقاله خود مدعی شده که نسخه‌ای از این مدل هوش مصنوعی به نام LLaMA-13B در اکثر بنچمارک‌ها قوی‌تر از GPT-3 ظاهر شده و نسخه بزرگ‌تری از همین مدل به نام LLaMA-65B قادر به رقابت با بهترین مدل‌ها ازجمله Chinchilla70B از دیپ‌مایند و PaLM 540B از گوگل است.

مدل هوش مصنوعی متا توان پردازشی کمتری لازم دارد

متا می‌گوید LLaMA-13B مدلی کوچک‌تر است که توان و منابع پردازشی کمتری لازم دارد. این مدل درواقع از مجموعه‌ای از مدل‌های زبانی تشکیل شده است و در اندازه‌های مختلف در دسترس خواهد بود. این شرکت درباره عرضه مدل خود می‌گوید: «دسترسی به این مدل به‌صورت موردی برای محققان آکادمیک، سازمان‌های دولتی، گروه‌های مدنی و آزمایشگاه‌های تحقیقاتی در سراسر دنیا فراهم می‌شود.»

مدل LLaMA-13B پس از آموزش می‌تواند روی دیتاسنتری با GPU انویدیا تسلا V100 اجرا شود. این مسئله از آن جهت اهمیت دارد که به سازمان‌های کوچک‌تر اجازه می‌دهد تا آزمایش‌های خود را روی سیستم‌های ارزان‌تر انجام دهند.

مدل LLaMA تاکنون در هیچ‌کدام از محصولات و پلتفرم‌های متا پیاده‌سازی نشده است و به‌نظر نمی‌رسد که این شرکت برنامه‌ای برای عرضه هوش مصنوعی خود برای کاربران عادی داشته باشد.

«مارک زاکربرگ»، مدیرعامل متا، درباره عرضه LLaMA می‌گوید: «مدل‌های زبانی بزرگ پتانسیل‌های زیادی را در زمینه تولید متن، گفت‌وگو، خلاصه‌سازی متون و انجام کارهای پیچیده‌تر مثل حل مسائل ریاضی یا پیش‌بینی ساختارهای پروتئینی از خود نشان داده‌اند. متا به این مدل تحقیقات باز متعهد است و ما مدل جدید خود را در دسترس جامعه محققان هوش مصنوعی قرار می‌دهیم.»

+ /
نویسنده: ملکی /
چاپ /
صفحه اصلی

در این زمینه از آرشیو ایستنا:

مشترک شوید!

برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.