هوش مصنوعی

July 9, 2025

14:01 چهارشنبه، 18ام تیرماه 1404

کد خبر: 196889

رونمایی انویدیا از فناوری برای بهبود سرعت و پاسخگویی هوش مصنوعی

منبع: دیجیاتو

تکنیک Helix Parallelism به هوش مصنوعی اجازه می‌دهد تا با همان سرعت قبل به کاربران بیشتری پاسخ دهد.

انویدیا از یک تکنیک موازی‌سازی به نام «هلیکس پاراللیسم» (Helix Parallelism) پرده برداشته است که به مدل‌های هوش مصنوعی اجازه می‌دهد تا حجم عظیمی از اطلاعات را پردازش کنند و با همان سرعت به‌طور همزمان به ۳۲ برابر کاربر بیشتر پاسخ دهند. این فناوری به‌طور ویژه برای معماری پردازشگر‌های گرافیکی جدید بلک‌ول (Blackwell) طراحی شده است.

با بزرگ‌تر و پیچیده‌تر شدن مدل‌های هوش مصنوعی، یکی از مهم‌ترین مسائل آنها توانایی پردازش حجم عظیمی از اطلاعات زمینه (Context) در هنگام تولید پاسخ‌های آنی است. اکنون انویدیا با معرفی Helix Parallelism راه‌حلی برای این مشکل ارائه کرده است.

معرفی فناوری Helix انویدیا
مدل‌های زبان بزرگ برای تولید هر کلمه جدید، با دو چالش اساسی روبه‌رو هستند:

آنها باید به‌طور مداوم کل تاریخچه مکالمه (که در حافظه‌ای به نام KV Cache ذخیره شده) را اسکن کنند که این فرایند پهنای باند حافظه پردازشگر گرافیکی (GPU) را به شدت تحت فشار قرار می‌دهد.
همزمان، برای پردازش هر کلمه، باید وزن‌های عظیم «شبکه عصبی پیشخور» (FFN) از حافظه بارگذاری شوند که این امر باعث کندی و افزایش تأخیر، به‌ویژه در کاربردهای آنی و زنده مانند چت‌بات‌ها می‌شود.

فناوری هلیکس با یک رویکرد هوشمندانه، این دو فرایند را از هم جدا و به صورت بهینه مدیریت می‌کند:

موازی‌سازی KV: در مرحله اول، هلیکس به‌جای کپی‌کردن کل حافظه مکالمه (KV Cache) روی تمام GPUها، آن را به صورت هوشمندانه بین پردازنده‌های مختلف تقسیم می‌کند. این کار از تکرار بیهوده داده‌ها جلوگیری می‌کند و فشار روی حافظه را به شدت کاهش می‌دهد.
استفاده مجدد از منابع: در مرحله بعد، همان GPUها بلافاصله وظیفه خود را تغییر می‌دهند و با استفاده از روش «موازی‌سازی تنسوری» (TP) به پردازش لایه FFN می‌پردازند. این جابه‌جایی هوشمندانه باعث می‌شود پردازنده‌ها همیشه فعال باقی بمانند و زمان بیکاری به حداقل برسد.
این فرایند پیچیده با استفاده از فناوری‌های اتصال پرسرعت انویدیا مانند NVLink و NVL72 و همچنین تکنیکی به نام HOP-B ممکن شده است.

نتایج شبیه‌سازی‌ها با یک مدل زبانی بزرگ، عملکرد فوق‌العاده این فناوری را به اثبات رسانده است؛ هلیکس می‌تواند با حفظ همان سرعت و تأخیر، به ۳۲ برابر کاربر بیشتر به‌صورت همزمان سرویس‌ بدهد. همچنین در شرایط بار کاری کمتر، زمان پاسخگویی (تأخیر بین تولید هر کلمه) تا ۱.۵ برابر کاهش می‌یابد.

این پیشرفت به این معناست که دستیارهای مجازی و چت‌بات‌های هوش مصنوعی اکنون می‌توانند میلیون‌ها کلمه اطلاعات را به‌صورت آنی پردازش کنند و درعین‌حال، پاسخگویی و سرعت خود را در تعامل با کاربر حفظ کنند.

+ /
نویسنده: ملکی /
چاپ /
صفحه اصلی

در این زمینه از آرشیو ایستنا:

مشترک شوید!

برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.