Gemini گوگل ۷۰۰ بار قدرتمندتر از OpenAI
گوگل مدعی است مدل هوش مصنوعی جدید آن به نام «جمینی ۱.۵» می تواند تا یک میلیون توکن ورودی معادل ۸۰۰ هزار واژه را مدیریت کند که ۷۰۰ بار بیشتر از قدرت سیستم جدید هوش مصنوعی اوپن ای آی است.
به گزارش اینترستینگ انجینرینگ، به نظر می رسد گوگل سعی دارد به رقیبی جدی برای شرکت های فعال در حوزه هوش مصنوعی تبدیل شود. این شرکت حدود یک هفته قبل «جمینی ۱.۰ اولترا» قدرتمندترین مدل هوش مصنوعی خود را راه اندازی و اکنون جانشین آن یعنی «جمینی ۱.۵» را معرفی کرده است. این نسل از مدل های هوش مصنوعی سریع تر، هوشمندتر و ماهرتر از نمونه های قبلی است.
«جمینی۱.۵ » حاصل نوآوری های خستگی ناپذیر گوگل در حوزه «پردازش زبان طبیعی»(NLP) است. NLP شاخه ای هوش مصنوعی مرتبط با درک و تولید زبان انسان است. گوگل مدعی است جمینی۱.۵ می تواند تا یک میلیون توکن ورودی معادل ۴ میلیون کاراکتر یا ۸۰۰ هزار واژه را کنترل کند. این رقم ۷۰۰ بار بیشتر از رکورد جی پی تی-۴ (رکورد دار قبلی این حوزه) است که قادر به پردازش ۱۲۸ هزار توکن است.
چنین آمار و ارقامی بدان معنا است که جمینی ۱.۵ می تواند متون طولانی تر و پیچیده تر مانند رمان، مقالات یا سخنرانی ها را درک و تولید و همزمان هماهنگی و کیفیت را حفظ کند. از سوی دیگر جمینی ۱.۵ می تواند داده های ورودی چند وجهی مانند متن، عکس، صوت و ویدئو را مدیریت و بازده هایی در هریک از این فرمت ها تولید کند. به عنوان مثال جمینی ۱.۵ می تواند با توجه به یک ویدئوکلیپ به سوالات پاسخ دهد یا براساس متن شعری بسازد.
علاوه بر آنچه گفته شد جمینی ۱.۵ یک مدل نیست بلکه خانواده ای از مدل های هوش مصنوعی است که نیازهای مختلفی دارند و برای مقاصد متفاوتی به کار می روند. جمینی ۱.۵ پرو یک مدل چند منظوره ترین وسیع به حساب می آید که از نظر عملکرد با جمینی ۱.۰ اولترا قابل مقایسه است. اما قدرت رایانشی کمتری را به کار می گیرد. این آن را برای موارد استفاده در دنیای واقعی کارآمدتر و مقیاس پذیرتر می کند. جمینی ۱.۵ پرو همچنین نخستین مدلی است که از تکنیک جدیدی به نام Mixture-of-Experts (MoE)(ترکیب کارشناسان) استفاده می کند. این امر به آن اجازه میدهد تا بهجای آنکه در هر بار جستجو کل مدل به کار گرفته شود، بخش های مرتبط انتخاب شوند.