گوگل از Gemini رونمایی کرد؛ انقلابی در دنیای هوش مصنوعی
گوگل بالاخره رسماً مدل هوش مصنوعی Gemini را معرفی کرد و از راهاندازی آن بهعنوان رقیب مدل مورد استفاده در ChatGPT خبر داد.
عرضه مدل هوش مصنوعی جدید جمینای (Gemini) به گفته مدیرعامل گوگل آغازگر عصر جدیدی برای این شرکت خواهد بود که از آن بهعنوان «عصر جمینای» نام برده شده است. این مدل در نسخههای مختلفی عرضه خواهد شد و میخواهد بهطور مستقیم به رقابت با GPT-4 از شرکت OpenAI برود.
گوگل اولینبار در رویداد توسعهدهندگان 2023 خود به مدل هوش مصنوعی جمینای اشاره کرده بود و حالا رسماً از عرضه آن خبر داده است. این مدل یک نسخه سبک بهنام Gemini Nano دارد که میتواند بهصورت آفلاین روی دستگاههای اندرویدی اجرا شود.
مدل دوم قدرت بیشتری دارد و با نام Gemini Pro بهزودی در سرویسهای هوش مصنوعی گوگل پیادهسازی خواهد شد و از امروز در چتبات بارد فعال است. نسخه سوم جمینای با نام Gemini Ultra، قدرتمندترین مدل زبانی بزرگی است که گوگل تابهحال خلق کرده و ظاهراً بیشتر برای دیتاسنترها و کاربردهای سازمانی طراحی شده است.
مدل هوش مصنوعی جمینای پرو در حال حاضر در بارد پیادهسازی میشود، و کاربران پیکسل 8 پرو هم میتوانند با جمینای نانو از ویژگیهای جدیدی برخوردار شوند. جمینای اولترا قرار است از سال آینده میلادی عرضه شود. توسعهدهندگان و مصرفکنندگان سازمانی میتوانند از 13 دسامبر از طریق Generative AI Studio یا Vertex AI در گوگل کلود به جمینای پرو دسترسی پیدا کنند.
مدل هوش مصنوعی Gemini گوگل در حال حاضر فقط به زبان انگلیسی در دسترس است و سایر زبانها در آینده برای آن فعال میشود. «ساندار پیچای»، مدیرعامل گوگل میگوید این مدل در نهایت در موتور جستجو، سرویس تبلیغات، مرورگر کروم و دیگر محصولات این شرکت پیادهسازی خواهد شد. این مدل آینده گوگل را رقم خواهد زد.
مقایسه مدل هوش مصنوعی Gemini گوگل با GPT-4
«دمیس هاسابیس»، مدیرعامل دیپمایند که در توسعه Gemini نقش اساسی داشته است، میگوید آنها بنچمارکهای زیادی را روی این مدل انجام دادهاند. در واقع از بین 32 بنچمارک مهمی که روی جمینای انجام شده است، این مدل در 30 مورد جلوتر از رقبا بوده است.
آشکارترین برتری جمینای در بنچمارکها به توانایی درک و تعامل با صوت و ویدیو برمیگردد. قابلیت چندوجهی ظاهراً از ابتدا یکی از اهداف توسعه جمینای بوده و گوگل قصد نداشته است تا مانند OpenAI برای امور مختلف مدلهای گوناگونی مثل DALL-E یا Whisper بسازد.
جمینای نانو در حال حاضر فقط میتواند ورودی و خروجی متنی داشته باشد، اما نسخه قدرتمند آن یعنی اولترا قادر به کار با متن، تصویر، ویدیو و صدا است. هاسابیس میگوید در آینده قابلیتهای بیشتری مثل تشخیص لمس و حرکت هم توسط این مدل هوش مصنوعی قابل درک خواهد بود.
گوگل در زمینه کدنویسی ظاهراً تمرکز ویژهای روی جمینای داشته است. این مدل هوش مصنوعی از سیستم تولید کد جدید AlphaCode 2 استفاده میکند که این شرکت میگوید میتواند 85 درصد بهتر از رقبا و 50 درصد بهتر از نسل قبلی خود کدنویسی کند.
مدل هوش مصنوعی Gemini از نظر مصرف انرژی هم ظاهراً بسیار بهینه است. گوگل این مدل را روی واحد پردازش تنسور (TPU) خودش آموزش داده تا نسبت به مدلهای قبلی ازجمله PaLM سریعتر و ارزانتر باشد. این شرکت در کنار این مدل از نسخه جدید سیستم TPU موسوم به TPU v5p هم پرده برداشته که یک سیستم رایانش مخصوص دیتاسنترهاست و در زمینه آموزش و اجرای مدلهای زبانی بزرگ میتواند مورد استفاده قرار گیرد.
گوگل میگوید تلاش زیادی کرده است تا از ایمنی و مسئولیتپذیری Gemini مطمئن شود و آزمایشهای زیادی را در این زمینه انجام داده است. بااینحال، باید منتظر بمانیم تا ببینیم این مدل در جهان واقعی چه عملکردی از خود نشان خواهد داد.
ساندار پیچای و دمیس هاسابیس ظاهراً اعتقاد دارند که راهاندازی هوش مصنوعی Gemini آغازگر پروژهای بزرگتر و گامی در مسیر تغییر است. این همان مدلی است که گوگل سالها در حال توسعه آن بوده و حالا برای تغییر صحنه رقابت با OpenAI به آن نیاز دارد.