پنج تغییر مهم در جدیدترین مدل هوش مصنوعی گوگل
گوگل هفته گذشته از جدیدترین مدل هوش مصنوعی خود با نام جمنای ۲.۰ رونمایی کرد. این مدل زبانی توانمندیهای بهتری در حوزه درک چند وجهی دارد و عاملیت هوش مصنوعی، افزایش سرعت، استفاده بهینه از باتری و ادغام عمیقتر با دیگر راهحلهای گوگل را برای کاربران به ارمغان میآورد. جمنای ۲.۰ اطلاعات را به شکلی متفاوت از نسل قبلی پردازش میکند و وظایف پیچیدهتری را برعهده میگیرد.
گوگل در عرضه جدیدترین مدل هوش مصنوعی خود به طور ویژه روی ادغام هوش مصنوعی با محصولات مختلف از جمله جستجو، نقشه و Workspace تمرکز کرده است که البته برخی از این قابلیتها هنوز روند عرضه خود را طی میکنند. این شرکت همزمان با عرضه مدل جدید هوش مصنوعی ظاهر رابط کاربری NotebookLM را نیز تغییر داد.
پردازش صوت و تصویر
برخلاف مدلهای گذشته گوگل که برای تجزیهتحلیل صوت و تصویر باید ابتدا آن را به متن تبدیل میکردند، جمنای ۲.۰ آنها را به همان حالت اولیه پردازش میکند. هدف از این کار جلوگیری از اتلاف اطلاعات در فرایند ترجمه به متن است. با این رویکرد امکان درک عمیق و غنیتر و فهم نشانههای پیرامونی فراهم میشود. جمنای ۲.۰ با حذف مرحله تبدیل به متن، تفسیر بهینه و دقیقتری از محتوای چندرسانهای دارد.
جمنای ۲.۰ عناصر و اشیای مختلف یک تصویر را شناسایی و روابط بین آنها و محتوای صحنه را درک میکند. در نتیجه هوش مصنوعی پاسخی دقیق و با جزئیات بالا به سوالات مربوط به تصویر میدهد. ارائه یک تصویر مشابه به جمنای ۱.۵ پرو با اینکه برخی از اطلاعات را به طور مشابه تشخیص میدهد اما جزئیات کمتری در پاسخ خود دارد.
عاملیت هوش مصنوعی
عاملیتهای هوش مصنوعی در واقع انواعی از مدلهای هوش مصنوعی هستند که شما میتوانید برای آنها هدفی را مشخص کنید و آنها گامهای لازم برای رسیدن به هدف را برمیدارند. عاملیتهای هوش مصنوعی جمنای ۲.۰ میتوانند وظایف پیچیده و چندمرحلهای را که نیازمند برنامهریزی، تصمیمگیری و تعامل با سیستمهای خارجی هستند برعهده بگیرند. این قابلیت که با نام «Agentic AI» یا هوش مصنوعی عاملیتپذیر شناخته میشود یک نقطه عطف مهم برای پیشرفت هوش مصنوعی است.
شما میتوانید از توانمندیهای عاملیتی این هوش مصنوعی در دیگر ابزارهای گوگل از جمله موتور جستجو، نقشه و گوگل لنز نیز استفاده کنید. برای مثال یک عاملیت هوش مصنوعی جمنای ۲.۰ میتواند از گوگل مپ برای برنامهریزی یک مسیر پیچیده با چندین مقصد و حالتهای مختلف حمل و نقل کمک بگیرد. با این حال این قابلیت هنوز برای همه کاربران فعال نشده است و عاملیتی که امکان ارتباط با نقشه را دارد هنوز در نسخه دسکتاپ قابل استفاده نیست.
گوگل در پست وبلاگی خود از ارتباط جمنای ۲.۰ با دو طرح بزرگ این شرکت سخن میگوید: پروژه Astra و پروژه Mariner. پروژه Astra روی توانمندیهای عاملیتی و ادغام آن با خدماتی مثل جستجو و نقشه تمرکز دارد. پروژه Mariner مربوط به قابلیتهای خودکار اینترنتی مثل پر کردن فرم، رزرو قرار ملاقات و جمعآوری اطلاعات از وبسایتهای مختلف است.
ادغام عمیق با اکوسیستم گوگل
جمنای ۲.۰ به نسبت به نسخههای پیشین هوش مصنوعی گوگل به شکل عمیقتری با محصولات و خدمات این شرکت ادغام شده است. گوگل با این کار به دنبال یک تجربه مستحکم و روان در محصولات و خدمات مختلف است. جمنای ممکن است با چنین رویکردی در آینده به یک رشته اتصال مشترک در Workspace تبدیل شود.
بخش جستجوی گوگل نیز به شکل عمیقتری با جمنای ۲.۰ ادغام میشود و قرار است امکان جستجوی مکالمه محور را برای کاربران فراهم کند و از چکیدههای هوش مصنوعی برای پاسخ کامل به سوالات پیچیده کمک بگیرد. این هوش مصنوعی در Workspace نیز قابلیتهای جدیدی را به Docs، Slides و Meet اضافه میکند. دستیار اندرویدی گوگل نیز قرار است با جمنای ۲.۰ به تواناییهای تازهای مجهز شود.
پاسخ سریعتر و افزایش عمر باتری
جدیدترین نسخه هوش مصنوعی گوگل که نام کامل آن Gemini 2.0 Flash Experimental است از لحاظ سرعت و پاسخگویی نیز تقویت شده است. جمنای ۲.۰ فلش با وجود عملکرد بهتر، تاخیر یا لتنسی کمتری دارد. در نتیجه این هوش مصنوعی سرعت بیشتری در وظایف چندوجهی خواهد داشت.
گوگل همچنین به بهبود عملکرد این مدل هوش مصنوعی اشاره کرده است. گوگل میگوید سرعت این هوش مصنوعی نسبت به نسخه قبلی دو برابر شده است. این هوش مصنوعی در یک بررسی آزمایشی پاسخهای سوالات را تقریبا بدون هیچ تاخیری ارائه میکند. سرعت بالای پاسخ به درخواستها یک تجربه طبیعی و روانتر را برای کاربران رقم میزند و به ویژه در بخش مکالمه صوتی نیز کاهش لتنسی یا تاخیر به تجربه واقعگرایانهتری منجر میشود.
جمنای ۲.۰ فلش در دستگاههای موبایلی مثل گوگل پیکسل ۹ یا دیگر گوشیهای روز انرژی کمتری مصرف میکند و در نتیجه عمر باتری را افزایش میدهد.
ظاهر جدید NotebookLM
عرضه جمنای ۲.۰ با تغییری در NotebookLM همراه شد. این تغییر فراتر از توانمندیهای هوش مصنوعی و ظاهر رابط کاربری را هدف میگیرد. به طور کلی این غییرات قرار است نحوه ارتباط کاربر با نوشتهها و مستندات را تسهیل کند. این تغییرات روی روند کاری و بهبود محیط دیداری این ابزار تمرکز دارند.
جمنای ۲.۰ علاوهبر تشخیص بهتر متن، تصاویر و صداها را نیز درک میکند و دیگر نیازی به ترجمه آنها ندارد. این نسخه قرار است در دیگر محصولات گوگل از جمله بخش جستجو و نقشه هم برای شما ایفای نقش کند و وظایف پیچیدهای را در قالب یک عاملیت برعهده بگیرد. افزون بر این، پنجره محتوای این مدل نیز نسبت به نسخههای پیشین بزرگتر شده است. جمنای ۲.۰ فلش پنجره محتوایی ۲ میلیون توکنی دارد و در نتیجه امکان پردازش دو برابر محتوای بیشتری نسبت به جمنای ۱.۵ پرو دارد.