گوگل Gemini Live را به عنوان رقیب GPT-4o صوتی معرفی کرد
یکی از ویژگیهای جذابی که گوگل امشب برای اپلیکیشن جمینای معرفی کرد، قابلیت Live یا «زنده» است. در کنفرانس توسعهدهندگان گوگل اعلام شد که Gemini Live میتواند قابلیت گفتوگوی طبیعی با این مدل هوش مصنوعی را فراهم کند تا تعامل صوتی بهتری با این فناوری داشته باشید.
قابلیت جمینای لایو به شما اجازه میدهد بهصورت طبیعی با هوش مصنوعی صحبت کنید و مانعی میان ارتباط خود با این فناوری نداشته باشید. این قابلیت بهطور خودکار لحن حرفزدن شما را تشخیص میدهد و با آن وفق پیدا میکند. گوگل میگوید ویژگی Gemini Live در تابستان امسال برای مشترکان نسخه Advanced در اپ موبایل این هوش مصنوعی عرضه خواهد شد.
قابلیت Gemini Live چیست؟
قابلیت جمینای لایو از طریق آیکون صدا در اپلیکیشن Gemini در اندروید و iOS در دسترس خواهد بود. زمانی که روی این آیکون بزنید، با یک پنجره تمامصفحه روبهرو میشوید که یک افکت شکل موج جذاب را هم به شما نشان میدهد. در این حالت میتوانید با هوش مصنوعی دیالوگ دوطرفه داشته باشید و پاسخ سؤالات خود را در کمترین زمان بگیرید.
گوگل میگوید فرض کنید میخواهید در یک مصاحبه شغلی شرکت کنید یا قصد دارید برای یک سخنرانی مهم آماده شوید. در این شرایط، کافی است از قابلیت Live استفاده کنید و از جمینای بخواهید کمکتان کند. جمینای مهارتهایی را به شما توصیه خواهد کرد که در تعامل با مصاحبهکننده به کار شما میآید، یا نکاتی را به شما میگوید که در هنگام سخنرانی به شما کمک خواهد کرد تا آرامش خود را حفظ کنید و از استرستان بکاهید.
در ماههای آینده میتوانید در حین استفاده از قابلیت Live از دوربین گوشی هم استفاده کنید و درباره چیزهایی که میبینید حرف بزنید یا سؤال بپرسید. این قابلیت بخشی از پروژه استرا است که به جمینای اضافه میشود.
بهنظر میرسد که این قابلیت پاسخی به حالت جدید صوتی در مدل هوش مصنوعی GPT-4o از OpenAI باشد که دیشب در مراسم ویژه این شرکت معرفی شد و بسیاری از مخاطبان را شگفتزده کرد.