دسترسی مشتریان API اوپنایآی به حالت صوتی
اوپنایآی به توسعه دهندگان و کسبوکارها اجازه میدهد دستیار صوتی این شرکت را در اپلیکیشنهای خود به کار گیرند. در نتیجه طیف وسیعی از کاربران در آینده به مکالمه طبیعی برای ارتباط با سیستم هوش مصنوعی دسترسی خواهند داشت.
به گزارش بلومبرگ، این قابلیت چیزی شبیه به حالت صوتی پیشرفته است که به تازگی در اختیار کاربران پولی ChatGPT قرار گرفت و از امروز (سهشنبه) از طریق رابط برنامهنویسی یا API اوپنایآی در اختیار سازندگان اپلیکیشن یا خدمت قرار میگیرد. اوپنایآی میگوید، کسبوکارها میتوانند با استفاده از این رابط برنامهنویسی، نرمافزاری مثل یک روبات خدمات مشتری یا اپلیکیشن سفری بسازند که از جانب کاربر به تماسها پاسخ میدهد. برخی از شرکتها از جمله اپلیکیشن مربی سلامت Healthify پیش و اپلیکیشن یادگیری زبان Speak پیش از این قابلیت صوتی را آزمایش کردهاند.
ادغام صوتی شخص ثلاث یکی از چند بیانیه جدیدی است که در مراسم توسعه دهندگان اوپنایآی در سنفرانسیسکو اعلام شد. اوپنایآی به لطف این کنفرانس، فاصله خود با رقبا را در بازار پر جنبوجوش هوش مصنوعی به رخ میکشد. مراسم امروز (سه شنبه یکم اکتبر) در حالی برگذار شد که میرا موراتی، مدیر ارشد فناوری این استارتآپ خبر جدایی خود را اعلام کرده است.
در حالی که اوپنایآی نوامبر گذشته در اولین مراسم توسعه دهندگان خود از یک مدل هوش مصنوعی جدید رونمایی کرد، اما امسال قرار بر رونمایی از یک مدل جدید نیست. در عوض اوپنایآی روی نمایش توانمندیهای API و ملاقات با ۳ میلیون توسعه دهندهای تمرکز میکند که در بخشهای مختلف جهان با نرمافزار این شرکت کار میکنند. مراسم روز سهشنبه قرار است یکی از سه مراسمی باشد که دو مورد بعدی آن در لندن و سنگاپور برگذار میشوند.
کارکنان اوپنایآی در یک نشست خبری، قابلیت صوتی جدید را در یک اپلیکیشن سفر ساختگی به نمایش گذاشتند. رموین هوت، رئیس تجربه توسعه دهنده اوپنایآی، از این اپلیکیشن ساختگی خواست تا یک تماس تجاری بگیرد و ۴۰۰ توت پوشیده از شکلات سفارش دهد و مجموع هزینه را زیر ۱۵۰۰ دلار نگه دارد. این اپلیکیشن خیلی سریع تماس را برقرار کرد و گوشی کنار هوت زنگ خورد. هوت جواب داد و به عنوان یکی از کارکنان شرکت گیرنده تماس، سفارش را پذیرفت. او گفت که هزینه ۱۲۰۰ دلار میشود.
گفتنی است که صدای استفاده شده در این نمونه، به گیرنده تماس درمورد اینکه هوش مصنوعی است اطلاعی نمیدهد و برخی از کاربران به همین دلیل اظهار نگرانی کردهاند. اوپنایآی پس از انتشار دمو اعلام کرد که اجبار مشخصی ندارد که توسعه دهندگان باید کاربر را از صحبت با هوش مصنوعی مطلع کنند اما سیاستهای استفاده تصریح میکند که توسعه دهندگان به طور کلی باید درمورد استفاده از هوش مصنوعی آنها اطلاعرسانی کنند، به جز در مواردی که کاربر به صورت مشهودی از آن مطلع است.
اولیور گادمنت، رئیس محصول API اوپنایآی، میگوید: «هیچ دستورالعمل مشخصی برای نحوه انجام این کار وجود ندارد. ما فقط میخواهیم مطمئن شویم که [این مساله] برای کاربر روشن باشد.»
اوپنایآی اولین بار در ماه مه از حالت صوتی پیشرفته برای ChatGPT رونمایی کرد و توانمندی آن در پاسخ به پرامپتهای متنی و تصویری را به رخ کشید. اما یک ماه بعد، اوپنایآی عرضه این قابلیت را به دلیل کار روی مشکلات ایمنی به تاخیر انداخت. پس از این تاخیر، اوپنایآی اعلام کردکه این محصول امکان تقلید صدای دیگران را نخواهد داشت. شرکت میگوید فیلترهای جدیدی اضافه کرده تا مطمئن شود که نرمافزار میتواند درخواستهایی برای تولید موسیقی یا دیگر انواع صوت دارای حق کپیرایت را شناسایی و رد کند.
اوپنایآی در ماه جولای این قابلیت را در اختیار تعداد محدودی از کاربران ChatGPT Plus قرار داد و ماه گذشته عرضه آن برای تمام مشترکان پولی این چتبات آغاز شد.