هوش مصنوعی OpenAI با شنیدن 15 ثانیه صدای انسان را شبیهسازی میکند
در سالهای اخیر که فناوری هوش مصنوعی پیشرفتهای فراوان کرده است، زمان مورد نیاز برای گوش دادن به یک قطعه و شبیه سازی صدای یک نفر توسط این فناوریها کوتاهتر شده است. این زمان که قبلا چند دقیقه بود، هم اکنون فقط به چند ثانیه رسیده است.
شرکت OpenAI که تحت حمایت مایکروسافت به یکی از بزرگترین توسعه دهندگان هوش مصنوعی در جهان تبدیل شده است به تازگی اعلام کرد فناوری خود مخصوص شبیه سازی صدا که برای بازتولید صدای افراد مورد استفاده قرار میگیرد را به گونهای ارتقا داده است که تنها به 15 ثانیه از صدای واقعی افردا نیاز دارد تا بتواند دقیقا آنها را بازتولید کند.
شرکت OpenAI با انتشار مطلبی در وبسایت خود پیش نمایشی در مقیاس کوچک از مدلی را ارایه کرد که Voice Engine نام دارد و گفته میشود که فرآیند توسعه آن از اواخر سال 2022 میلادی آغاز شده است.
سیستم Voice Engine با تغذیه حداقل 15 ثانیه از فایل صوتی و گفتاری کار میکند. سپس کاربر میتواند متنی را وارد کند تا چیزی که OpenAI از آن به عنوان «گفتار احساس آمیز و واقع گرایانه» توصیف میکند را در اختیار بگیرد و خروجی نهایی شبیه به بلندگوی اصلی باشد.
در ادامه مطلب OpenAI آمده است: «براساس این گفتوگوها و نتایج این آزمایشات در مقیاس کوچک، ما تصمیم آگاهانه تری گرفتیم تا مشخص شود چگونه این فناوری در مقیاس کاربری مورد استفاده قرار گیرد».
منبع: digitaltrends.com
ترجمه: همکاران سیستم