محققان یکی از شرکتهای دانشبنیان با ایجاد بزرگترین لغتنامه فارسی موفق به ارائه نرمافزار تبدیل متن به گفتار در زبان فارسی شدند و بنا بر گفته این پژوهشگران این محصول امکان پشتیبانی از گفتار و صوت در محیطهای نویزی و تشخیص کلمات کلیدی گفتاری خاص در یک فایل صوتی را دارد.
موسی مأموری، از محققان این طرح تمرکز تحقیقاتی این شرکت دانشبنیان را توسعه سیستمهای هوش مصنوعی دانست و گفت: تبدیل گفتار به متن فارسی با عنوان "فارس آوا" یکی از محصولات این شرکت است. صدا در هوش مصنوعی یکی از مهمترین و ارزشمندترین موضوعات است، به گونهای که کشورهای پیشرفته بیشترین سرمایه گذاری را در این حوزه داشتند، چون راحتترین راه ارتباطی کلامی میان انسان و کامپیوتر به شمار میرود.
وی ارتباط کلامی را راحتترین، سادهترین و سریعترین راه ارتباطی توصیف کرد و افزود: دز نرمافزار "فارسآوا" از آخرین الگوریتمهای یادگیری عمیق استفاده شده و بر خلاف محصولات مشابه نیازی به آموزش اولیه صدای کاربر ندارد و انواع صداها برایش قابل فهم است، ضمن آنکه امکان اضافه کردن فهم صوتی به انواع نرم افزارها وجود دارد.
مأموری با بیان اینکه در حال حاضر این محصول ۱۵ درصد در زبان فارسی از گوگل بهتر عمل میکند، خاطر نشان کرد: در گذشته شرکتهای ایرانی از گوگل سرویسهای لازم برای پردازش گفتار دریافت میکردند، ولی به دلیل تحریم شرکتهای خارجی و افزایش قیمت ارز، مجبور به همکاری با شرکتهای ایرانی در این زمینه هستند.
مأموری با اشاره به فعال شدن شرکتها در زمینه پردازش گفتار، خاطر نشان کرد: در این زمینه شرکتهای متعددی فعال شدند، ولی یکی از مهمترین مزیت ما نسبت به رقبا، دارا بودن دیتا صدا است، به گونهای که بیش از ۷ هزار ساعت به سیستم آموزش دادیم که در این زمینه رقیب دوم ما ۳ هزار ساعت است.
مجری طرح با تاکید بر اینکه اگر پردازش گفتار قوی باشد، میتوان سامانهها و محصولات مختلفی بر روی آن پیاده سازی کرد تا به صورت هوش مصنوعی کار کند، ادامه داد: تبدیل گفتار فارسی به متن با دقت و سرعت بالا و به صورت بلادرنگ، توسعه و تولید به صورت کامل در داخل کشور، پشتیبانی از انواع فرمتهای صوتی و ویدئویی با حجم بالا و امکان گرفتن صوت از میکروفن و تبدیل آن به متن به صورت آنلاین از قابلیتهای این نرم افزار است.
این محقق، دارا بودن فرهنگ لغت بسیار بزرگ و وسیع را از دیگر مزایای نرمافزار تبدیل گفتار فارسی به متن عنوان کرد و یادآور شد: این نرمافزار همچنین امکان پشتیبانی از گفتار و صوت در محیطهای نویزی و تشخیص کلمات کلیدی گفتاری خاص در یک فایل صوتی را دارد.
وی دستیار هوشمند فارسی را از دیگر دستاورهای هوش مصنوعی این شرکت نام برد و یادآور شد: این نرمافزار که در آن از موتور "فارس آوا" استفاده شده است، همانند نرمافزارهایی چون سیری اپل و الکسا و گوگل اسیستنت کار میکند، به این ترتیب که دستور صوتی به کامپیوتر ارائه میشود و کامپیوتر صدا را تبدیل به متن میکند و بر اساس بانک دادهای که در اختیار دارد، صوت را مجددا به صورت گفتار تحویل میدهد.
مأموری دستیار هوشمند سازمانی را نوعی "چتبات" معرفی کرد که در کاملترین حالت خود توانایی گفتوگو کردن با انسان را دارد و ادامه داد: این نرمافزار میتواند صحبتهای انسان را متوجه شود، سوالهای آنها را بفهمد و پاسخ متناسب با آن را ارائه دهد و هرگز پاسخهای نادرست نمیدهد.
وی با اشاره به کاربردهای این نرمافزار توضیح داد: به عنوان مثال با استفاده از این نرمافزار میتوان درباره آب و هوا، ترافیک شهری و دریافت خدمات اسنپ سوال کرد و یا زمانی که به کسی زنگ بزنید و یا میخواهید پیامک ارسال کنید، از آن پرسیده میشود و اقدام به جستوجو میکند و در کسری از ثانیه پاسخ میدهد.
مأموری با بیان اینکه این خدمات به زبان فارسی است و تفاوت این نرمافزار با "سیری" در نوع انتخاب زبان است، یادآور شد: در حال حاضر در ایران شرکتی به توانمندی "سیری" نداریم و ما جزو اولینهای این حوزه هستیم.
وی، مشاهده وضعیت آب و هوا، قیمت ارز و سکه، دیکشنری آنلاین، مشاهده نزدیکترین رستورانها، پمپ بنزینها، بیمارستانها و غیره، برقراری تماس و ارسال پیامک و تنظیم آلارم، جستوجو و تحقیق، مکانیابی و ارتباط با تاکسیهای آنلاین و امکان جستجوی کالاهای مورد نیاز از وب سایتها را از جمله کاربردهای این نرم افزار نام برد.
این محقق، دستیار هوشمند فوتبالی را از دیگر محصولات نرمافزاری فارس آوا دانست و گفت: این نرمافزار میتواند اطلاعات حوزه فوتبال را به کاربر ارائه دهد.