"پژوهشنامه تبدیل متن به گفتار" به عنوان نخستین گام برای دستیابی به ابزار تبدیل اطلاعات موجود از قالب نوشتاری به قالب گفتاری منتشر و نسخه الکترونیکی آن در وبگاه SCICT.IR قرار گرفت.
به گزارش آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) از واحد ارتباطات دبیرخانه شورای عالی اطلاعرسانی، زبان فارسی در حوزه ادبیات مقامی چندان رفیع دارد که کمتر زبانی از نظر ارزشهای هنر و معنی با آن برابری میکند، اما در حوزه علوم و فنون باید برای بقا تلاش کند و مسیری دشوار را بپیماید. در حوزه خط و زبان فارسی در محیط رایانهای، دبیرخانه شورای عالی اطلاعرسانی موظف است دسترسی به این زبان را در محیط رایانهای آسانتر سازد و کاربرد و امکانات آن را در این محیط افزایش دهد. با توجه به چنین نگرشی و مسائل مطرح مهم در حوزه خط و زبان فارسی در محیط رایانهای، فراهم آوردن امکان تبدیل متن به گفتار و بهینهسازی آن یکی از اولویتهای مهم محسوب میشود.
تبدیل متن به گفتار، یکی از مهمترین ابزارهای تبدیل اطلاعات موجود از قالب نوشتاری به قالب گفتاری است. این دبیرخانه به عنوان نخستین گام در تلاشی روشمند برای دستیابی به این ابزار، با دعوت از جمعی از متخصصان و دستاندرکاران، کارگروهی را تشکیل داد تا با گردآوری منابع موجود، مباحث مرتبط با این حوزه را از دیدگاههای مختلف فنی، اجتماعی، فرهنگی، کاربردی و مدیریتی، مورد بررسی و تجزیه و تحلیل قرار دهد؛ پژوهشنامه حاضر نتیجه این مراحل است.
تبدیل متن به گفتار با دو قالب اساسی زبان یعنی قالب نوشتاری و قالب گفتاری آن در ارتباط است. در قالب نوشتاری با پیچیدگیهای فراوان در انواع تحلیلهای صرفی، نحوی، معنایی به منظور استخراج انواع اطلاعات مورد نیاز از متن ورودی روبرو هستیم. بسیاری از این تحلیلها در کاربردهای دیگری چون ترجمه ماشینی، خلاصهسازی و طبقهبندی متون، سامانههای پرسش و پاسخ، بازیابی اطلاعات، جستجو در پایگاههای داده متنی و مانند آن نیز مورد نیاز است. علاوه بر این در تبدیل متن به گفتار با قالب گفتاری زبان نیز سروکار داریم و بنابراین با هدف دستیابی به گفتاری نزدیک به گفتار طبیعی، با مشکلات عدیدهای در تولید تلفظ و نوای مناسب برای گفتار بازسازی شده روبرو هستیم. این مشکلات همواره مورد توجه محققان در سراسر دنیا قرار داشته است و مقالات فراوانی همه ساله در بسیاری از نشستهای علمی معتبر ارائه میشود. با وجود پژوهشهای فراوان و سرمایهگذاریهای بسیار در این زمینه، پیچیدگی ذاتی مسائل در این حوزه و گستردگی علوم و فناوریهای مرتبط با آن سبب شده است که راه زیادی تا تولید محصولات ایدهآل تبدیل متن به گفتار باقی باشد.
آنچه در این پژوهشنامه بدان پرداخته شده است شامل ارائه تعریف تبدیل متن به گفتار، کاربرد و کاربران عمده آن، اهمیت، آثار و فوائد علمی، اجتماعی، فرهنگی و اقتصادی حاصل از بهکارگیری آن، تاریخچه، ویژگیها و قابلیتهای یک سامانه تبدیل متن به گفتار، مباحث علمی پایه مورد استفاده در تبدیل متن به گفتار، زیرسیستمها و اجزای یک سامانه تبدیل متن به گفتار و پیشرفتهای به دست آمده در ساخت هر یک از این اجزاء در زبان فارسی و سایر زبانها و نیز استانداردها و روشهای ارزیابی و محکزنی سامانههای تبدیل متن به گفتار، شناسایی منابع علمی، سازمانها، مراکز، مؤسسهها و پروژههای مرتبط با تبدیل متن به گفتار، ظرفیتهای موجود و فعالان در جهان و ایران، مشکلات موجود برای فعالیت فعالان در ایران، نهادهای حمایتکننده و نقش هر کدام در پیشبرد تبدیل متن به گفتار، چشمانداز و راهبردهای نیل به مقصود، ارائه شده است.
امید است که مطالب این پژوهشنامه بتواند راهگشای علاقهمندان، دانشجویان و فعالان مبحث تبدیل متن به گفتار و نیز علاقهمندان به زمینههایی چون پردازش و بازشناسی گفتار، ترجمه ماشینی، غلطیابی، بازیابی اطلاعات، سامانههای جستجو در وب و پایگاههای داده متنی، خلاصهسازی و طبقهبندی متون و مانند آن قرار گیرد و مسئولان را نسبت به ضرورت توجه به این زمینهها و بذل توجه و ارائه حمایتهای مادی و معنوی از آنها ترغیب نماید.
همچنین لازم به ذکر است که این پژوهشنامه میتواند به عنوان مرجع مناسبی برای دروس دانشگاهی اعم از تبدیل متن به گفتار، پردازش سیگنال صحبت (گفتار پردازی رقمی)، بازشناسی گفتار، پردازش زبان طبیعی، زبانشناسی رایانهای و مانند آن مورد استفاده دانشجویان تحصیلات تکمیلی در رشتههای مهندسی کامپیوتر، مهندسی برق، مهندسی پزشکی، فیزیک، زبانشناسی و مانند آن قرار گیرد.
گفتنی است پیش از این، پژوهشنامه نویسهخوان نوری (OCR) در قالب نسخه چاپی و الکترونیکی و همچنین پژوهشنامه بازشناسی خودکار گفتار (ASR) و پژوهشنامه فونت در قالب نسخه الکترونیکی توسط این دبیرخانه و از طریق وبگاه SCICT.IR منتشر شده بود.