۳۰ پروژه به پردازش زبان فارسی در فضای مجازی اختصاص یافت
رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران گفت: ۳۰ پروژه به پردازش زبان فارسی در فضای مجازی اختصاص یافت.
علیرضا یاری از آزادسازی خروجی دادگان و ابزارهای پردازش خط و زبان فارسی در فضای مجازی خبر داد و گفت: رشد فناوری اطلاعات و گسترش اینترنت، مرزهای تاثیرگذاری خط و زبان را از مرزهای جغرافیایی فراتر برده و پردازش زبان به عنوان یک نیاز ملی/ بین المللی جهت استفاده بهینه از منابع اطلاعاتی مطرح شده است.
رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران با بیان اینکه کاربردهای مبتنی بر پردازش زبان طبیعی مانند ترجمه ماشینی و جویشگرها اهمیت زیادی پیدا کرده و کشورهای مختلف سرمایه گذاری زیادی در این حوزه داشته اند، از اهمیت ارائه زیرساختهای پردازش خط و زبان فارسی برای نیل به اهداف کلان در فضای مجازی به عنوان دلیل اصلی سرمایه گذاری در این حوزه نام برد.
وی با تشریح برنامه پیشنهادی برای توسعه خط و زبان فارسی، محورهای توسعه خط و زبان را در سه مقوله دادگان و محتوا، ابزارها و کاربردها عنوان کرد و گفت : پژوهشگاه ارتباطات و فناوری اطلاعات (مرکز تحقیقات مخابرات) از چندین سال قبل تاکنون فعالیتهای متعددی را در قالب ۳۰ پروژه درونسپاری و برونسپاری شامل ۱۲ پروژه توسط شرکتهای دانش بنیان، ۱۳ پروژه توسط دانشگاهها و ۵ پروژه توسط پژوهشگاه ارتباطات و فناوری اطلاعات در این خصوص آغاز کرده است.
یاری با بیان اینکه برخی از این پروژه ها خاتمه یافته و برخی نیاز به توسعه بیشتری دارند، اضافه کرد: نمونه هایی از دستاوردهای حاصله از این پروژه ها شامل «گراف دانش فارسی» با حدود ۵۰۰ هزار موجودیت، «وردنت عمومی زبان فارسی» با عنوان «فارسنت» شامل ۱۰۰هزار واژه عمومی زبان فارسی و نیز «شبکه تصویری تصویرنت» با حدود ۳۳هزار واژه و ۸ میلیون تصویر و ابزارهای خطایاب املایی و گرامری و نیز ابزارهای پایه پردازش زبان فارسی مانند ابزار تشخیص موجودیت ناممند و مرجعگزینی می شوند.
وی با تاکید بر آزادسازی کلیه دستاوردهای حاصله افزود: در راستای توسعه خدمات وب بومی فعالیتهای متعددی در حوزه توسعه جویشگرهای متنی، تصویری، خبری، نقشه و مستندات علمی و نیز مترجمهای دوزبانه فارسی/انگلیسی انجام شده است که ابزارها و دادگان خط و زبان فارسی از زیرساختهای ضروری آنهاست .
رئیس پژوهشکده فناوری اطلاعات مرکز تحقیقات مخابرات ایران برنامه آتی این پژوهشکده را توسعه ابزارهای مورد نیاز و بسط حوزه هایی نظیر خدمات مبتنی بر صوت، نویسه خوان نوری دست نوشته فارسی و همچنین ابزارهای معنایی خط و زبان فارسی و تاثیر آنها در بهبود کیفیت خدمات و کاربردهای بومی عنوان کرد.