اینترنت و شبکه

فناوری اطلاعات

November 11, 2018
14:48 یکشنبه، 20ام آبانماه 1397
کد خبر: 95509

ترانسکریبوس؛ بکارگیری هوش مصنوعی در خواندن دست‌نوشته‌های باستانی

چگونه می‌توان برخی متن‌ها در نوشته‌های باستان را آن هم با سرعت خواند و رونویسی کرد؟ تا به امروز کامپیوترها در خواندن دست‌نوشته‌های تاریخی و دست‌خط‌های شکسته قدیمی پیشرفت چندانی نداشته؛ اما حالا به کمک هوش مصنوعی، قدم‌های موفقیت‌آمیزی در این راه برداشته شده است.
 
در بایگانی تیرول، ایالتی در اتریش سندهای زیادی از قرن یازدهم تا به امروز نگهداری می‌شود. بیشتر آنها سندهای دولتی و قانونی و همچنین کتاب‌های دست‌نوشته‌های مهم از دوران‌های گذشته هستند. رونوشت‌سازی این کتاب‌ها کار ساده‌ای نیست. اما این مرکز بایگانی در پروژه‌ای اروپایی با کمک دانشمندان جهت اتوماسیون رونوشت‌سازی به وسیله فناوری‌های کامپیوتر همکاری می‌کند.
 
کریستوفر هچر، مسئول اداره بایگانی دولتی ایالت تیرول می گوید: «در نمونه‌های خط شکسته، تکنیک‌های جدید هم با مشکل روبرو می‌شوند. اما با خوشنویسی خط خوب، سیستم جدید موفقیت‌های خوبی داشته و به ما کمک بسیاری کرده است.»
 
دانشمندان در پروژه‌ای اروپایی با نام «READ» جهت رونویسی و خواندن متونی مانند کتاب‌ها، نمونه‌هایی تهیه کردند که در سیستم‌هایی مانند اپلکیشین گوشی همراه قابل استفاده باشد. این برنامه می‌تواند با ورق زدن، نوشته‌ها را تشخیص داده و از آنها بلافاصله عکسبرداری کند.
 
پروژه «READ» مخفف «Recognition and Enrichment of Archival Documents» به معنای تشخیص و غنی‌سازی اسناد بایگانی، پروژه ای است که با حمایت مالی اتحادیه اروپا اجرا شده و شامل تحقیقات، تهیه و ساخت شبکه برای خواندن اسناد بایگانی باستانی می‌شود.
 
فناوری هوض مصنوعی گسترش یافته در این پروژه برای تشخیص الگوی در خواندن دست‌خط‌ها، تحلیل سندهای تصویری بینایی ماشین (پردازش و آنالیز و درک محتوای عکس‌ها توسط کامپیوتر) و پردازش زبان‌های طبیعی (Natural language processing) است.
 
همه اطلاعات جمع‌آوری در این پروژه در مرکز داده ای با نام ترانسکریبوس «Transkribus» جمع‌آوری و تحلیل می‌شود و به عنوان منبع برای تشخیص متون دیگر از آن‌ها استفاده خواهد شد.
 
گانتر مولبرگر، هماهنگ کننده پروژه READ از دانشگاه اینسبروک اتریش می‌گوید: «این ترکیبی از فناوری سطح پائین (پست) و فناوری پیشرفته است. این وسیله یا چادر بسیار ساده فناوری پست است اما با یک اپلیکیشن فناوری پیشرفته که بر روی گوشی‌های هوشمند نسب شده کار می‌کند. این اپلیکیشن که به یک پلت‌فرم بزرگ رونوشت‌سازی متصل است، عکس‌ها را به سرور ترانسکریبوس ارسال می‌کند که می‌تواند متون دستی را تشخیص داده و رونویسی کند.»
 
سرور ترانسکریبوس متونی را ساده‌سازی و پیاده می‌کند که در حالت عادی خواندن و بازنویسی آنها سالها به طول می انجامد. دکتر ماریو کلارر از این فناوری برای خواندن«کتاب قهرمانان» که یک دستنویس ۵۰۰ صفحه‌ای است استفاده می‌کند. این کتاب یکی از مهمترین متون گلچین‌های ادبی قرون وسطایی آلمان است که در قرن یازدهم جمع‌آوری شده است.
 
ماریو کلارر، استاد ادبیات و فرهنگ تاریخی دانشگاه اینسبروک می گوید: «مزیت بزرگ این سیستم این است که به روشی ساده‌ میان تصویر متون و نمونه دست‌نوشته آن ارتباط برقرار می‌کند. بنابراین (پلت‌فرم) رونویس‌کننده می تواند به سرعت یک تصویر کامل از متن داشته باشد. این موضوع اشتباهات را به حداقل می‌رساند. کاری که هیچ سیستم دیگری قادر به انجام آن نیست.»
 
سرور دانشگاه اینبسروک ازیادگیری ماشین و داده کاوی در هوش مصنوعی برای آموزش یه کامپیوتر جهت خواندن متون و تشخیص سبک‌های نوشتاری استفاده می‌کند. بعد از آنکه کاربر، بخشی از متن را به صورت دستوشته رونویس می کند، موتور نرم‌افزار یاد می‌گیرد که چگونه حروف را بشناسد و رونویس را، آن هم به دقتی قابل توجه به صورت خودکار کامل کند.
 
گانتر مولبرگر، هماهنگ کننده پروژه READ از دانشگاه اینسبروگ اتریش می گوید: «من تصویر را به همراه بخشی از متن به کامپیوتر می‌دهم و بر اساس آن کامپیوتر می‌تواند این خط و فونت‌های مشابه آن را یاد بگیرد.»
 
این سیستم می‌تواند متون دستنویس را از زبان‌های مختلف رونویسی کند. زیرا دانشمندان، دانش‌پژوهان، متخصصان بایگانی و داوطلبان بسیاری از کشور‌های مختلف در این پروژه همکاری کرده اند.
 
شما می‌توانید برای آشنایی بیشتر با ترانسکریبوس، پلت‌فرم جامع شناسایی خودکار نوشته‌های دستی و اسناد تاریخی به وب‌سایت پروژه READ مراجعه می‌کنید.
  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.