چگونه میتوان برخی متنها در نوشتههای باستان را آن هم با سرعت خواند و رونویسی کرد؟ تا به امروز کامپیوترها در خواندن دستنوشتههای تاریخی و دستخطهای شکسته قدیمی پیشرفت چندانی نداشته؛ اما حالا به کمک هوش مصنوعی، قدمهای موفقیتآمیزی در این راه برداشته شده است.
در بایگانی تیرول، ایالتی در اتریش سندهای زیادی از قرن یازدهم تا به امروز نگهداری میشود. بیشتر آنها سندهای دولتی و قانونی و همچنین کتابهای دستنوشتههای مهم از دورانهای گذشته هستند. رونوشتسازی این کتابها کار سادهای نیست. اما این مرکز بایگانی در پروژهای اروپایی با کمک دانشمندان جهت اتوماسیون رونوشتسازی به وسیله فناوریهای کامپیوتر همکاری میکند.
کریستوفر هچر، مسئول اداره بایگانی دولتی ایالت تیرول می گوید: «در نمونههای خط شکسته، تکنیکهای جدید هم با مشکل روبرو میشوند. اما با خوشنویسی خط خوب، سیستم جدید موفقیتهای خوبی داشته و به ما کمک بسیاری کرده است.»
دانشمندان در پروژهای اروپایی با نام «READ» جهت رونویسی و خواندن متونی مانند کتابها، نمونههایی تهیه کردند که در سیستمهایی مانند اپلکیشین گوشی همراه قابل استفاده باشد. این برنامه میتواند با ورق زدن، نوشتهها را تشخیص داده و از آنها بلافاصله عکسبرداری کند.
پروژه «READ» مخفف «Recognition and Enrichment of Archival Documents» به معنای تشخیص و غنیسازی اسناد بایگانی، پروژه ای است که با حمایت مالی اتحادیه اروپا اجرا شده و شامل تحقیقات، تهیه و ساخت شبکه برای خواندن اسناد بایگانی باستانی میشود.
فناوری هوض مصنوعی گسترش یافته در این پروژه برای تشخیص الگوی در خواندن دستخطها، تحلیل سندهای تصویری بینایی ماشین (پردازش و آنالیز و درک محتوای عکسها توسط کامپیوتر) و پردازش زبانهای طبیعی (Natural language processing) است.
همه اطلاعات جمعآوری در این پروژه در مرکز داده ای با نام ترانسکریبوس «Transkribus» جمعآوری و تحلیل میشود و به عنوان منبع برای تشخیص متون دیگر از آنها استفاده خواهد شد.
گانتر مولبرگر، هماهنگ کننده پروژه READ از دانشگاه اینسبروک اتریش میگوید: «این ترکیبی از فناوری سطح پائین (پست) و فناوری پیشرفته است. این وسیله یا چادر بسیار ساده فناوری پست است اما با یک اپلیکیشن فناوری پیشرفته که بر روی گوشیهای هوشمند نسب شده کار میکند. این اپلیکیشن که به یک پلتفرم بزرگ رونوشتسازی متصل است، عکسها را به سرور ترانسکریبوس ارسال میکند که میتواند متون دستی را تشخیص داده و رونویسی کند.»
سرور ترانسکریبوس متونی را سادهسازی و پیاده میکند که در حالت عادی خواندن و بازنویسی آنها سالها به طول می انجامد. دکتر ماریو کلارر از این فناوری برای خواندن«کتاب قهرمانان» که یک دستنویس ۵۰۰ صفحهای است استفاده میکند. این کتاب یکی از مهمترین متون گلچینهای ادبی قرون وسطایی آلمان است که در قرن یازدهم جمعآوری شده است.
ماریو کلارر، استاد ادبیات و فرهنگ تاریخی دانشگاه اینسبروک می گوید: «مزیت بزرگ این سیستم این است که به روشی ساده میان تصویر متون و نمونه دستنوشته آن ارتباط برقرار میکند. بنابراین (پلتفرم) رونویسکننده می تواند به سرعت یک تصویر کامل از متن داشته باشد. این موضوع اشتباهات را به حداقل میرساند. کاری که هیچ سیستم دیگری قادر به انجام آن نیست.»
سرور دانشگاه اینبسروک ازیادگیری ماشین و داده کاوی در هوش مصنوعی برای آموزش یه کامپیوتر جهت خواندن متون و تشخیص سبکهای نوشتاری استفاده میکند. بعد از آنکه کاربر، بخشی از متن را به صورت دستوشته رونویس می کند، موتور نرمافزار یاد میگیرد که چگونه حروف را بشناسد و رونویس را، آن هم به دقتی قابل توجه به صورت خودکار کامل کند.
گانتر مولبرگر، هماهنگ کننده پروژه READ از دانشگاه اینسبروگ اتریش می گوید: «من تصویر را به همراه بخشی از متن به کامپیوتر میدهم و بر اساس آن کامپیوتر میتواند این خط و فونتهای مشابه آن را یاد بگیرد.»
این سیستم میتواند متون دستنویس را از زبانهای مختلف رونویسی کند. زیرا دانشمندان، دانشپژوهان، متخصصان بایگانی و داوطلبان بسیاری از کشورهای مختلف در این پروژه همکاری کرده اند.
شما میتوانید برای آشنایی بیشتر با ترانسکریبوس، پلتفرم جامع شناسایی خودکار نوشتههای دستی و اسناد تاریخی به وبسایت پروژه READ مراجعه میکنید.