پژوهشگران دانشگاه علم و صنعت ایران با همکاری محققانی از دانشگاه "لون" بلژیک سیستمی برای تحلیل محتوای صوتی و تصویری ارائه کردند که قادر است در میان انبوهی از ویدئوها، ویدئوی مورد نظر را جستجو کند، ضمن آنکه امکان رصد اتوماتیک ویدئو نیز در آن در نظر گرفته شده است.
محمدمهدی ارزانی دانشجوی مقطع دکتری دانشگاه علم و صنعت ایران و از محققان طرح، زمینه تحقیقات این تیم تحقیقاتی را پردازش صوت و تصویر عنوان کرد و گفت: محصولی که ما در این مطالعات عرضه کردیم، دستگاه تحلیل معنایی بینایی است؛ به این معنی که این سیستم هر معنای ویدئویی که به آن داده میشود آن را تحلیل میکند ضمن آنکه هر آنچه را که در ویدئو رخ دهد، آن را آنالیز خواهد کرد.
وی تعیین دستهبندی کلی ویدئو را از دیگر قابلیتهای این سیستم نام برد و اظهار کرد: این سیستم با تحلیل ویدئو قادر است دستهبندی فیلم را در ردههای ورزشی، حیات وحش و سایر دستهها تعیین کند و حتی اتفاقات جدیدی را که در ویدئو رخ داده باشد نیز اعلام میکند.
ارزانی به بیان کاربردهای این سیستم اشاره کرد و یادآور شد: یکی از کاربردهای سیستم «تحلیل معنایی ویدئو» برای حوزههایی چون صدا و سیما و یا سایتهایی مانند آپارات است که آرشیوهای صوتی و تصویری بزرگی را در اختیار دارند.
این محقق اضافه کرد: این حوزهها دارای محتوای زیاد صوتی و تصویری هستند و در صورتی که ویدئوها برچسب مناسبی نخورده باشند، پیدا کردن محتوای مد نظر از میان حجم عظیم ویدئوها و فایلهای صوتی غیر ممکن است.
وی با بیان اینکه موتورهای جستجو تنها بر مبنای جستجوی متن کار میکنند، خاطر نشان کرد: بر این اساس ما سیستم تحلیل معنایی را طراحی و پیادهسازی کردیم و این سیستم محتوای متنی کار جستجو را انجام میدهد.
ارزانی به بیان جزئیات این سیستم پرداخت و توضیح داد: این سیستم پس از دریافت ویدئو، همه مفاهیم را در آن میبیند و در قالب متن ارائه میکند و از این طریق جستجوی ویدئو از طریق متن میسر میشود.
وی پایش محتوا را از دیگر کاربردهای سیستم ذکر کرد و یادآور شد: در حال حاضر شبکههای مجازی و اجتماعی رو به ازدیاد است و موارد ممنوعهای مانند خشونت، مواد مخدر و سایر محتوای غیر اخلاقی دیگر در حال رد و بدل شدن است، از این رو امکان رصد دستی این محتوا وجود ندارد.
این محقق با تاکید بر اینکه این سیستم میتواند به صورت اتوماتیک کار رصد را انجام دهد، گفت: این سیستم با استفاده از یک سرور قوی میتواند کاری که توسط چند نفر انجام گیرد، به تنهایی انجام دهد.
ارزانی همچنین به اجزای این سیستم تحلیل ویدئو اشاره و اظهار کرد: این سیستم شامل یک نرمافزار است که بر روی سختافزار کارت گرافیکی نصب میشود و قادر است حجم زیادی از صوت و تصویر را پردازش کند.
وی با تاکید بر اینکه در حال حاضر 8 هزار مفهوم در آن بارگذاری شده است، اضافه کرد: امکان افزودن دادههای جدید در این سیستم وجود دارد؛ به این صورت که برای کاربران امکانی فراهم شده تا بتوانند مفاهیم جدید را تعریف کنند.
ارزانی با بیان اینکه فناوری این سیستم در اختیار 4 شرکت بزرگ است، گفت: شرکتهای IBM، گوگل و ماکروسافت این سیستم را پیاده سازی کردند و ایران نیز همزمان با این فعالیتها در دنیا وارد این حوزه شده است.
وی در پایان با بیان اینکه از این طرح دو شرکت در ایران و بلژیک تاسیس شد، گفت: این پروژه با همکاری محمدحسن بهاری و علی دیبا از دانشگاه لون (KU Leuven) بلژیک اجرایی شده است.