مجری پروژه «طراحی و ایجاد بستر جمعآوری و تحلیل ترافیکی دادهها در سطح وب و شبکههای اجتماعی» از ایجاد بستر تحقیق و توسعه برای تحلیل وب و شبکه های اجتماعی خبر داد.
لیلا ربیعی در خصوص پروژه «طراحی و ایجاد بستر جمعآوری و تحلیل ترافیکی دادهها در سطح وب و شبکههای اجتماعی» اظهار کرد: مطالعات اولیه این پروژه از نیمه دوم سال ۹۵، در حین انجام پروژه «تحلیل نیازمندیها، طراحی و پیادهسازی سامانه بومی رتبهبندی و پایش وب سایتها» توسط گروه مدیریت یکپارچه شبکه، آغاز شده است.
وی ادامه داد: پروژه طراحی و پیادهسازی سامانه بومی رتبهبندی و پایش وبسایتها، به منظور ایجاد سامانه بومی بر بستر دادههای حجیم جهت رتبه بندی سایتها و دامنههای وب مبتنی بر دادههای بازدید کاربران ایرانی جمع آوری شده از منابع مختلف، انجام شد. ربیعی ضمن بیان اینکه یکی از نیازمندیهای اساسی و اصلی شناخته شده در حین انجام این پروژه، تحلیل آمارها و محتوای سایت ها و دامنههای پربازدید بود، خاطرنشان کرد: با توجه به رشد روزافزون استفاده از پیامرسانها و شبکههای اجتماعی، تحلیل دادههای حجیم موجود در آنها، به یک فناوری تحولآفرین مبدل شده است.
وی افزود: بر این اساس پروژه «طراحی و ایجاد بستر جمعآوری و تحلیل دادهها در سطح وب و شبکههای اجتماعی» تعریف شد.
این پژوهشگر تاکید کرد: در حال حاضر، تحلیل در علوم داده و شبکه با استفاده از فناوریهای یادگیری ماشین و هوش مصنوعی در ردههای نخست تحقیقات در دنیا، قرار داشته و مورد اقبال فراوان بوده و بسیاری از کسب و کارها نیز بر این اساس در حال رشد و شکلگیری است، لذا انجام این پروژه، علاوه بر ایجاد بستر جمعآوری و تحلیل دادهها در سطح وب و شبکههای اجتماعی، موجب ایجاد دانش بومی و تربیت نیروهای انسانی خبره و کارآمد در این حوزه مهم نیز می گردد.
ربیعی گفت: این بستر شامل بخش های جمعآوری و نگهداری دادههای حجیم، تحلیل این دادهها با استفاده کاربردی و بهجا از فناوریهای هوش مصنوعی، یادگیری ماشین به روشهای سنتی و عمیق، استفاده از علم آمار، مهندسی دادهها، کاوش دادهها و در نهایت مصورسازی نتایج تحلیلها، به شیوه پژوهش و توسعه درکنار هم و همگام با هم خواهد بود.
خدمات کاربردی پروژه طراحی و تحلیل داده ها در سطح وب و شبکه های اجتماعی
وی در خصوص چگونگی استفاده از دستاوردهای کاربردی پروژه «طراحی و ایجاد بستر جمعآوری و تحلیل ترافیکی دادهها در سطح وب و شبکههای اجتماعی» گفت: در راستای مأموریتهای پژوهشگاه، این پروژه با رسالت تحقیقات کاربردی تعریف شده است و با توجه به اینکه مدیریت اجرای این پروژه مبتنی بر روش های چابک میباشد، لذا در هر مرحله از چرخه انجام وظایف تعریف شده، پس از اخذ بازخورد از صاحبنظران و ذینفعان، نتایج تحلیلها و تحقیقات صورت گرفته، نهایی شده و به صورت خدمت، در اختیار ذینفعان قرار میگیرد. علاوه بر این، براساس فعالیتهای صورت گرفته در بسترهای مختلف شبکههای اجتماعی و فضای وب، تحلیلهای کسبوکاری، سیاستگذاری و تصمیمسازی برای مدیران مختلف در حوزههای اجتماعی، اقتصادی، سیاسی، مذهبی و …، انجام شده و درابعاد عمیقتر و وسیعتر درحال انجام و پیشرفت است.
وی عنوان کرد: استفاده از پتانسیل بخش خصوصی نیز در راستای غنای فعالیتها و همچنین همافزایی و توانمندسازی بخش خصوصی و دولتی مدنظر بوده است، لذا یکی از فعالیتهای کاربردی دیگری که در این پروژه انجام شده، شناسایی شرکتها، دانشگاهها و مؤسسات فعال در حوزههای جمعآوری و تحلیل داده در فضای وب و شبکه های اجتماعی است.
به گفته ربیعی، بخش فوق طی پیمایشی ۴ ماهه انجام شده و با برخی از شرکت ها در حال همکاری هستیم و تعاملات با برخی دیگر در حال شکلگیری است.
اعلام آمادگی همکاری با دانشگاه ها جهت تعریف پروژه های مقاطع تحصیلات تکمیلی
مجری پروژه مذکور تصریح کرد: در حال حاضر، در بخش جمعآوری و تحلیل دادهها، قابلیت همکاری با دانشجویان در مقاطع کارشناسی ارشد و دکترا در حوزههای علوم اجتماعی، علوم داده و شبکه، هوش مصنوعی، علوم کامپیوتر، مهندسی کامپیوتر و پردازش زبان طبیعی به منظور انجام پایاننامههای مرتبط وجود دارد و هماکنون نیز با هماهنگی اساتید راهنما، تعدادی از دانشجویان دانشگاهها در راستای انجام پایان نامه و انجام فعالیتهای علمی-کاربردی پروژه، در حال بهرهگیری از این خدمت هستند. ربیعی همچنین از آمادگی همکاری با دانشگاهها و اساتید جهت تعریف پروژهای مقاطع تحصیلات تکمیلی در حوزه فعالیت های این پروژه خبر داد.
معیارهای سنجش بستر تحلیل داده ها
این پژوهشگر در پاسخ به این سوال که چه معیارهایی برای سنجش بستر تحلیلها در نظر گرفته شده است؟ گفت: در بخشهای مختلف ایجاد بستر تحلیل دادههای وب و شبکههای اجتماعی، معیارهای مرتبط برای سنجش به تفکیک هر فاز تعریف شده است.
وی افزود: در بخش جمعآوری داده، تعداد موجودیتها، انواع منابع داده قابل پشتیبانی، ظرفیت ذخیرهسازی، ظرفیت پردازشی، متوسط زمان تولید تحلیلهای ساختیافته، زمان لازم برای تولید تحلیلهای سفارشی، قابلیت دسترسی به دادههای تحلیلی، شیوه ارائه نتایج تحلیلها و همچنین دریافت بازخورد از مشتریان تحلیلها بخشی از معیارهای موردنظر هستند.
ربیعی گفت: در این پروژه، با توجه به ماهیت دادهها، فعالیتهای پیشپردازش داده در راستای زنجیره تحلیل دادهها، تحلیلهای توصیفی-آماری و پیشبینی در حال انجام است که بدین منظور همگام با مراحل مهندسی داده، پیشپردازش داده، پردازش زبان طبیعی و تحلیل احساسات انجام میشود. لذا بخشی از شاخصهای سنجش مرتبط با این فعالیتها، پارامترهای سنجش دقت، صحت و ارزیابی الگوریتمها بوده و بخشی دیگر براساس نتایج بررسی صاحبنظران و بازخورد ذینفعان است.
وی در خصوص آخرین وضعیت این پروژه و بازه تعیین شده برای اتمام آن گفت: این پروژه از آذر ۹۷ شروع به فعالیت کرده است. مدت زمان پیشبینی شده برای انجام آن، ۱۸ ماه در نظر گرفته شده که طی ۴ فاز باید این بستر، طراحی و آماده بهرهبرداری شود و تاکنون ۲ فاز آن انجام شده است.