هوش مصنوعی

August 6, 2025

12:35 چهارشنبه، 15ام مردادماه 1404

کد خبر: 198812

کلودفلر: خزنده‌های مخفی Perplexity قوانین وب را دور می‌زنند

منبع: پیوست

شرکت کلودفرد، ارائه دهنده سرویس نام‌های دامنه و دیگر خدمات وب، در گزارش افشاگرانه جدیدی به استفاده شرکت هوش مصنوعی Perplexity از خزنده‌های مخفی برای دور زدن محدودیت‌های دسترسی به محتوا اشاره کرده است. طبق اعلام کلودفلر،‌ پلتفرم هوش مصنوعی Perplexity AI از خزش مخفیانه برای دسترسی به محتوای وب‌سایت‌ها استفاده می‌کند و با استفاده از این روش حتی زمانی که با صراحت در فایل‌های robots.txt یا قوانین امنیتی وب (WAF) دسترسی روبات‌ها منع شده است، به خزش ادامه می‌دهد.

کلودفلر در پست وبلاگی خود توضیح می‌دهد که با توجه به رفتار نادرست خزنده‌های شرکت پریپلکسیتی، شرکت ارائه دهنده مرورگر و موتور جستجوی مبتنی بر هوش مصنوعی،‌ این شرکت روبات‌ آنها را از لیست تایید شده حذف کرده و قوانینی را برای جلوگیری از این نوع خزش مخفیانه اعمال کرده است.

طبق اعلام کلودفلر،‌Perplexity ابتدا از خزنده‌هایی با عاملیت کاربری مانند PerplexityBot و Perplexity User استفاده می‌کند. اما زمانی که این خزنده‌ها توسط سایت‌ها یا فایروال‌ها مسدود می‌شوند، این شرکت روش خود را تغییر داده و با استفاده از User-Agentهای عمومی، مانند مرورگر کروم در مک‌اواس، تلاش می‌کند هویت واقعی خود را پنهان کرده و محدودیت‌ها را دور بزند.

به گفته کلاودفلر، در چنین مواردی خزنده مخفی پرپلکسیتی robots.txt را نادیده می‌گیرد و یا حتی آن را بررسی نمی‌کند و از آی‌پی آدرس‌های ناشناخته و خارج از محدوده اعلام‌شده‌اش استفاده می‌کند.

همچنین یکی از روش‌های دیگر برای دور زدن محدودیت‌های اعمال شده از سوی وبسایت، استفاده از سیستم‌های خودکار تشخیص آی‌پی و ASN‌های مختلف برای گریز از شناسایی است.

این اقدامات در تضاد مستقیم با استانداردهای جهانی خزنده‌ها مانند RFC 9309 است که بر شفافیت و احترام به خواسته‌های مدیران وب‌سایت‌ها تاکید دارد.

خزش مخفی پریپلکسیتی چگونه کشف شد؟
شرکت کلودفلر پس از گزارش کاربران در این باره برای راستی‌آزمایی ادعای آنها، اقدام به ساخت چند دامنه آزمایشی تازه کرد همچون testexample.com و secretexample.com کرد، اما با وجود اینکه این دامنه‌ها هیچ‌گونه ثبت در موتورهای جستجو نداشتند و به همراه یک فایل robots.txt با محدودیت کامل و به شکل محرمانه راه‌اندازی شدند، در کمال تعجب، زمانی که سوالاتی درباره این دامنه‌ها از پرپلکسیتی پرسیده شد، این پلتفرم توانست اطلاعات دقیقی از محتوای این وب‌سایت‌ها ارائه دهد، که تنها مسیر دسترسی به این اطلاعات استفاده از روش خزش محرمانه و خزنده غیرمجاز بود.

تفاوت رفتار پرپلکسیتی با خزنده‌های قانون‌مدار
کلودفلر در این گزارش رفتار پرپلکسیتی را با شرکت‌هایی مانند اوپن‌ای‌آی مقایسه کرده است. کلودفلر می‌گوید اوپن‌ای‌آی، مالک بزرگ‌ترین و محبوب‌ترین چت‌بات هوش مصنوعی جهان، رویکرد کاملا شفافی نسبت به خزش دارد:

اوپن‌ای‌آی شناسه خزنده‌هایش را اعلام کرده، از فایل robots.txt پیروی می‌کند و از استانداردهای نوینی مانند Web Bot Auth برای احراز هویت خزنده‌های خود کمک می‌گیرد.
زمانی که در تست مشابه از ChatGPT خواسته شد تا اطلاعاتی درمورد این دامنه‌های محدود شده ارائه کند، این سیستم ابتدا robots.txt را خواند و سپس از دسترسی صرف‌نظر کرد.

راهکار کلودفلر برای جلوگیری از خزش مخفی
کلاودفلرمی‌گوید تمامی خزنده‌های مخفی پرپلکسیتی را از طریق سیستم تشخیص بات شناسایی کرده است و در صورتی که مشتریان از قوانین امنیتی (WAF) استفاده کرده باشند، این خزنده‌ها مسدود می‌شوند.

همچنین یک قانون امنیتی جدید و اختصاصی برای مقابله با خزنده‌های هوش مصنوعی، از جمله نسخه مخفی پرپلکسیتی، به تنظیمات مدیریتی اضافه شده و این قانون حتی برای کاربران رایگان کلاودفلر نیز قابل دسترسی است.

کلاودفلر می‌گوید بیش از ۲.۵ میلیون وب‌سایت تاکنون از ویژگی مسدودسازی خزنده‌های هوش مصنوعی استفاده کرده‌اند. این اقدام بخشی از کمپین «روز استقلال محتوا» است که هدفش بازگرداندن کنترل محتوا به دستان صاحبان وب‌سایت‌هاست.

همچنین کلاودفلر با نهادهای بین‌المللی مانند IETF در تلاش برای تدوین استانداردهای جدید برای تعامل خزنده‌ها با وب‌سایت‌ها است. کلودفلور تاکید دارد که آینده‌ای شفاف، مبتنی بر رفتار مسئولانه بات‌ها و خزنده‌ها، احترام به حریم خصوصی و ترجیحات ناشران خواهد بود.

رفتار مخفیانه پرپلکسیتی در رقابت فشرده هوش مصنوعی نشان می‌دهد که برخی شرکت‌ها احتمالا برای کسب برتری و دسترسی به داده‌های وب به روش‌های غیراخلاقی و مخفیانه متوسل شوند. با این حال در عین رشد روزافزون فناوری هوش مصنوعی، اعتماد، شفافیت و رعایت استانداردها همچنان ارکان اصلی اینترنت اهمیت روز افزون خواهند داشت.

+ /
نویسنده: ملکی /
چاپ /
صفحه اصلی

در این زمینه از آرشیو ایستنا:

مشترک شوید!

برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.