فناوری اطلاعات

October 18, 2023
16:15 چهارشنبه، 26ام مهرماه 1402
کد خبر: 150705

چت‌بات ChatGPT اکنون قابل‌اعتمادتر است، اما ساده‌تر فریب می‌خورد

تحقیقات مایکروسافت نشان می‌دهد کاربران می‌توانند GPT-4 را برای انتشار نتایج مغرضانه و افشای اطلاعات خصوصی، فریب دهند.
 
 
براساس تحقیقاتی که مایکروسافت انجام داده، مدل زبان بزرگ GPT-4 شرکت OpenAI نسبت‌به GPT-3.5 قابل‌اعتمادتر است اما درمقابل فریب و سوگیری نیز آسیب‌پذیرتر است.
 
مقاله‌ی جدید نشان می‌دهد محققان دانشگاه ایلینویز، دانشگاه استنفورد، دانشگاه کالیفرنیا، دانشگاه برکلی، مرکز ایمنی هوش مصنوعی و مرکز تحقیقات مایکروسافت، GPT-4 را قابل‌اعتمادتر از نسخه‌ی قبلی این مدل می‌دانند. به بیان دیگر، آن‌ها متوجه شدند مدل هوش مصنوعی مذکور در محافظت از اطلاعات خصوصی، اجتناب از ارائه‌ی پاسخ‌های نامرتبط و جانب‌دارانه و همچنین مقاومت دربرابر حملات هکرها، بهتر عمل می‌کند.
 
ازطرف دیگر GPT-4 می‌تواند اقدامات امنیتی را نادیده بگیرد و درنتیجه اطلاعات شخصی و تاریخچه‌ی مکالمات افراد را فاش کند. محققان دریافتند امکان دورزدن لایه‌های محافظتی این مدل هوش مصنوعی وجود دارد زیرا GPT-4 اطلاعات گمراه‌کننده را با دقت بیشتری دنبال می‌کند.
 
تیم تحقیقاتی اعلام کرده آسیب‌پذیری‌های مختلف در محصولات مبتنی‌بر GPT-4 ازجمله خدمات و نرم‌افزارهای مایکروسافت و ChatGPT شناسایی نشده‌اند.
 
محققان برای سنجش قابلیت اعتماد GPT-4، نتایج تحقیقات خود را به چند بخش ازجمله پاسخ‌های غیرمرتبط، کلیشه‌ها، حریم خصوصی، اخلاق ماشینی، انصاف و قدرت در مقاومت دربرابر حمله‌های خصمانه، تقسیم کردند.
 
محققان در آزمایش خود ابتدا GPT 3.5 و GPT-4 را با استفاده از روش‌های استانداردی بررسی کردند که شامل استفاده از کلمات ممنوعه بود. در مرحله‌ی بعد از دستورالعمل‌های طراحی‌شده برای اعمال فشار به مدل و شکستن محدودیت‌های خط‌مشی محتوای آن استفاده شد. تیم تحقیقاتی درنهایت تلاش‌هایی برای فریب مدل انجام دادند تا مشخص شود آیا چارچوب محافظتی آن حفظ می‌شود یا خیر.
 
محققان می‌گویند:
 
هدف ما تشویق جامعه‌ی تحقیقاتی است تا از آزمایش‌های ما بهره ببرند و کارهای جدیدی براساس آن انجام دهند؛ زیرا این‌کار به‌طور بالقوه از اقدامات شرورانه که از آسیب‌پذیری‌ها سؤاستفاده می‌کنند، جلوگیری خواهد کرد. ارزیابی قابلیت اعتماد مدل‌های هوش مصنوعی، فقط نقطه‌ی شروع است و امیدواریم با همکاری دیگران در یافته‌های خود به ایجاد مدل‌های قدرتمندتر و قابل‌اعتمادتر در آینده کمک کنیم.
تیم تحقیقاتی، معیارهای خود را برای آزمایش قابلیت اطمینان مدل‌های هوش مصنوعی منتشر کرد تا دیگران بتوانند از یافته‌های آن‌ها در تحقیقات آینده استفاده کنند.
 
توسعه‌دهندگان معمولاً چندین درخواست مختلف را به مدل‌های هوش مصنوعی مثل GPT-4 ارائه می‌دهند تا مشخص شود آیا نتایج ناخواسته ازطرف این مدل‌ها ارائه می‌شود یا خیر. البته سم آلتمن پس‌از معرفی GPT-4 اعلام کرد این مدل هوش مصنوعی همچنان نقص‌هایی دارد.
 
کمیسون تجارت فدرال (FTC) پس‌از معرفی GPT-4، تحقیقات درمورد OpenAI را با هدف کشف آسیب‌های احتمالی مثل انتشار اطلاعات نادرست که می‌تواند مصرف‌کنندگان را درمعرض خطر قرار دهد، آغاز کرده است.
  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.