هوش مصنوعی

December 7, 2024
10:20 شنبه، 17ام آذرماه 1403
کد خبر: 179182

نسخه جدید ChatGPT بسیار ماهرانه کاربران را فریب می‌دهد

منبع: دیجیاتو

ظاهراً نسخه جدید ChatGPT در موارد بیشتری اقدام به دستکاری داده‌ها و ارائه پاسخ‌های غلط برای جلب رضایت کاربران می‌کند.

اخیراً نسخه کامل مدل o1 هوش مصنوعی ChatGPT در دسترس کاربران قرار گرفته است که هوشمندتر از نمونه‌های پیشین عمل می‌کند؛ اما کارشناسان ادعا دارند که این مدل در فریب دادن کاربران هم باهوش‌تر از قبل شده‌است.

شرکت OpenAI به‌تازگی اقدام به انتشار عمومی نسخه o1 چت‌بات خود کرده است که در مقایسه با نسخه GPT-4o از توانایی‌های پردازشی پیشرفته‌تر برخوردار است و طبق ادعای سازنده، می‌تواند درباره سؤالات مطرح شده از سوی کاربر فکر کند. البته طبق گزارشی که پس از بررسی نسخه مذکور منتشر شده‌است، قدرت بیشتر باعث شده تا هوش مصنوعی بتواند عملکرد بهتری در فریب دادن کاربران از خود نشان دهد؛ موضوعی که می‌تواند نگرانی‌های جدی پیرامون ایمنی استفاده از چنین سرویس‌هایی را به‌دنبال داشته‌باشد.

کارشناسان OpenAI و مؤسسه مستقل امنیت سایبری «آپولو ریسرچ» در مقاله‌های خود، اشاره داشته‌اند که اگرچه توانایی استدلال مدل تازه منتشر شده، هیجان‌انگیز است، اما می‌تواند زمینه را برای کاربردهای خطرناک فراهم سازد. براساس داده‌های تست‌ها، مدل o1 در چندین مورد اقدام به فریب دادن کاربران کرده است؛ به‌طوری که هدف کاربر از برقراری ارتباط را نادیده گرفته و به‌دنبال دستیابی به هدف خود رفته‌است. با وجود اینکه چنین رفتاری مختص به ChatGPT نیست و در نمونه‌های رقیب مثل جمینای، آنتروپیک و چت‌بات متا هم دیده‌می‌شود، اما بیشترین پتانسیل فریب‌کاری مربوط به مدل o1 بوده است.

آیا ChatGPT برای کاربران خطرساز است؟
کارشناسان مؤسسه آپولو ریسرچ اعتقاد دارند که توانایی فریب دادن کاربران فعلاً نمی‌تواند موجب پیامد ناخوشایندی شود؛ زیرا چت‌بات‌های هوش مصنوعی فاقد عاملیت مستقل هستند. البته هدف اصلی از تست‌های این گروه، بررسی ریسک‌های استفاده از چت‌بات نبوده؛ اما با توجه به دانش و مهارت آنها، ارزیابی صورت گرفته قابل قبول محسوب‌می‌شود. همچنین اشاره شده که در صورت انتشار مدل‌های دارای عاملیت، باید بررسی مجدد از سوی سازنده انجام بگیرد تا خطرات احتمالی، خنثی شود. OpenAI در نظر دارد تا در سال ۲۰۲۵ اقدام به انتشار چنین مدلی کند.

براساس داده‌ها، هوش مصنوعی در ۱۹ درصد از مواردی که هدف متفاوت با کاربر را دنبال می‌کرده، مسیر دست‌کاری داده‌ها را در پیش گرفته است. همچنین در ۵ درصد از تست‌ها، هوش مصنوعی اقدام به غیرفعال‌سازی مکانیسم‌هایی کرده است که برای تطابق هدف کاربر با هدف سرویس، توسعه‌یافته‌اند. عجیب‌تر آن است که چت‌بات تقریباً در پاسخ به‌تمامی سؤالات پیرامون انگیزه از دستکاری داده‌ها، بهانه‌های دروغین را مطرح کرده و انجام پردازشی خلاف خواسته کاربر را کتمان کرده است.

OpenAI ادعا دارد که ارائه اطلاعات اشتباه از سوی نسخه جدید چت‌بات این شرکت، به‌دلیل تلاش آن برای تأمین رضایت کاربر از طریق موافقت بیش از حد با گفته‌های وی است. همچنین احتمال دارد که این پدیده در ارتباط با فرایند تمرین مدل‌ها باشد؛ زیرا هنگام عملکرد صحیح و ارائه پاسخ درست با پاداش مواجه می‌شوند و سعی دارند چنین رفتاری را تقلید نمایند. طبق بررسی‌های داخلی سازنده، ۰.۱۷ درصد از پاسخ‌های نسخه o1 فریب‌کارانه بوده و نسبت به مدل GPT-4o افزایش ۲۰ درصدی را شاهد بوده است. این شرکت وعده داده است که مکانیسم‌های ایمنی بهتری را در آینده برای نظارت بر پاسخ‌ها، ارائه کند.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.