هوش مصنوعی

April 5, 2025
14:42 شنبه، 16ام فروردینماه 1404
کد خبر: 189712

OpenAI محتوای دارای حق چاپ را به خاطر می‌سپرد

منبع: ایسنا

یافته‌های یک پژوهش جدید به این ادعا که شرکت «اوپن‌ای‌آی» حداقل برخی از مدل‌های هوش مصنوعی خود را درباره محتوای دارای حق چاپ آموزش داده است، اعتبار می‌بخشند.

شرکت «اوپن‌ای‌آی»(OpenAI) با برخی از نویسندگان، برنامه‌نویسان و سایر صاحبان حقوق درگیر است که آن را به استفاده بدون مجوز از آثار آنها شامل کتاب‌ها و پایگاه‌های رمز برای توسعه مدل‌های خود متهم می‌کنند. اوپن‌ای‌آی مدت‌ها از استفاده منصفانه خود دفاع کرده است، اما شاکیان این موارد استدلال می‌کنند که در قانون حق چاپ آمریکا هیچ موردی برای استفاده از داده‌های آموزشی وجود ندارد.

به نقل از تک کرانچ، این پژوهش که توسط پژوهشگران «دانشگاه واشنگتن»، «دانشگاه کپنهاگ» و «دانشگاه استنفورد» انجام شده است، روش جدیدی را برای شناسایی داده‌های آموزشی پیشنهاد می‌کند که توسط مدل‌های پشت یک API متعلق به شرکت‌هایی مانند اوپن‌ای‌آی حفظ شده‌اند.

مدل‌های هوش مصنوعی مانند موتورهای پیش‌بینی هستند. مدل‌هایی که روی داده‌های زیادی آموزش دیده‌اند، الگوها را یاد می‌گیرند و به این ترتیب می‌توانند مقاله، عکس و خروجی‌های دیگر را تولید کنند. بیشتر خروجی‌ها کپی کلمه‌به‌کلمه داده‌های آموزشی نیستند، اما به دلیل روش یادگیری مدل‌ها، برخی از موارد ناگزیر کپی می‌شوند. مشخص شده است که مدل‌های تصویری از فیلم‌هایی که روی آنها آموزش دیده‌اند، اسکرین‌شات می‌گیرند. همچنین، در موارد بسیاری مشاهده شده است که مدل‌های زبانی از مقالات خبری سرقت می‌کنند.

پژوهشگران در این پروژه، چندین مدل شرکت اوپن‌ای‌آی از جمله «GPT-4» و «GPT-3.5» را برای یافتن نشانه‌هایی از حفظ کردن با حذف کلمات از کتاب‌های داستانی و مقالات نیویورک تایمز بررسی کردند و از مدل‌ها خواستند تا حدس بزنند کدام کلمات پوشانده شده‌اند. نویسندگان همکار به این نتیجه رسیدند که اگر مدل‌ها به درستی حدس بزنند، احتمالا این متن‌ها را در طول روند آموزش حفظ کرده‌اند.

بر اساس نتایج آزمایش‌ها، GPT-4 نشانه‌هایی را از حفظ کردن بخش‌هایی از کتاب‌های داستانی محبوب، از جمله کتاب‌های الکترونیکی دارای حق چاپ نشان داد. همچنین، نتیجه آزمایش‌ها نشان داد که این مدل هوش مصنوعی، بخش‌هایی را از مقالات نیویورک تایمز – البته با نرخ نسبتا پایین‌تر – حفظ کرده است.

«ابیلاشا راویچاندر»(Abhilasha Ravichander)، دانشجوی دانشگاه واشنگتن و از پژوهشگران این پروژه خاطرنشان کرد که یافته‌ها، مدل‌های دارای داده‌های متضاد را آشکار کردند. راویچاندر گفت: برای داشتن مدل‌های زبانی بزرگ و قابل اعتماد باید مدل‌هایی داشته باشیم که بتوانیم آنها را تحت ارزیابی، ممیزی و بررسی علمی قرار دهیم. هدف پژوهش ما ارائه راهی برای بررسی مدل‌های زبانی بزرگ است، اما نیاز واقعی به شفافیت بیشتر داده‌ها در کل اکوسیستم احساس می‌شود.

اوپن‌ای‌آی مدت‌هاست که از محدودیت‌های کمتر در توسعه مدل‌هایی با استفاده از داده‌های دارای حق چاپ حمایت می‌کند. اگرچه این شرکت قراردادهای خاصی را برای صدور مجوز محتوا دارد و مکانیسم‌هایی را ارائه کرده که به صاحبان اثر امکان می‌دهند محتوای دارای حق چاپ را مشخص کنند، اما چندین بار دولت آمریکا را ترغیب کرده است تا قوانین استفاده منصفانه را درباره رویکردهای آموزشی هوش مصنوعی تدوین کند.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.