هوش مصنوعی

March 6, 2025
13:38 پنجشنبه، 16ام اسفندماه 1403
کد خبر: 187412

پاسخ‌های دیپ‌سیک شباهت بالایی به ChatGPT دارند

منبع: دیجیاتو

نتایج تحقیق حاضر می‌تواند پیامدهای مهمی برای حقوق مالکیت فکری، قانون‌گذاری و توسعه هوش مصنوعی در آینده داشته باشد.

بررسی جدیدی نشان می‌دهد ۷۴.۲ درصد متن‌هایی که مدل هوش مصنوعی دیپ‌سیک تولید می‌کند، از نظر سبک نگارش شباهت قابل‌توجهی به خروجی‌های ChatGPT دارند. این یافته‌ها می‌توانند نشانه‌ای از این باشند که DeepSeek در فرایند آموزش خود از خروجی‌های OpenAI استفاده کرده است.

براساس گزارش سایت «Forbes»، این تحقیق را شرکت Copyleaks، فعال در حوزه شناسایی محتوای مبتنی‌بر هوش مصنوعی، انجام داده است. به گفته این شرکت، نتایج این تحقیق می‌تواند پیامدهای مهمی برای حقوق مالکیت فکری، قانون‌گذاری و توسعه هوش مصنوعی در آینده داشته باشد.

شباهت سبک نگارش دیپ‌سیک به OpenAI
در این بررسی، Copyleaks از فناوری غربالگری و الگوریتم‌های دسته‌بندی استفاده کرده تا اثر انگشت سبکی (Stylistic Fingerprint) مدل‌های زبانی مختلف، ازجمله OpenAI، کلود، جمینای، LLaMA و DeepSeek را شناسایی کند. این دسته‌بندی با روش رأی‌گیری اجماعی انجام شده تا احتمال خطا به حداقل برسد و دقت افزایش یابد.

نتیجه قابل‌توجه این بود که متن‌هایی که بیشتر مدل‌ها تولید کرده بودند، سبک منحصربه‌فردی داشتند اما بخش چشمگیری از خروجی‌های DeepSeek از نظر سبک، مشابه خروجی‌های OpenAI شناسایی شد.

«شای نیسان»، رئیس بخش علم داده Copyleaks، در گفتگویی ایمیلی توضیح داده این مطالعه را می‌توان شبیه کار یک کارشناس خط‌‌شناسی دانست که تلاش می‌کند نویسنده یک متن دست‌نویس را با مقایسه آن با دست‌خط‌های دیگران شناسایی کند. نتایج این تحقیق، تعجب‌آور و بسیار مهم است.

احتمال نقض حقوق مالکیت فکری OpenAI
نیسان تأکید دارد که این شباهت قطعی‌ترین مدرک برای استفاده مستقیم دیپ‌سیک از خروجی‌های OpenAI نیست، اما سؤالات جدی درباره فرایند آموزش و منابع داده این مدل ایجاد می‌کند.

اگر مشخص شود که DeepSeek بدون مجوز از متون ساخته OpenAI برای آموزش مدل خود استفاده کرده، پیامدهای حقوقی مهمی در نقض مالکیت فکری و تخلف از شرایط خدمات OpenAI خواهد داشت. نبود شفافیت درباره داده‌های آموزشی در صنعت هوش مصنوعی، این چالش را عمیق‌تر و نیاز به چارچوب‌های نظارتی مشخص برای افشای منابع آموزشی را برجسته‌تر می‌کند.

چالش اخلاقی و قانونی
هرچند خود OpenAI نیز بابت استفاده از محتوای وب بدون اجازه صریح با انتقاداتی مواجه بوده، شباهت سبک دیپ‌سیک به ChatGPT ابعاد تازه‌ای به این بحث اضافه می‌کند. در نبود رویه‌های حقوقی مشخص، پیگیری قانونی چنین مواردی دشوار است اما ابزارهایی مانند شناسایی اثر انگشت سبکی می‌توانند نشانه‌ای قدرتمند برای ردیابی و بررسی تخلفات احتمالی باشند.

بااینکه برخی کارشناسان احتمال می‌دهند مدل‌های زبانی به‌دلیل استفاده از داده‌های مشابه به‌تدریج به سبک‌های نزدیک به هم برسند، Copyleaks می‌گوید روش‌ اجماعی آنها مخصوص تشخیص تفاوت‌های سبکی ظریف طراحی شده و این شباهت را نمی‌توان صرفاً ناشی از هم‌پوشانی داده‌ها دانست.

نیسان در پایان تأکید کرده باوجود اشتراک احتمالی در داده‌های آموزشی، معماری مدل، روش‌های تنظیم دقیق (Fine-tuning) و تکنیک‌های تولید محتوا در هر مدل منحصربه‌فرد است. همین موضوع باعث می‌شود اثر انگشت سبکی هر مدل با دیگری متفاوت باشد.

هنوز مشخص نیست DeepSeek واقعاً از خروجی‌های OpenAI بدون مجوز استفاده کرده یا خیر اما این پرسش‌ها قطعاً در آینده نزدیک بخشی جدی بحث‌های توسعه و تنظیمگری هوش مصنوعی خواهند بود. DeepSeek تاکنون به درخواست‌ها ارائه توضیحات پاسخ نداده است.

  • مشترک شوید!

    برای عضویت در خبرنامه روزانه ایستنا؛ نشانی پست الکترونیکی خود را در فرم زیر وارد نمایید. پس از آن به صورت خودکار ایمیلی به نشانی شما ارسال میشود، برای تکمیل عضویت خود و تایید صحت نشانی پست الکترونیک وارد شده، می بایست بر روی لینکی که در این ایمیل برایتان ارسال شده کلیک نمایید. پس از آن پیامی مبنی بر تکمیل عضویت شما در خبرنامه روزانه ایستنا نمایش داده میشود.

    با عضویت در خبرنامه پیامکی آژانس خبری فناوری اطلاعات و ارتباطات (ایستنا) به طور روزانه آخرین اخبار، گزارشها و تحلیل های حوزه فناوری اطلاعات و ارتباطات را در هر لحظه و هر کجا از طریق پیام کوتاه دریافت خواهید کرد. برای عضویت در این خبرنامه، مشترکین سیمکارت های همراه اول لازم است عبارت 150 را به شماره 201464 و مشترکین سیمکارت های ایرانسل عبارت ozv ictn را به شماره ۸۲۸۲ ارسال کنند. دریافت موفق هر بسته خبری که محتوی پیامکی با حجم ۵پیامک بوده و ۴ تا ۶ عنوان خبری را شامل میشود، ۳۵۰ ریال برای مشترک هزینه در بردارد که در صورتحساب ارسالی از سوی اپراتور مربوطه محاسبه و از اعتبار موجود در حساب مشترکین سیمکارت های دائمی کسر میشود. بخشی از این درآمد این سرویس از سوی اپراتور میزبان شما به ایستنا پرداخت میشود. مشترکین در هر لحظه براساس دستورالعمل اعلامی در پایان هر بسته خبری قادر خواهند بود اشتراک خود را در این سرویس لغو کنند. هزینه دریافت هر بسته خبری برای مشترکین صرفا ۳۵۰ ریال خواهد بود و این هزینه برای مشترکین در حال استفاده از خدمات رومینگ بین الملل اپراتورهای همراه اول و ایرانسل هم هزینه اضافه ای در بر نخواهد داشت.