مدیر ارشد مایکروسافت: میتوان از محتوای وب آزادانه برای آموزش هوش مصنوعی بهره برد
یکی از بزرگترین بحثهای دنیای هوش مصنوعی مولد احتمال استفاده شرکتهای آموزشدهنده این مدلها از دادههای تحت کپیرایت در وب است. تاکنون نیز این مسئله منجر به شکایتهای متعددی علیه شرکتهای هوش مصنوعی مولد، ازجمله مایکروسافت و OpenAI شده است. اکنون «مصطفی سلیمان»، مدیر ارشد هوش مصنوعی مایکروسافت، آشکارا میگوید هرکسی میتواند از این دادهها بهره ببرد.
مصطفی سلیمان بهتازگی با «اندرو راس سورکین» از CNBC مصاحبه کرده و در این مصاحبه به یکی از پرحاشیهترین بحثهای آموزش هوش مصنوعی مولد پرداخته است. در قسمتی از این مصاحبه، مصطفی سلیمان درباره استفاده آزادانه از دادههای موجود در وب میگوید:
«قرارداد اجتماعی محتواها از دهه 90 این بوده است که میتوان از محتوایی که در وب باز وجود دارد، استفاده منصفانه کرد. هرکسی میتواند آن را کپی، بازسازی یا بازتولید کند. این [محتوا] رایگانافزار (Freeware) است.»
این مصاحبه در جریان جشنواره Aspen Ideas انجام شد.
نظرات مصطفی سلیمان درباره آموزش هوش مصنوعی
مصطفی سلیمان همچنین درباره محتواهایی که ناشر اجازه استفاده از آنها را نداده، صحبت کرد. او میگوید علاوهبر محتواهای باز موجود در وب، دستهبندی جداگانهای نیز وجود دارد که وبسایت، ناشر یا سازمان خبری بهصراحت گفته به هر دلیلی از ایندکسکردن و استخراج مطالب خودداری شود. از نظر مصطفی سلیمان این دستهبندی خاکستری است و احتمالاً استفاده از آن میتواند به شکایت منتهی شود.
به نظر میرسد پاسخ سلیمان نشان میدهد مایکروسافت و شاید دیگر شرکتهای مولد هوش مصنوعی معتقدند تقریباً از همهچیز در اینترنت میتوان برای آموزش مدلها استفاده کرد و این شرکتها مجبور نیستند به سازندگان آن محتوا پولی بدهند. احتمالاً این مشاجره باعث میشود در ماهها و سالهای آینده مسائل حقوقی بیشتری مطرح شود.
طبق گزارش هفته گذشته، استارتاپ TollBit میگوید ظاهراً چند شرکت هوش مصنوعی پروتکل امنیتی سایتها را که برای جلوگیری از استخراج مطالب آنها استفاده میشود، نادیده میگیرند. به نظر میرسد دو شرکت بزرگ OpenAI و Anthropic نیز این پروتکلها را دور میزنند.