جلوگیری از کسب داده‌ها برای آموزش هوش مصنوعی

Cloudflare ابزار رایگان جدیدی منتشر کرده که از وب اسکرپینگ یا جمع‌آوری اطلاعات وب‌سایت‌ها توسط شرکت‌های سازنده هوش مصنوعی برای آموزش مدل‌های زبانی بزرگ خود جلوگیری می‌کند. این ابزار در دسترس تمام مشتریان کلودفلر (از جمله افراد دارای طرح‌های رایگان) قرار گرفته است.

تیم کلودفلر در پست وبلاگ مربوط به این خبر همچنین داده‌هایی را درباره نحوه واکنش مشتریان خود نسبت به رشد ربات‌هایی که برای آموزش مدل‌های هوش مصنوعی داده‌ها را استخراج می‌کنند، به اشتراک گذاشته است. طبق این داده‌ها، ۸۵.۲ درصد از مشتریان Cloudflare از دسترسی این ربات‌ها به سایت‌های خود جلوگیری می‌کنند.

فعال‌ترین بات‌ها به‌گفته کلودفلر

Cloudflare همچنین درباره فعال‌ترین ربات‌های سال گذشته اطلاعاتی ارائه کرده است. ربات Bytespider متعلق به شرکت چینی بایت‌دنس (مالک تیک‌تاک) سعی کرده تا در سال گذشته به ۴۰ درصد از وب‌سایت‌های تحت‌نظر کلودفلر دسترسی پیدا کند. این میزان برای GPTBot متعلق به OpenAI به‌اندازه ۳۵ درصد گزارش شده است.

لیست چهار ربات برتری که برای آموزش مدل‌های هوش مصنوعی در سال گذشته تلاش کرده‌اند به اطلاعات وب‌سایت مشتریان کلودفلر دسترسی پیدا کنند، با Amazonbot و ClaudeBot تکمیل می‌شود.

این شرکت در بیانیه خود می‌گوید:

«از این موضوع می‌ترسیم که برخی از شرکت‌های هوش مصنوعی که قصد دور زدن قوانین برای دسترسی به محتواها را دارند، به‌طور مداوم بتوانند از شناسایی‌شدن فرار کنند. ما همچنان به نظارت خود ادامه می‌دهیم و بخش‌های بیشتری را به قانون Scrapers و Crawler‌های هوش مصنوعی اضافه می‌کنیم و مدل‌های یادگیری ماشینی خود را تکامل می‌دهیم تا اینترنت را به مکانی تبدیل کنیم که سازندگان محتوا بتوانند در آن رشد کنند و کنترل کاملی روی مدل‌هایی داشته باشند که از محتوایشان برای آموزش استفاده می‌کنند.»

منبع خبر

نظر و دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *