ویژگی جدید Cloudflare به بات‌های وب AI آدرس اشتباهی می‌دهد

0
38
ویژگی جدید Cloudflare به بات‌های وب AI آدرس اشتباهی می‌دهد

Cloudflare ویژگی جدیدی دارد – به کاربران رایگان هم دسترسی داده است-  که از هوش مصنوعی برای تولید صفحات تصادفی به منظور فریب بات‌‌‌های وب AI استفاده می‌کند.

به جای مسدود کردن صرف بات‌ها، سیستم جدید Cloudflare آن‌ها را به داخل “هزارتویی” از صفحات واقعی اما بی‌ارتباط هدایت می‌کند، که منابع محاسباتی کراولر‌ها را هدر می‌دهد. این روش تغییر مهمی از استراتژی معمول بلاک و دفاع است که اکثر خدمات حفاظت از وبسایت‌ها استفاده می‌کنند. Cloudflare می‌گوید که مسدود کردن بات‌ها گاهی به نتیجه معکوس می‌انجامد زیرا این عمل به اپراتورهای crawler‌ها هشدار می‌دهد که شناسایی شده‌اند.

Cloudflare می‌نویسد: “زمانی که ما کراولینگ غیرمجاز را شناسایی می‌کنیم، به جای مسدود کردن درخواست، به مجموعه‌ای از صفحات تولید شده توسط هوش مصنوعی لینک می‌دهیم که به اندازه کافی جذاب هستند تا بات‌های وب AI را وادار به پیمایش آن‌ها کند.اما این محتوا که به نظر واقعی می‌رسد، در حقیقت محتوای سایت ما نیست که از آن محافظت می‌کنیم، بنابراین کراولرها زمان و منابع خود را هدر می‌دهد.”

این شرکت می‌گوید که محتوای ارائه شده به بات‌‌ها عمدتاً بی‌ارتباط با سایت‌هایی است که در حال خزیدن هستند، اما به دقت از اطلاعات واقعی علمی مانند اطلاعات بیولوژی، فیزیک یا ریاضیات استخراج یا تولید شده است تا از انتشار اطلاعات غلط جلوگیری کند (با این حال، اثربخشی این روش در جلوگیری از انتشار اطلاعات غلط هنوز ثابت نشده است).

این اساسا یک هانی پات تولید شده توسط هوش مصنوعی است. مشکل استخراج اطلاعات توسط هوش مصنوعی به طور فزاینده‌ای در حال رشد است:

مقیاس کراولر‌های هوش مصنوعی در وب به نظر قابل توجه می‌رسد، بر اساس داده‌های Cloudflare که با گزارش‌های غیررسمی منابع مختلف همخوانی دارد. این شرکت می‌گوید که بات‌های هوش مصنوعی روزانه بیش از 50 میلیارد درخواست به شبکه آن‌ها ارسال می‌کنند، که تقریباً 1 درصد از تمام ترافیک وبی است که آن‌ها پردازش می‌کنند. بسیاری از این کراولرها داده‌های وبسایت‌ها را برای آموزش مدل‌های زبان بزرگ بدون اجازه از صاحبان سایت‌ها جمع‌آوری می‌کنند…

احتمالاً این بات‌ها اکنون باید توانایی‌های خود را در پنهان کردن استخراج داده‌ها و فیلتر کردن محتواهای تولید شده توسط هوش مصنوعی مانند این ارتقا دهند. این به این معنی است که هانی‌ پات‌ها باید بهتر در شناسایی کراولر‌ها و پنهان‌کاری در محتوای جعلی خود عمل کنند. این مسابقه تسلیحاتی احتمالاً به عقب و جلو خواهد رفت و مقدار زیادی انرژی هدر خواهد داد.

منبع: https://blog.cloudflare.com/ai-labyrinth/

مقاله قبلیگزارش Citizen Lab : نگاهی اولیه به عملیات رو به گسترش جاسوس‌افزار پاراگون
مقاله بعدیسه روش برتر سواستفاده از MS Office که هکرها در ۲۰۲۵ از آن‌ها سوءاستفاده می‌کنند – هوشیار باشید!

نظر بدهید

لطفا نظر خود را بنویسید
لطفا نام خود را اینجا وارد کنید

This site uses Akismet to reduce spam. Learn how your comment data is processed.