إذا كنت تعاني من التتبع المستمر لأقوالك وأفعالك الرقمية وعرض المنتجات الأقرب إلك والتي تحدثت وبحثت عنها عبر الإنترنت، ففي الأغلب تكون العناكب الرقمية هي الأساس في ذلك.
فالعناكب الرقمية تزحف بين ثنايا المواقع الإلكترونية التي تقرأها أو تدخلها، ويقوم روبوت جوجل بوت بمهمته في جمع معلومات الويب الخاصة بك وتصنيفها وعرضها في نتائج البحث.
ولعل وجود عناكب البحث هو الصفقة الكبرى ضخمت اقتصاد جوجل، وعلى نفس الجانب يقوم الذكاء الاصطناعي بنفس الطريقة حيث يستخدم العناكب للزحف حول ماوقع الويب، ومؤخرًا كانت هذه مهمة روبوت الدردشة GPTbot والذي يقوم بتجميع المعلومات لتدريب نموذج الذكاء الاصطناعي لديه، ومن المرجح أن يتم تدريب النموذج GPT-5 على هذه البيانات التي يجمعها الروبوت.
وهذا ينعكس في سرعة إجابة نماذج الروبوتات على الأسئلة وتوثيق المعلومات بمصادر مما يحفز من عملية مشاركة المعلومات المجانية عبر الإنترنت.
اقرأ أيضًا >> نيورالينك تحصل على استثمار بقيمة 280 مليون دولار لتطوير زراعة الدماغ
ونتيجة لهذا التتبع الذي قابله عالم الإنترنت بالرفض، أعلنت الشركة مؤخرًا عن طريقة لحظر روبوت الدردشة GPTbot باستخدام بروتوكول شائع يُدعى robots.txt وسط تساؤلات بأن الروبوت يجمع المعلومات بالفعل منذ فترة طويلة.
وبالإضافة لذلك، أثبت مطورو منصات الذكاء الاصطناعي عدم احترامهم لحقوق المؤلفين والفنانين، وغيرهم من المحترفين المبدعين وتستند منتجاتهم إلى حد كبير على الأعمال المحمية بحقوق الطبع والنشر للآخرين، والتي تم التقاطها دون إذن أو تعويض.
وبالرغم من طريقة الإلغاء، إلا أن الأمر ليس موثوقًا فيما يخص التقف فعلًا عن التتبع، ولم يكن هذا هو الروبوت المتتبع الوحيد فهناك الكثير منهم.
فمثلا نجد العنكبوت الرقمي CCBot الذي يزحف إلى الويب ويجمع كل المحتوى، ويتم دعمه من قبل منظمة Common Crawl وهي مورد رئيسي لبيانات تدريب نماذج الذكاء الاصطناعي، ويخزن الروبوت المعلومات بانتظام، فإذا قمت بحظره فقد فات الأوان وتم تخزين بياناتك بالفعل.