
هل أنت مستعدٌ للسماح لوكيل ذكاء اصطناعي باستخدام جهاز الكمبيوتر الخاص بك؟ بعد ثورة الذكاء الاصطناعي التوليدي، التي بدأت فعليًا بإطلاق تشات جي بي تي، أصبح امتلاك مساعد ذكاء اصطناعي مفيد في متناول اليد أكثر شيوعًا. الاندفاع الكبير المقبل في عالم الذكاء الاصطناعي هو نحو وكلاء الذكاء الاصطناعي، القادرين على اتخاذ إجراءات نيابةً عنك! 🚀
و الآن، بدأت هذه التقنية الرائعة بالاقتراب من المستهلكين العاديين. شركات عملاقة مثل Anthropic، و Google، و DeepMind، و OpenAI أطلقت مؤخرًا نماذج تجريبية توفر قدرة فريدة على استخدام الحواسيب، مثل البحث عن المعلومات عبر الإنترنت، وملء النماذج، والنقر على الأزرار! 想像一下، يمكنك الآن طلب منتجات من المتاجر الإلكترونية، أو استدعاء سيارة أوبر، أو البحث عن أفضل سعر لمنتج أو رحلة سياحية قريبة! ✈️
على الرغم من أن هذه النماذج الأولية محدودة القدرات، وليست متاحةً على نطاقٍ واسعٍ بعد، إلا أنها تُظهر اتجاه الذكاء الاصطناعي المُذهل. كما صرح سام ألتمان، الرئيس التنفيذي لشركة OpenAI، في مقطع فيديو تقديمي: “هذا هو الذكاء الاصطناعي يُجري عملياتٍ بسيطة فقط.” شاهدوا كيف يمكن لوكيل OpenAI التنقل في موقع OpenTable، والبحث عن مطعم، والتحقق من وجود طاولة لشخصين في تمام الساعة السابعة مساءً!
زاكاري ليبتون، أستاذ مشارك في تعلم الآلة بجامعة كارنيجي ميلون، لاحظ أن وكلاء الذكاء الاصطناعي يتم بالفعل دمجهم في برامج متخصصة لعملاء مختلفين في المؤسسات. لكنه أشار إلى أننا لم نصل بعد إلى مرحلة وكلاء الذكاء الاصطناعي القادرين على إنجاز المهام الروتينية على حاسوبك المحمول. “ما يُثير الاهتمام هنا هو إمكانية بدء الناس بتسليم مفاتيح النظام” 🔥
نماذج رائدة في مجال وكلاء استخدام الحاسوب
بدأت Anthropic بالكشف عن هذه التقنية الجديدة، حيث أعلنوا في أكتوبر أن روبوت الدردشة Claude أصبح الآن قادرًا على “استخدام الحواسيب كما يفعل البشر”. كما صرحت الشركة بتقديم هذه الميزة كميزة تجريبية لمطوري الأدوات والبرامج التي تعتمد على نماذج اللغة الكبيرة. يتحكم Claude في الكمبيوتر عن طريق عرض لقطات شاشة لما يراه المستخدم. يقول المتحدث باسم Anthropic أن كلويد يمكنه القيام بهذا العمل على أي حاسوب وفي أي تطبيق سطح مكتب.
جوجل ديب مايند أطلقت مشروع مارينر، المبني على نموذج اللغة جيميني 2. عرضت الشركة مارينر في ديسمبر، لكنها أشارت إلى أنه “نموذج بحثي مبكر” و أنه متاح فقط لـ “المختبرين الموثوق بهم” حاليًا. يعمل مارينر داخل متصفح كروم، وفي علامة تبويب نشطة فقط، مما يعني أنه لن يعمل في الخلفية. هذا قد يكون شرطًا مؤقتًا حتى يتم تطويره.
أما OpenAI، فقد أطلقت وكيل استخدام الكمبيوتر CUA، المسمى بـ Operator. وصفته الشركة بأنه “معاينة بحثية” وجعلتها متاحةً فقط للمستخدمين الذين يدفعون 200 دولار أمريكي شهريًا مقابل خدمة OpenAI المتميزة. يقول ياش كومار من فريق Operator إن الأداة تعمل مع أي موقع ويب تقريبًا، و هي مُدرّبة على استخدام الكمبيوتر، لذا من الممكن أن تُوسّع نطاقها لتشمل تطبيقات سطح المكتب الأخرى.
يعتمد وكيل استخدام الحاسوب على التفكير المتسلسل لفهم التعليمات وتحليلها. إذا احتاج إلى مزيد من المعلومات، فسوف يسأل، ويطلب التأكيد قبل اتخاذ أي خطوة نهائية.
مخاوف تتعلق بالسلامة
لا يزال وكلاء استخدام الحاسوب يواجهون بعض القيود مثل تسجيل الدخول، وشروط الخدمة، وحل اختبارات التحقق، وإدخال تفاصيل الدفع. إذا واجه الوكيل هذه العقبات، فسوف يُعيد عجلة القيادة إلى المستخدم. لاحظت الشركات المخاطر المحتملة من هجمات حقن المطالبة (مثل إضافة شيء إلى مطالبة المستخدم لجعل النموذج يتخذ إجراءً غير متوقع).
يُشير الخبراء إلى أن من الصعب تقييم المخاطر، و أن السؤال المطروح هو ما إذا كان هذا الوكيل يتطلب حقًا الوصول الكامل لجهاز الكمبيوتر الخاص بك؟ أو هل يمكننا أن نتصور أن شخصًا ما قد يحاول إجبار وكيلك على القيام بشيء غير مشروع؟ من سيكون أول شخص يستيقظ و يقول “وكيلّي اشترى لي أسطولاً من السيارات؟”
المستقبل
في حين لم تكشف أي من الشركات عن جدول زمني لجعل وكلاء استخدام الحاسوب متاحين على نطاق واسع، يبدو من المحتمل أن يبدأ المستهلكون في الحصول على وصول إليهم هذا العام. يمثل وكيل OpenAI خطوة نحو مستقبل أكثر تعاونًا بين البشر والذكاء الاصطناعي، ويُعدّ حجر أساس في طريقنا نحو الذكاء الاصطناعي العام. توسيع نطاق استخدام الذكاء الاصطناعي ليتفاعل مع الأدوات التي يتفاعل معها البشر يوميًا سيوفر الكثير من الوقت.
المصدر: IEEE Spectrum