انتقل إلى المحتوى
سعر المؤسِّسين — مثبَّت للعملاء الأوائلابدأ الآن ←

عملاء Browser Use: كيف تتنقل عملاء الذكاء الاصطناعي وتتحكم في الويب

عملاء Browser Use هي أنظمة ذكاء اصطناعي تتحكم بشكل مستقل في متصفح الويب دون تدخل بشري في كل خطوة: التنقل بين عناوين URL ونقر الأزرار وملء النماذج واستخراج المحتوى ومعالجة المصادقة. إنها فئة أدوات عملاء الذكاء الاصطناعي الأسرع نموا في 2026، مدعومة بأُطر عمل مثل browser-use (96,282 نجمة على GitHub اعتبارا من مايو 2026).

ما هو عميل Browser Use؟

عميل Browser Use هو عميل ذكاء اصطناعي يقود برمجيا متصفح ويب بدون واجهة أو بواجهة باستخدام اجتياز DOM وتحليل شجرة إمكانية الوصول وربط لقطات الشاشة واختيار الإجراءات بتوجيه من نموذج اللغة الكبير لإنجاز المهام القائمة على الويب بشكل مستقل.

كيف تعمل عملاء Browser Use

الإدراك: DOM وشجرة إمكانية الوصول وربط لقطات الشاشة

يجب على عميل المتصفح فهم حالة الصفحة الحالية قبل اتخاذ أي إجراء. ثلاث استراتيجيات للإدراك شائعة الاستخدام.

استخراج DOM يُحلل بنية HTML الخام للصفحة. سريع وفعّال من حيث الرموز، لكنه يفشل مع المحتوى المُقدَّم عبر canvas والتطبيقات أحادية الصفحة المعقدة.

شجرة إمكانية الوصول تقرأ طبقة إمكانية الوصول المدمجة في المتصفح، وتوفر عرضا دلاليا منظما للصفحة. هذه هي طريقة الإدراك الأساسية التي يستخدمها browser-use.

ربط لقطات الشاشة يلتقط لقطة مرئية للصفحة ويمررها إلى نموذج لغة كبير ذي قدرة بصرية. يعالج الصفحات التي لا يمكن الاعتماد فيها على DOM وشجرة إمكانية الوصول، لكن تكلفة الرموز أعلى بكثير لكل خطوة.

الإجراءات: النقر والكتابة والتنقل وإرسال النماذج

مساحة الإجراءات لعميل المتصفح واسعة: الانتقال إلى عناوين URL ونقر العناصر وإدخال النصوص والضغط على المفاتيح والتمرير واختيار القوائم المنسدلة ورفع الملفات أو التبديل بين علامات تبويب المتصفح. كل إجراء يُغيّر حالة الصفحة.

مكتبة browser-use

96,282 نجمة في أقل من 7 أشهر

browser-use (GitHub: browser-use/browser-use) أُطلق في 31 أكتوبر 2024 وحقق حتى مايو 2026 نحو 96,282 نجمة و10,802 تفرعا. تُجرّد المكتبة إدارة جلسات Playwright واستخراج شجرة إمكانية الوصول وتسلسل الإجراءات.

خلفية Playwright: كيف يتحكم browser-use في Chromium

browser-use يُغلّف مكتبة أتمتة Playwright من Microsoft مضيفا طبقة عميل: استخراج شجرة إمكانية الوصول وتحويلها إلى صيغة فعّالة من حيث الرموز وترجمة قرارات إجراءات نموذج اللغة الكبير إلى أوامر Playwright.

تكامل نموذج اللغة الكبير: GPT-4o وClaude وGemini كطبقة استدلال

browser-use غير مرتبط بنموذج لغة كبير محدد على طبقة الاستدلال، يدعم OpenAI وAnthropic وGoogle وأي نقطة نهاية API متوافقة مع OpenAI.

موقف OpenLegion: عملاء المتصفح هي الأداة الأكثر خطورة

عملاء المتصفح هي فئة الأدوات الأكثر خطورة في الذكاء الاصطناعي الفاعل. عميل المتصفح القادر على النقر وملء النماذج وتتبع عمليات التحويل يمتلك نفس سطح الهجوم كإنسان يملك وصولا كاملا للإنترنت.

عرض سرقة البيانات الاعتمادية في 150 ثانية

أظهرت أبحاث موثقة علنا من عام 2025 أن عميل المتصفح يمكن التلاعب به لسرقة بيانات الاعتماد في أقل من 150 ثانية عبر تعليمات مخفية مضمنة في صفحات الويب. الدفاع معماري: إذا لم تكن بيانات الاعتماد موجودة في سياق العميل أو ذاكرة العملية، فلا تستطيع عملية الحقن استخراجها. يضمن Vault Proxy لـ OpenLegion أن بيانات اعتماد الجلسة تُحقن على طبقة الشبكة ولا تظهر أبدا في نافذة سياق العميل.

OWASP LLM08 الوكالة المفرطة وأذونات المتصفح

يُصنّف OWASP LLM Top 10 2025 الوكالة المفرطة (LLM08) كفئة مخاطر رئيسية. عملاء المتصفح هم النموذج البارز لهذا الخطر: عميل يملك أذونات للتنقل والقراءة وملء النماذج والنقر على الأزرار يستطيع إجراء عمليات شراء وإرسال رسائل وحذف حسابات وتسريب بيانات.

كيف تعزل OpenLegion عملاء المتصفح (Camoufox + Zone 1)

تشغّل OpenLegion نسخة متصفح Camoufox معزولة على المنفذ :8500 داخل حاوية Zone 1 Docker الخاصة بكل عميل، نسخة واحدة لكل عميل. أربع خصائص: لا حالة جلسة مشتركة، مقاومة البصمة الرقمية، بيانات اعتماد Vault Proxy، توجيه الشبكة عبر Mesh Host.

أنماط معمارية لعملاء المتصفح

بدون واجهة مقابل مع واجهة

الوضع بدون واجهة أسرع ويعمل في بيئات الخادم، لكن يمكن اكتشافه بواسطة أنظمة حماية الروبوتات. Camoufox يعمل في الوضع بدون واجهة لكنه يُرقّع واجهات برمجة تطبيقات JavaScript التي تستهدفها نصوص اكتشاف الوضع بدون واجهة.

معالجة CAPTCHA

ثلاثة مناهج: المتصفح السلوكي (مقاومة البصمة الرقمية)، خدمات الحل (1-3 دولار لكل 1000 حل)، الرجوع إلى الإنسان في الحلقة. تدعم OpenLegion تسليم CAPTCHA بمشاركة إنسانية عبر لوحة التحكم.

حقن بيانات الاعتماد: Vault Proxy مقابل ملفات تعريف الارتباط المُرمّزة بشكل ثابت

الأسوأ: بيانات الاعتماد مباشرة في تعليمات العميل. سيئ: متغيرات البيئة (يمكن الوصول إليها عبر os.environ). الصحيح: حقن Vault Proxy على طبقة الشبكة.

عملاء Browser Use: مقارنة معمارية

البُعدOpenLegionbrowser-useRaw PlaywrightStagehand
خلفية التنفيذCamoufox (Firefox، مقاوم للبصمة)Playwright (Chromium)PlaywrightChromium سحابي
عزل الجلسةحاوية لكل عميلعملية مشتركةيعتمد على التنفيذمُدار سحابيا
معالجة بيانات الاعتمادحقن Vault Proxyعبر نافذة السياقتنفيذ يدويمُدار
دعم CAPTCHAبصمة Camoufox + إنسان في الحلقةلا يوجد مدمجلا يوجد مدمجخدمة حل
صندوق رمل الحاويةZone 1 Docker، غير جذرلا يوجدلا يوجدصندوق رمل سحابي
نجوم GitHub96,282 (مايو 2026)N/A~9,000
الترخيصBSL 1.1MITApache 2.0MIT

متى تستخدم عملاء المتصفح (ومتى لا تستخدمها)

حالات الاستخدام المشروعة: البحث على الويب واستخراج البيانات، أتمتة النماذج للخدمات الخاصة، المراقبة والاختبار. حالات الاستخدام التي تحتاج تحكما إضافيا: الجلسات المصادق عليها، المواقع المالية. تجنب بدون صندوق رمل صارم: عناوين URL غير الموثوقة المُقدَّمة من المستخدمين.

البدء مع عملاء متصفح آمنين على OpenLegion

شغّل عملاء المتصفح في حاويات معزولة مع بيانات اعتماد Vault Proxy والتحكم في الشبكة لكل عميل.

الأسئلة الشائعة

ما هي عملاء Browser Use؟

عملاء Browser Use هي أنظمة ذكاء اصطناعي تتحكم بشكل مستقل في متصفحات الويب من خلال اجتياز DOM وتحليل شجرة إمكانية الوصول واختيار الإجراءات بتوجيه من نموذج اللغة الكبير. مكتبة browser-use (96,282 نجمة على GitHub، رخصة MIT، أُطلقت أكتوبر 2024) هي أكثر تنفيذ مفتوح المصدر اعتمادا.

كيف تعمل مكتبة browser-use؟

browser-use تُغلّف Playwright من Microsoft وتمنح نموذج اللغة الكبير عرضا منظما لشجرة إمكانية الوصول في المتصفح ثم تترجم قرارات الإجراءات إلى أوامر Playwright. تدعم GPT-4o وClaude وGemini ونماذج متوافقة، مرخصة بـ MIT، وتتطلب نحو 20 سطرا من Python لعميل يعمل.

ما هي مخاطر الأمان لعملاء Browser Use؟

ثلاثة مخاطر رئيسية: حقن التوجيهات عبر محتوى الويب (عرض 2025 أظهر سرقة بيانات الاعتماد في 150 ثانية)، تسرب بيانات الاعتماد (إذا كانت ملفات تعريف ارتباط الجلسة في ذاكرة عملية العميل)، الوكالة المفرطة (OWASP LLM08:2025). كما تم إثبات تسرب معاينة الروابط بصفر نقرات.

كيف يمكن تشغيل عملاء المتصفح بأمان؟

أربعة ضوابط مطلوبة: عزل الحاويات، بيانات اعتماد Vault Proxy، التحكم في خروج الشبكة، حدود الميزانية لكل عميل. خدمة المتصفح المدعومة بـ Camoufox من OpenLegion تُطبق الأربعة افتراضيا داخل حاويات Zone 1 Docker.

ما هو Camoufox ولماذا تستخدمه OpenLegion؟

Camoufox هو متصفح بدون واجهة مبني على Firefox يُرقّع واجهات برمجة تطبيقات JavaScript للإبلاغ عن ملفات تعريف أجهزة حقيقية بدلا من التوقيعات البدون واجهة. تشغّل OpenLegion نسخة واحدة من Camoufox لكل عميل على المنفذ :8500 في كل حاوية Zone 1 Docker.

ما الفرق بين browser-use وPlaywright لعملاء الذكاء الاصطناعي؟

Playwright مكتبة أتمتة متصفح منخفضة المستوى دون مفهوم لعملاء الذكاء الاصطناعي. browser-use تضيف طبقة العميل: تحويل حالة المتصفح إلى صيغة قابلة للقراءة من نموذج اللغة الكبير، وترجمة إجراءات نموذج اللغة الكبير إلى أوامر Playwright، ومعالجة تحليل المهام متعددة الخطوات عبر الصفحات.

هل تستطيع عملاء Browser Use التعامل مع تسجيل الدخول والجلسات المصادق عليها؟

نعم، لكن معالجة الجلسات المصادق عليها هي واحدة من أكثر العمليات خطورة. OpenLegion تحقن بيانات اعتماد الجلسة على طبقة الشبكة عبر Vault Proxy.

كيف تتعامل عملاء المتصفح مع CAPTCHA؟

ثلاثة مناهج: المتصفح السلوكي (مقاومة البصمة الرقمية)، خدمات الحل (1-3 دولار لكل 1000 حل، زمن استجابة 10-60 ثانية)، الرجوع إلى الإنسان في الحلقة. تدعم OpenLegion تسليم CAPTCHA بمشاركة إنسانية عبر لوحة التحكم.