الوصول الموحد إلى المتجهات عبر المؤسسات و OPA: في المؤسسات الكبيرة، تُخزَّن البيانات عادةً في أقسام مختلفة أو شركات شريكة، ضمن قواعد بيانات متعددة. ويُعدّ جمع هذه البيانات في مركز واحد أمرًا صعبًا نظرًا لمتطلبات الامتثال القانوني، وأمن البيانات، وحقوق الملكية. ويهدف هذا العرض التقديمي إلى توفير "تكامل افتراضي" دون الحاجة إلى نسخ البيانات.
- vLLM: تُستخدم هذه التقنية لتحويل البيانات الوصفية المعقدة من مصادر البيانات إلى ملخصات موجزة وذات معنى بلغة طبيعية. كما أنها تؤدي دورًا كمحرك استدلال عالي الأداء في عمليات فهم استفسارات المستخدمين ومعالجة النتائج.
- قرارات السياسات: مسؤول عن إدارة البيانات والتفويض. عندما يبدأ المستخدم استعلامًا، يتحقق نظام إدارة العمليات (OPA) أثناء التشغيل مما إذا كان لدى المستخدم إذن بالوصول إلى مصدر البيانات هذا.
- تفاصيل ميلفوس: يعمل كـ"فهرس دلالي". يخزن البيانات الوصفية التقنية والتجارية لمصادر البيانات في جميع المؤسسات بصيغة متجهة. عند ورود استعلام، يقوم بإجراء بحث أولي لتحديد المؤسسة التي قد تمتلك البيانات ذات الصلة.
يثبت هذا العرض التقديمي كيف يمكن إنشاء بنية تحتية للبحث آمنة و"ذكية" بين المؤسسات دون نقل البيانات إلى موقع مركزي من خلال الجمع بين قدرة البحث القابلة للتطوير لـ Milvus، وقوة معالجة اللغة لـ vLLM، وسياسات الأمان المرنة لـ OPA.6
هندسة السياق: يجادل المتحدث كيفن نويل بأن عصر "كتابة سؤال وانتظار إجابة" قد انتهى، وبدلاً من ذلك، دخلنا عصر هندسة السياق.
- ماجستير القانون لا يحمل جنسية: لا تتذكر العارضات حتى الجملة السابقة إلا إذا قمت بتذكيرهن بها.
- إنشاء الدولة: لكي يُقدّم الذكاء الاصطناعي الإجابة الصحيحة، يجب تقديم جميع المعلومات إليه بشكل صحيح في تلك اللحظة (في الوقت المناسب). وهذا هو فنّ الجمع بين المحادثات السابقة والمعلومات من المستندات ومخرجات الأدوات.
يُظهر العرض التقديمي أنه يجب دمج الأجزاء التالية للحصول على استجابة ناجحة من الذكاء الاصطناعي:
- RAG (المعلومات ذات الصلة): المعلومات مستقاة من الوثائق أو قواعد البيانات الداخلية.
- إدارة الذاكرة: تفضيلات المستخدم السابقة وسجل المحادثات قصيرة المدى.
- أدوات خارجية: البيانات الواردة من واجهات برمجة التطبيقات أو أدوات الحساب.
- أوامر النظام: القواعد الرئيسية التي تحدد طبيعة ووظيفة الذكاء الاصطناعي.
يستحيل اختبار مثل هذه البنية المعقدة (RAG + الذاكرة + الأدوات) يدويًا. يقدم المتحدث الحل التالي:
- التقييم التلقائي: يجب أن يقوم الذكاء الاصطناعي بإنتاج آلاف من أزواج "السؤال والجواب" (البيانات الاصطناعية) باستخدام البيانات التي لدينا.
- سيناريوهات واقعية: يجب علينا قياس مدى متانة النظام من خلال إنشاء مستخدمين اصطناعيين يطرحون أسئلة غير صحيحة أو غير مكتملة مثل المستخدمين الحقيقيين.
التكلفة والسرعة: يمكننا تقييم نجاح النظام (الدقة، عدم الصلة، الهلوسة) في دقائق باستخدام مجموعات البيانات الاصطناعية، بدلاً من الاختبارات التي تستغرق أسابيع بالنسبة للبشر. 10