Akses Vektor Terpadu di Seluruh Organisasi dan OPA: Dalam organisasi besar, data biasanya disimpan di berbagai departemen atau perusahaan mitra, dalam basis data vektor yang berbeda. Mengumpulkan data ini di satu pusat sulit dilakukan karena masalah kepatuhan hukum, keamanan data, dan hak kepemilikan. Presentasi ini bertujuan untuk menyediakan "integrasi virtual" tanpa menyalin data.
- vLLM: Digunakan untuk mengubah metadata kompleks dari sumber data menjadi ringkasan bahasa alami yang bermakna dan singkat. Ia juga berperan sebagai mesin inferensi berkinerja tinggi dalam proses memahami kueri pengguna dan memproses hasilnya.
- Keputusan Kebijakan: Bertanggung jawab atas tata kelola data dan otorisasi. Ketika pengguna memulai kueri, OPA memeriksa pada saat runtime apakah pengguna memiliki izin untuk mengakses sumber data tersebut.
- Detail Milvus: Berfungsi sebagai "Katalog Semantik". Ia menyimpan metadata teknis dan bisnis dari sumber data di semua organisasi dalam bentuk vektor. Ketika sebuah kueri masuk, ia melakukan pencarian tahap pertama untuk menentukan organisasi mana yang mungkin memiliki data yang relevan.
Presentasi ini membuktikan bagaimana infrastruktur pencarian yang aman dan "cerdas" dapat dibangun antar organisasi tanpa memindahkan data ke lokasi pusat dengan menggabungkan kemampuan pencarian Milvus yang skalabel, kekuatan pemrosesan bahasa vLLM, dan kebijakan keamanan OPA yang fleksibel.6
Rekayasa Konteks: Pembicara Kevin Noel berpendapat bahwa era "sekadar menulis pertanyaan dan menunggu jawaban" telah berakhir, dan sebagai gantinya, kita telah memasuki era rekayasa konteks.
- Gelar LLM tidak memiliki kewarganegaraan: Para model bahkan tidak mengingat kalimat sebelumnya kecuali Anda mengingatkan mereka.
- Pembentukan Negara: Agar kecerdasan buatan dapat memberikan jawaban yang benar, Anda perlu menyajikan semuanya dengan benar kepadanya pada "saat" itu (tepat waktu). Inilah seni menggabungkan percakapan sebelumnya, informasi dari dokumen, dan keluaran alat.
Presentasi ini menunjukkan bahwa bagian-bagian berikut harus digabungkan agar respons kecerdasan buatan berhasil:
- RAG (Informasi Relevan): Informasi diambil dari dokumen atau basis data internal.
- Manajemen memori: Preferensi pengguna sebelumnya dan riwayat percakapan jangka pendek.
- Alat Eksternal: Data yang berasal dari API atau alat perhitungan.
- Perintah Sistem: Aturan utama yang menentukan karakter dan tugas kecerdasan buatan.
Tidak mungkin untuk menguji struktur yang begitu kompleks (RAG + Memori + Alat) secara manual. Pembicara menawarkan solusi berikut:
- Evaluasi Otomatis: Kita harus meminta kecerdasan buatan untuk menghasilkan ribuan pasangan "pertanyaan-jawaban" (data sintetis) menggunakan data yang kita miliki.
- Skenario Realistis: Kita harus mengukur ketahanan sistem dengan menciptakan pengguna sintetis yang mengajukan pertanyaan yang salah atau tidak lengkap seperti pengguna sungguhan.
Biaya dan Kecepatan: Kita dapat menilai keberhasilan sistem (akurasi, ketidakrelevanan, halusinasi) dalam hitungan menit dengan kumpulan data sintetis, alih-alih pengujian yang akan memakan waktu berminggu-minggu bagi manusia. 10