• Tanggal Publikasikan
    16 Maret, 2026
  • Bagikan

Pendahuluan: Arsitektur Sistem, Bukan Model

 

Sementara persaingan untuk "model yang lebih besar" di dunia kecerdasan buatan mulai mereda dan digantikan oleh keheningan yang kritis, masa depan sektor ini dirangkum dalam satu kalimat di Open Source Summit Japan 2025:  "Masa depan AI berbasis agen tidak akan ditentukan oleh skala model, tetapi oleh arsitektur sistem." 

 

Penetapan ini merupakan indikator paling konkret bahwa fokus telah bergeser dari sekadar pelatihan model ke infrastruktur yang mendukung dan meningkatkan skala model-model tersebut. Konferensi yang diadakan di Toranomon Hills, Tokyo, membuktikan bagaimana perusahaan raksasa seperti Google, Fujitsu, dan Honda telah mengadopsi open source sebagai "landasan strategis", dan sebagai seorang insinyur DevOps, saya berkesempatan untuk meneliti norma-norma baru di persimpangan dunia kecerdasan buatan dan infrastruktur di lokasi acara.
Artikel ini menganalisis keterkaitan antara dunia kecerdasan buatan dan infrastruktur, berdasarkan foto-foto yang saya ambil sendiri di acara tersebut, sesi-sesi teknis yang saya hadiri, dan data yang dikumpulkan dari program resmi Linux Foundation.

Ekran Resmi 2026-03-16 09.52.28.png

 

Tema Utama

Diskusi teknis yang menonjol dalam program konferensi dan presentasi yang saya teliti di lokasi dikelompokkan dalam beberapa poros utama berikut dalam hal manajemen infrastruktur modern:

 

A. Arsitektur Sistem dan Disagregasi Perangkat Keras

  • Disagregasi Perangkat Keras: Seperti yang dijelaskan dalam sesi "Dynamic GPU Provisioning" Fujitsu, hal ini melampaui struktur server tradisional, dengan mengumpulkan CPU, GPU, dan memori dalam kumpulan dinamis (Resource Pool) dengan memindahkannya dari casing fisik.
  • Pabrik AI: Transformasi pusat data menjadi fasilitas produksi yang dapat merespons tuntutan variabel beban kerja kecerdasan buatan, bukan lagi sekadar kumpulan server statis.

B. Operasi Agen

  • Manajemen Infrastruktur Otonom: Seperti yang kita lihat dalam demonstrasi di atas panggung, transisi dari struktur alat seperti Terraform yang "berhenti jika terjadi kesalahan" ke struktur berbasis "Agen" yang dapat menganalisis kesalahan dan menghasilkan solusi.3 
  • Putaran Umpan Balik Berkelanjutan: Pemantauan berkelanjutan tidak hanya terhadap penerapan model kecerdasan buatan tetapi juga kinerjanya di lingkungan nyata.

C. Tata Kelola dan Keamanan Data

  • Akses Vektor Terfederasi: Menurut diagram arsitektur yang dibagikan oleh NTT dan presenter lainnya, struktur yang memproses data di lokasi dari sumber yang terdistribusi menggabungkan hasilnya alih-alih memindahkannya ke pusat penyimpanan data.6 
  • Kebijakan sebagai Kode: Pengambilan keputusan akses data secara dinamis pada saat permintaan dilakukan oleh mesin seperti OPA (Open Policy Agent). 6 

D. Beban Kerja Kritis dan Khusus

  • Pengaturan Server Game: Seperti yang ditunjukkan dalam presentasi Agones dari tim Google Open Source, pengelolaan server game stateful dalam skala global di Kubernetes.7 
  • Linux Kelas Luar Angkasa: Pengelolaan lengan robot di ISS dengan perangkat lunak sumber terbuka, yang dipamerkan dalam presentasi GITAI.8 

Sorotan dari Konferensi

A. Arsitektur Sistem dan Disagregasi Perangkat Keras

Pembebasan Perangkat Keras: CoHDI

Salah satu sesi teknis yang paling menarik dari konferensi tersebut adalah pidato yang berjudul... "Penyediaan GPU Dinamis di Kubernetes" Dipresentasikan oleh Jin Hase dan Tsubasa Watanabe dari tim Fujitsu. Diagram arsitektur yang ditampilkan di atas panggung menjelaskan hal tersebut. CoHDI (Infrastruktur Terpisah yang Dapat Dikomposisikan) proyek sebagai berikut:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Kumpulan Sumber Daya yang Terpisah-pisah: CPU, GPU, Memori, dan NIC dilepas dari casing server fisik dan dikumpulkan dalam satu wadah bersama.
  • Fabrik Switch PCIe/CXL: Komponen-komponen ini terhubung satu sama lain melalui sakelar berkecepatan tinggi.
  • Integrasi Kubernetes: Seperti yang terlihat pada diagram, Kubernetes meminta perangkat keras seolah-olah membuat Pod, dan sistem langsung merakit perangkat keras ini untuk membuat server "Composed Baremetal".2 

Jadi mengapa demikian? CoHDI Penting? Arsitektur ini berpotensi meningkatkan efisiensi penggunaan GPU dari 30% menjadi 80%.

 

Orkestrasi Infrastruktur: Crossplane 2.0

 

Presentasi penting lainnya dalam acara tersebut menunjukkan bahwa... Crossplane 2.0 arsitektur. Pemantauan berkelanjutan terhadap definisi deklaratif di Git oleh loop kontrol Crossplane dan transformasinya menjadi sumber daya nyata di AWS, Azure, atau Google Cloud mendukung visi infrastruktur yang "dapat memperbaiki diri sendiri". Selain itu, Crossplane 2.0 Kini, teknologi tersebut dapat dijalankan di semua lingkungan Kubernetes, bukan hanya untuk layanan cloud, seperti pada Crossplane v1. Berkat teknologi ini, setiap pengembang dapat menginstal teknologi sederhana tanpa bantuan. Presentasi ini sangat mengesankan dalam menunjukkan arah perkembangan proses DevOps di masa depan. 

B. Operasi Agen

AgentOps: Ini adalah mesin umpan balik berkelanjutan yang bertujuan untuk menutup kesenjangan realitas di antara keduanya dengan menyatukan tahap pengembangan (lingkaran dalam) dan aplikasi (lingkaran luar) agen kecerdasan buatan. Struktur ini didefinisikan sebagai disiplin rekayasa platform AI yang menggabungkan kumpulan data yang disiapkan secara offline dengan pengamatan dari lingkungan langsung dalam satu ekosistem, memungkinkan deteksi kesalahan dan penggabungan data dunia nyata kembali ke dalam proses pengujian.5 

 

Manusia vs. Agen: Annie Talvasto berpendapat dalam pidatonya bahwa mesin akan tetap tidak lengkap dalam proses DevOps selama mereka tidak memiliki informasi yang dimiliki manusia. Misalnya, ia menyebutkan bahwa sistem dapat dikelola secara tidak lengkap jika Anda bahkan tidak memiliki korespondensi singkat dari seorang kolega. Ia menyebutkan secara rinci dalam presentasinya bahwa semua informasi ini harus diberikan kepada agen terlebih dahulu. 3 

 

Sumber Terbuka di Luar Angkasa: ISS dan Robotika

 

Dalam foto-foto yang diambil pada sesi sistem kritis keselamatan, terlihat gambar Stasiun Luar Angkasa Internasional (ISS) dan GITAI Lengan robot tercermin di layar raksasa. Melihat bahwa Linux digunakan di lingkungan di mana tidak ada kemewahan untuk membuat kesalahan di ruang hampa udara merupakan bukti keandalan sumber terbuka.8 

 

C. Tata Kelola dan Keamanan Data

C. Tata Kelola dan Keamanan Data

Akses Vektor Terpadu di Seluruh Organisasi dan OPA: Dalam organisasi besar, data biasanya disimpan di berbagai departemen atau perusahaan mitra, dalam basis data vektor yang berbeda. Mengumpulkan data ini di satu pusat sulit dilakukan karena masalah kepatuhan hukum, keamanan data, dan hak kepemilikan. Presentasi ini bertujuan untuk menyediakan "integrasi virtual" tanpa menyalin data.

  • vLLM: Digunakan untuk mengubah metadata kompleks dari sumber data menjadi ringkasan bahasa alami yang bermakna dan singkat. Ia juga berperan sebagai mesin inferensi berkinerja tinggi dalam proses memahami kueri pengguna dan memproses hasilnya.
  • Keputusan Kebijakan: Bertanggung jawab atas tata kelola data dan otorisasi. Ketika pengguna memulai kueri, OPA memeriksa pada saat runtime apakah pengguna memiliki izin untuk mengakses sumber data tersebut.
  • Detail Milvus: Berfungsi sebagai "Katalog Semantik". Ia menyimpan metadata teknis dan bisnis dari sumber data di semua organisasi dalam bentuk vektor. Ketika sebuah kueri masuk, ia melakukan pencarian tahap pertama untuk menentukan organisasi mana yang mungkin memiliki data yang relevan.

Presentasi ini membuktikan bagaimana infrastruktur pencarian yang aman dan "cerdas" dapat dibangun antar organisasi tanpa memindahkan data ke lokasi pusat dengan menggabungkan kemampuan pencarian Milvus yang skalabel, kekuatan pemrosesan bahasa vLLM, dan kebijakan keamanan OPA yang fleksibel.6 

 

Rekayasa Konteks: Pembicara Kevin Noel berpendapat bahwa era "sekadar menulis pertanyaan dan menunggu jawaban" telah berakhir, dan sebagai gantinya, kita telah memasuki era rekayasa konteks.

  • Gelar LLM tidak memiliki kewarganegaraan: Para model bahkan tidak mengingat kalimat sebelumnya kecuali Anda mengingatkan mereka.
  • Pembentukan Negara: Agar kecerdasan buatan dapat memberikan jawaban yang benar, Anda perlu menyajikan semuanya dengan benar kepadanya pada "saat" itu (tepat waktu). Inilah seni menggabungkan percakapan sebelumnya, informasi dari dokumen, dan keluaran alat.

Presentasi ini menunjukkan bahwa bagian-bagian berikut harus digabungkan agar respons kecerdasan buatan berhasil:

  • RAG (Informasi Relevan): Informasi diambil dari dokumen atau basis data internal.
  • Manajemen memori: Preferensi pengguna sebelumnya dan riwayat percakapan jangka pendek.
  • Alat Eksternal: Data yang berasal dari API atau alat perhitungan.
  • Perintah Sistem: Aturan utama yang menentukan karakter dan tugas kecerdasan buatan.

Tidak mungkin untuk menguji struktur yang begitu kompleks (RAG + Memori + Alat) secara manual. Pembicara menawarkan solusi berikut:

  • Evaluasi Otomatis: Kita harus meminta kecerdasan buatan untuk menghasilkan ribuan pasangan "pertanyaan-jawaban" (data sintetis) menggunakan data yang kita miliki.
  • Skenario Realistis: Kita harus mengukur ketahanan sistem dengan menciptakan pengguna sintetis yang mengajukan pertanyaan yang salah atau tidak lengkap seperti pengguna sungguhan.

Biaya dan Kecepatan: Kita dapat menilai keberhasilan sistem (akurasi, ketidakrelevanan, halusinasi) dalam hitungan menit dengan kumpulan data sintetis, alih-alih pengujian yang akan memakan waktu berminggu-minggu bagi manusia. 10 

D. Beban Kerja Kritis dan Khusus

Orkestrasi Server Game (Agones): Pada slide berjudul "Cara kerja Agones" Oleh tim Google Open Source, sebuah diagram alur dibagikan mengenai infrastruktur tersebut. A.R.C. Raiders Dalam diagram ini, terlihat jelas bahwa setelah pencocokan pemain (matchmaking), pemain ditugaskan ke Pod yang disebut "Agones Game Server" dan server-server ini dikelola dengan strategi "binpacking" (kompresi) dalam skala global. Hal ini memungkinkan pengembang untuk mencurahkan lebih banyak waktu untuk pengembangan game tanpa perlu memikirkan infrastruktur. Ini juga membuktikan betapa pentingnya peran Kubernetes sebagai perangkat lunak sumber terbuka dalam industri game.

Ekran Resmi 2026-03-16 10.37.12.png

Kecepatan dalam Distribusi Model: Presentasi tersebut menunjukkan bahwa model sekarang disimpan dalam registri yang kompatibel dengan OCI seperti image Docker dan terhubung langsung (dipasang) ke Pod seperti disk berkat Model CSI DriverHal ini menghilangkan waktu yang dibutuhkan untuk menyalin data berukuran GB. Registri OCI Harbor digunakan untuk operasi ini.8 

 

Kinerja Inferensi: Berdasarkan catatan dan visual yang saya ambil dari sesi vLLM, teknologi PagedAttention adalah kunci kinerja. Teknologi ini mengelola memori GPU dengan logika memori virtual dalam sistem operasi, mengatasi hambatan "Key-Value Cache" dan melipatgandakan throughput. Presentasi tersebut juga menyebutkan bahwa DeepSpeed ​​yang dikembangkan oleh Microsoft meningkatkan efisiensi GPU hingga 4-6 kali lipat, memberikan kinerja tinggi bahkan pada perangkat keras lama. Dalam presentasi tersebut ditekankan bahwa jumlah token yang dihasilkan per transaksi meningkat berkat hal ini. 9 

 

Kesimpulan: Setelah meninggalkan Open Source Summit Japan 2025, saya kembali dengan sebuah visi yang sepenuhnya mengubah perspektif saya tentang profesi saya, bukan hanya dengan pengetahuan teknis baru di saku saya.

 

Salah satu hal yang paling membuat saya terkesan selama acara tersebut adalah luasnya area liputan dari... perangkat lunak open source (OSS)Saat ini, kekuatan open source dipercaya bahkan dalam proyek-proyek teknologi paling kritis dan canggih umat manusia, seperti... Stasiun Luar Angkasa Internasional (ISS), tidak hanya di situs web atau aplikasi seluler, sekali lagi mengingatkan saya akan tanggung jawab dan potensi pekerjaan yang kami lakukan.

Ekran Resmi 2026-03-16 10.39.07.png

Momen paling tak terlupakan bagi saya di konferensi tersebut adalah mendengarkan langsung Linus Torvalds, salah satu arsitek dunia perangkat lunak modern dan pencipta Linux dan Git. Mendengar pendekatannya terhadap teknologi dan visinya secara langsung memungkinkan saya untuk memahami filosofi besar di balik alat-alat dasar yang kita gunakan.

 

Pelajaran terbesar yang saya dapatkan dari pertemuan puncak ini adalah: Dunia perangkat lunak adalah samudra tak berujung, terbuka untuk pengembangan kapan saja dan selalu bergerak. Menjadi bagian dari ekosistem ini berarti tidak hanya menulis kode tetapi juga terus belajar dan berkontribusi kepada komunitas. Dinamisme profesi saya ini sangat memotivasi saya. Sekarang, saatnya untuk melanjutkan pekerjaan saya dengan lebih gigih dan cepat dengan inspirasi ini! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Kunjungan saya ke Jepang merupakan perwujudan rasa ingin tahu yang pertama kali berakar melalui budaya membaca dan berbagi pengetahuan yang dinamis yang didorong di Galaksiya. Motivasi utama saya memilih destinasi ini adalah untuk membenamkan diri dalam budaya dan warisan kuliner yang saya anggap sangat berbeda—hampir seperti dunia yang terpisah—dari budaya kita sendiri. Saya ingin keluar dari zona nyaman dan merasakan bagaimana rasanya menjadi "orang luar" di negeri yang penuh kontras, di mana setiap ritual dan cita rasa tampaknya berasal dari dimensi yang berbeda.

 

Namun, saat saya menjelajahi segala sesuatu mulai dari jalan-jalan besar Tokyo yang diterangi lampu neon hingga tempat makan tradisional yang tersembunyi di gang-gang sempit, saya mengalami sebuah kesadaran yang mendalam. Meskipun penyajian makanan yang teliti dan keheningan jalanan yang tenang awalnya terasa asing, saya segera menemukan esensi universal di balik permukaan itu. Berdiri di bawah bayang-bayang gedung pencakar langit modern dan menyaksikan seseorang menemukan kedamaian di sebuah kuil kuno, saya menyadari bahwa ekspresi ketulusan manusia di sana sama seperti di tanah air kita sendiri. Itu adalah pengingat yang kuat bahwa terlepas dari letak geografis, umat manusia bertemu pada nilai-nilai fundamental yang sama: kebaikan, kerja keras, keluarga, dan semangat berbagi.

Ekran Resmi 2026-03-16 10.41.49.png

 

Menyaksikan budaya penghormatan yang mengakar kuat dan "harmoni tak terlihat" di balik masyarakat yang beroperasi dengan ketelitian luar biasa mengubah pengamatan saya menjadi pelajaran yang lebih luas tentang kemanusiaan. Mengalami kedalaman budaya ini bersamaan dengan visi yang unik tersebut membantu saya memahami bahwa dunia dibentuk bukan hanya oleh struktur, tetapi juga oleh semangat dan disiplin manusia. Saya kembali dari perjalanan ini dengan wawasan yang tak terlupakan tentang bagaimana kita semua "satu" bahkan di belahan dunia lain—dan, tentu saja, beberapa foto berharga yang menangkap jiwa kota ini.
 

Sampai jumpa di pemberhentian kita selanjutnya.

Emre İZMİR

Insinyur DevOps Senior
Kesan dari Open Source Summit Japan 2025, Tokyo.
 

Referensi

  1. Masa depan AI berbasis agen tidak akan ditentukan oleh skala model... - Presentasi Open Source Summit AI_dev Track, 8-10 Desember 2025, Tokyo, Jepang. Tersedia di: https://ossjapan2025.sched.com/type/AI_dev

  2. Penyediaan GPU Dinamis di Kubernetes dengan Infrastruktur Terpisah yang Dapat Dikomposisikan - Jin Hase & Tsubasa Watanabe, Fujitsu Limited. Open Source Summit Japan 2025, Cloud & Containers Track. Tersedia di: https://github.com/CoHDI

  3. LLM (Learning Learning Management) Otomatis: Menjalankan Agen AI di Kubernetes - Annie Talvasto, Waovo/Upbound. Open Source Summit Japan 2025. Tersedia di: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Orkestrasi Infrastruktur dengan Crossplane 2.0 - Presentasi Upbound. Open Source Summit Jepang 2025. Tersedia di:(https://ossjapan2025.sched.com/event/29FnY)

  5. Dari Laboratorium ke Kehidupan Nyata: Evaluasi Sistem AI Praktis - Sharon Dashet & Vincent Caldeira, Presentasi Red Hat, Tokyo, Jepang. Tersedia di: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Pengambilan Vektor Terfederasi & Pengambilan Berbasis Kebijakan - Hiroki Ito & Shusuke Takahashi, NTT. Open Source Summit Japan 2025, AI_dev Track. Tersedia di: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Pidato Utama: Apa Selanjutnya untuk Agones? Tata Kelola Skala Planet - Ben Huston, Arsitek Utama Senior, Google Cloud. Open Source Summit Japan 2025, AI_dev Track. Tersedia di: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: Standar Terbuka untuk Pengemasan, Distribusi, dan Menjalankan LLM di Lingkungan Cloud Native - Presentasi Wenbo Qi & Chenyu Zhang, Ant Group. Open Source Summit Japan 2025. Tersedia di: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Pidato Utama: Pidato Kenegaraan - Presentasi Jim Zemlin, Direktur Eksekutif, The Linux Foundation. Open Source Summit Japan 2025. Tersedia di: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Strategi Data Sintetis Praktis untuk Sistem RAG/Agen - Kevin Noel, Uzabase - Presentasi Edge US. Open Source Summit Jepang 2025. Tersedia di: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us