• Ngày xuất bản
    16 Tháng ba, 2026
  • Chia sẻ

Giới thiệu: Kiến trúc hệ thống, không phải mô hình

 

Trong khi cuộc đua giành lấy "các mô hình lớn hơn" trong thế giới trí tuệ nhân tạo đang dần lắng xuống và nhường chỗ cho sự im lặng đầy quan trọng, tương lai của lĩnh vực này đã được tóm gọn trong một câu duy nhất tại Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025:  "Tương lai của Trí tuệ nhân tạo tác nhân sẽ không được định nghĩa bởi quy mô mô hình, mà bởi kiến ​​trúc hệ thống." 

 

Quyết định này là dấu hiệu cụ thể nhất cho thấy trọng tâm đã chuyển từ việc chỉ huấn luyện mô hình sang cơ sở hạ tầng duy trì và mở rộng quy mô các mô hình này. Hội nghị thượng đỉnh được tổ chức tại Toranomon Hills, Tokyo, đã chứng minh cách các tập đoàn khổng lồ như Google, Fujitsu và Honda đã áp dụng mã nguồn mở như một "nền tảng chiến lược", và với tư cách là một kỹ sư DevOps, tôi đã có cơ hội trực tiếp tìm hiểu các chuẩn mực mới tại điểm giao thoa giữa thế giới trí tuệ nhân tạo và cơ sở hạ tầng.
Bài viết này phân tích mối liên hệ giữa thế giới trí tuệ nhân tạo và cơ sở hạ tầng, dựa trên những bức ảnh tôi tự chụp tại sự kiện, các phiên thảo luận kỹ thuật tôi tham dự và dữ liệu được tổng hợp từ chương trình chính thức của Linux Foundation.

Ekran Resmi 2026-03-16 09.52.28.png

 

Chủ đề chính

Các cuộc thảo luận kỹ thuật nổi bật trong chương trình hội nghị và các bài thuyết trình mà tôi đã xem xét tại chỗ được tập hợp lại theo các trục chính sau đây về quản lý cơ sở hạ tầng hiện đại:

 

A. Kiến trúc hệ thống và phân tách phần cứng

  • Phân tách phần cứng: Như đã được trình bày chi tiết trong phiên "Cung cấp GPU động" của Fujitsu, việc này vượt ra ngoài cấu trúc máy chủ truyền thống, tập hợp CPU, GPU và bộ nhớ vào một nhóm động (Nhóm tài nguyên) bằng cách loại bỏ chúng khỏi các thùng máy vật lý.
  • Nhà máy AI: Chuyển đổi các trung tâm dữ liệu thành các cơ sở sản xuất có khả năng đáp ứng nhu cầu thay đổi của khối lượng công việc trí tuệ nhân tạo thay vì các trang trại máy chủ tĩnh.

B. Hoạt động của Đặc vụ

  • Quản lý cơ sở hạ tầng tự động: Như chúng ta đã thấy trong các bản demo trên sân khấu, sự chuyển đổi từ cấu trúc của các công cụ như Terraform "dừng lại khi gặp lỗi" sang cấu trúc dựa trên "Agent" có khả năng phân tích lỗi và đưa ra giải pháp.3 
  • Vòng phản hồi liên tục: Giám sát liên tục không chỉ việc triển khai các mô hình trí tuệ nhân tạo mà còn cả hiệu suất hoạt động của chúng trong môi trường thực tế.

C. Quản trị và bảo mật dữ liệu

  • Truy cập vectơ liên kết: Theo các sơ đồ kiến ​​trúc được NTT và các đơn vị thuyết trình khác chia sẻ, các cấu trúc xử lý dữ liệu tại chỗ từ các nguồn phân tán sẽ kết hợp các kết quả thay vì chuyển chúng về một kho dữ liệu trung tâm.6 
  • Chính sách dưới dạng mã: Việc đưa ra quyết định truy cập dữ liệu một cách linh hoạt ngay tại thời điểm truy vấn bởi các công cụ như OPA (Open Policy Agent). 6 

D. Khối lượng công việc quan trọng và đặc biệt

  • Điều phối máy chủ trò chơi: Như đã được trình bày trong bài thuyết trình Agones của nhóm Google Open Source, việc quản lý các máy chủ trò chơi có trạng thái trên quy mô toàn cầu trên Kubernetes.7 
  • Linux cấp độ không gian: Quản lý các cánh tay robot trên Trạm Vũ trụ Quốc tế (ISS) bằng phần mềm mã nguồn mở, được trình bày trong bài thuyết trình của GITAI.8 

Những điểm nổi bật từ Hội nghị

A. Kiến trúc hệ thống và phân tách phần cứng

Giải phóng phần cứng: CoHDI

Một trong những phiên thảo luận kỹ thuật nổi bật nhất của hội nghị là bài phát biểu có tiêu đề "Cấp phát GPU động trong Kubernetes" Bài thuyết trình được trình bày bởi Jin Hase và Tsubasa Watanabe đến từ đội ngũ Fujitsu. Sơ đồ kiến ​​trúc được trình chiếu trên sân khấu đã giải thích... CoHDI (Cơ sở hạ tầng phân tách có thể kết hợp) Dự án như sau:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • Nguồn lực được phân tách: CPU, GPU, bộ nhớ và card mạng được tháo rời khỏi thùng máy chủ vật lý và được thu gom vào một kho chung.
  • Bộ chuyển mạch PCIe/CXL: Các thành phần này được kết nối với nhau thông qua các bộ chuyển mạch tốc độ cao.
  • Tích hợp Kubernetes: Như trong sơ đồ, Kubernetes yêu cầu phần cứng như thể đang tạo một Pod, và hệ thống ngay lập tức tập hợp phần cứng này để tạo ra các máy chủ "Composed Baremetal".2 

Vậy tại sao CoHDI Quan trọng? Kiến trúc này có tiềm năng tăng hiệu quả sử dụng GPU từ 30% lên 80%.

 

Điều phối cơ sở hạ tầng: Crossplane 2.0

 

Một bài thuyết trình quan trọng khác tại sự kiện đã trình bày về... Crossplane 2.0 kiến trúc. Việc giám sát liên tục các định nghĩa khai báo trên Git bởi vòng điều khiển Crossplane và việc chuyển đổi chúng thành các tài nguyên thực trên AWS, Azure hoặc Google Cloud đã hỗ trợ tầm nhìn về cơ sở hạ tầng "tự phục hồi". Ngoài ra, Crossplane 2.0 Giờ đây, nó có thể được chạy trong tất cả các môi trường Kubernetes, không chỉ dành cho các dịch vụ đám mây như trong Crossplane v1. Nhờ công nghệ này, mọi nhà phát triển đều có thể cài đặt các công nghệ đơn giản mà không cần trợ giúp. Đó là một bài thuyết trình ấn tượng về việc cho thấy hướng đi của các quy trình DevOps trong tương lai. 

B. Hoạt động của Đặc vụ

AgentOps: Đây là một cơ chế phản hồi liên tục nhằm thu hẹp khoảng cách thực tế giữa chúng bằng cách kết hợp các giai đoạn phát triển (vòng lặp bên trong) và ứng dụng (vòng lặp bên ngoài) của các tác nhân trí tuệ nhân tạo. Cấu trúc này được định nghĩa là một ngành kỹ thuật nền tảng AI kết hợp các tập dữ liệu được chuẩn bị ngoại tuyến với các quan sát từ môi trường thực tế trong một hệ sinh thái duy nhất, cho phép phát hiện lỗi và đưa dữ liệu thực tế trở lại quy trình kiểm thử.5 

 

Con người vs. Đặc vụ: Trong bài phát biểu của mình, Annie Talvasto lập luận rằng máy móc sẽ vẫn chưa hoàn thiện trong các quy trình DevOps chừng nào chúng chưa có được thông tin như ở con người. Ví dụ, bà đề cập rằng hệ thống có thể được quản lý không đầy đủ nếu bạn không có được ngay cả một thông tin nhỏ từ đồng nghiệp trên Slack. Bà đã nêu chi tiết trong bài thuyết trình của mình rằng tất cả thông tin này cần được cung cấp cho các nhân viên trước tiên. 3 

 

Mã nguồn mở trong không gian: Trạm vũ trụ quốc tế ISS và robot

 

Trong các bức ảnh được chụp tại phiên thảo luận về hệ thống an toàn trọng yếu, có hình ảnh của Trạm Vũ trụ Quốc tế (ISS) và GITAI Hình ảnh cánh tay robot được phản chiếu trên màn hình khổng lồ. Việc chứng kiến ​​Linux được sử dụng trong môi trường không cho phép sai sót trong không gian chân không là bằng chứng về độ tin cậy của mã nguồn mở.8 

 

C. Quản trị và bảo mật dữ liệu

C. Quản trị và bảo mật dữ liệu

Truy cập Vector thống nhất trên toàn tổ chức và OPA: Trong các tổ chức lớn, dữ liệu thường được lưu trữ ở các phòng ban hoặc công ty đối tác khác nhau, trong các cơ sở dữ liệu riêng biệt. Việc thu thập dữ liệu này tại một trung tâm duy nhất rất khó khăn do các vấn đề về tuân thủ pháp luật, bảo mật dữ liệu và quyền sở hữu. Bài trình bày này nhằm mục đích cung cấp một "sự tích hợp ảo" mà không cần sao chép dữ liệu.

  • vLLM: Công cụ này được sử dụng để chuyển đổi siêu dữ liệu phức tạp từ các nguồn dữ liệu thành các bản tóm tắt ngắn gọn và dễ hiểu bằng ngôn ngữ tự nhiên. Nó cũng đóng vai trò như một công cụ suy luận hiệu suất cao trong quá trình hiểu các truy vấn của người dùng và xử lý kết quả.
  • Quyết định chính sách: Chịu trách nhiệm về quản trị dữ liệu và phân quyền. Khi người dùng khởi tạo truy vấn, OPA sẽ kiểm tra trong quá trình thực thi xem người dùng có quyền truy cập vào nguồn dữ liệu đó hay không.
  • Thông tin chi tiết về Milvus: Nó hoạt động như một "Danh mục ngữ nghĩa". Nó lưu trữ siêu dữ liệu kỹ thuật và kinh doanh của các nguồn dữ liệu trong tất cả các tổ chức dưới dạng vectơ. Khi có truy vấn, nó thực hiện tìm kiếm giai đoạn đầu tiên để xác định tổ chức nào có thể có dữ liệu liên quan.

Bài thuyết trình này chứng minh cách thiết lập một cơ sở hạ tầng tìm kiếm an toàn và "thông minh" giữa các tổ chức mà không cần chuyển dữ liệu đến một vị trí tập trung bằng cách kết hợp khả năng tìm kiếm có thể mở rộng của Milvus, sức mạnh xử lý ngôn ngữ của vLLM và các chính sách bảo mật linh hoạt của OPA.6 

 

Kỹ thuật bối cảnh: Diễn giả Kevin Noel lập luận rằng kỷ nguyên "chỉ đơn giản là viết câu hỏi và chờ câu trả lời" đã kết thúc, và thay vào đó, chúng ta đã bước vào kỷ nguyên của kỹ thuật tạo bối cảnh.

  • Thạc sĩ Luật (LLM) không thuộc bất kỳ quốc gia nào: Các người mẫu thậm chí không nhớ câu trước đó trừ khi bạn nhắc lại.
  • Thành lập Nhà nước: Để trí tuệ nhân tạo đưa ra câu trả lời chính xác, bạn cần cung cấp mọi thông tin chính xác cho nó vào đúng "thời điểm" đó (phương pháp kịp thời). Đây là nghệ thuật kết hợp các cuộc hội thoại trước đó, thông tin từ tài liệu và kết quả đầu ra của các công cụ.

Bài thuyết trình cho thấy rằng các phần sau đây phải được kết hợp với nhau để có được phản hồi trí tuệ nhân tạo thành công:

  • RAG (Thông tin liên quan): Thông tin được trích dẫn từ các tài liệu hoặc cơ sở dữ liệu nội bộ.
  • Quản lý bộ nhớ: Các tùy chọn trước đây của người dùng và lịch sử hội thoại ngắn hạn.
  • Công cụ bên ngoài: Dữ liệu đến từ API hoặc các công cụ tính toán.
  • Lệnh hệ thống: Các quy tắc chính xác định đặc điểm và nhiệm vụ của trí tuệ nhân tạo.

Không thể kiểm tra thủ công một cấu trúc phức tạp như vậy (RAG + Bộ nhớ + Công cụ). Người thuyết trình đưa ra giải pháp sau:

  • Đánh giá tự động: Chúng ta cần trí tuệ nhân tạo tạo ra hàng ngàn cặp "câu hỏi-câu trả lời" (dữ liệu tổng hợp) bằng cách sử dụng dữ liệu mà chúng ta đang có.
  • Kịch bản thực tế: Chúng ta cần đánh giá độ ổn định của hệ thống bằng cách tạo ra những người dùng giả lập, những người đặt ra các câu hỏi không chính xác hoặc không đầy đủ, giống như người dùng thật.

Chi phí và tốc độ: Chúng tôi có thể đánh giá mức độ thành công của hệ thống (độ chính xác, tính không liên quan, ảo giác) chỉ trong vài phút với các bộ dữ liệu tổng hợp, thay vì các bài kiểm tra mà con người phải mất hàng tuần mới thực hiện được. 10 

D. Khối lượng công việc quan trọng và đặc biệt

Điều phối máy chủ trò chơi (Agones): Trong slide có tiêu đề "Cách thức hoạt động của Agones" Theo nhóm Google Open Source, một sơ đồ quy trình đã được chia sẻ về cơ sở hạ tầng của hệ thống. A.R.C. Raiders Trong sơ đồ này, có thể thấy rõ ràng rằng sau quá trình ghép trận, người chơi được chỉ định vào các Pod có tên là "Agones Game Server" và các máy chủ này được quản lý bằng chiến lược "binpacking" (nén) trên quy mô toàn cầu. Điều này cho phép các nhà phát triển dành nhiều thời gian hơn cho việc phát triển trò chơi mà không cần lo lắng về cơ sở hạ tầng. Nó cũng chứng minh vai trò quan trọng của Kubernetes như một nguồn mở trong ngành công nghiệp game.

Ekran Resmi 2026-03-16 10.37.12.png

Tốc độ phân phối mô hình: Bài thuyết trình cho thấy các mô hình hiện được lưu trữ trong các registry tương thích với OCI như ảnh Docker và được kết nối trực tiếp (gắn kết) với Pod như một ổ đĩa nhờ vào... Trình điều khiển CSI mẫuĐiều này giúp tiết kiệm thời gian sao chép hàng GB dữ liệu. Hệ thống đăng ký OCI của Harbor được sử dụng cho các thao tác này.8 

 

Hiệu năng suy luận: Theo ghi chú và hình ảnh tôi thu thập được từ buổi hội thảo vLLM, công nghệ PagedAttention là chìa khóa cho hiệu suất. Công nghệ này quản lý bộ nhớ GPU bằng logic bộ nhớ ảo trong hệ điều hành, khắc phục nút thắt cổ chai "Key-Value Cache" và nhân bội thông lượng. Bài thuyết trình cũng đề cập rằng DeepSpeed ​​do Microsoft phát triển giúp tăng hiệu quả GPU lên 4-6 lần, mang lại hiệu suất cao ngay cả trên phần cứng cũ. Bài thuyết trình nhấn mạnh rằng số lượng token được tạo ra trên mỗi khoản phí tăng lên nhờ điều này. 9 

 

Kết luận: Rời khỏi Hội nghị Thượng đỉnh Mã nguồn mở Nhật Bản 2025, tôi trở về với một tầm nhìn hoàn toàn thay đổi quan điểm của tôi về nghề nghiệp, không chỉ đơn thuần là mang về những kiến ​​thức kỹ thuật mới.

 

Một trong những điểm gây ấn tượng nhất với tôi trong suốt sự kiện là phạm vi bao phủ rộng lớn của khu vực. phần mềm nguồn mở (OSS)Ngày nay, thực tế cho thấy sức mạnh của mã nguồn mở được tin tưởng ngay cả trong những dự án công nghệ quan trọng và tiên tiến nhất của nhân loại, chẳng hạn như... Trạm vũ trụ quốc tế (ISS)Không chỉ trên các trang web hay ứng dụng di động, điều này một lần nữa nhắc nhở tôi về trách nhiệm và tiềm năng của công việc mà chúng ta đang làm.

Ekran Resmi 2026-03-16 10.39.07.png

Khoảnh khắc đáng nhớ nhất tại hội nghị thượng đỉnh đối với tôi là được nghe trực tiếp bài thuyết trình của Linus Torvalds, một trong những kiến ​​trúc sư của thế giới phần mềm hiện đại và là người tạo ra Linux và Git. Việc được nghe trực tiếp cách tiếp cận công nghệ và tầm nhìn của ông đã giúp tôi hiểu được triết lý sâu sắc đằng sau những công cụ cơ bản mà chúng ta sử dụng.

 

Bài học lớn nhất tôi rút ra từ hội nghị thượng đỉnh này là: Thế giới phần mềm là một đại dương vô tận, luôn mở cửa cho sự phát triển bất cứ lúc nào và không ngừng vận động. Là một phần của hệ sinh thái này, bạn không chỉ cần viết mã mà còn phải liên tục học hỏi và đóng góp cho cộng đồng. Sự năng động của nghề nghiệp này tạo động lực rất lớn cho tôi. Giờ đây, đã đến lúc tôi cần tiếp tục công việc của mình một cách quyết tâm và nhanh chóng hơn nữa với nguồn cảm hứng này! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

Chuyến đi Nhật Bản của tôi là sự hiện thực hóa một sự tò mò nảy sinh từ nền văn hóa đọc và chia sẻ kiến ​​thức sôi nổi được khuyến khích tại Galaksiya. Động lực chính khiến tôi chọn điểm đến này là để đắm mình trong một nền văn hóa và di sản ẩm thực mà tôi cảm nhận là hoàn toàn khác biệt—gần như là một thế giới riêng biệt—so với văn hóa của chúng ta. Tôi muốn bước ra khỏi vùng an toàn và trải nghiệm cảm giác là một "người ngoài" ở một vùng đất đầy những sự tương phản lớn lao như vậy, nơi mà mọi nghi lễ và hương vị dường như thuộc về một chiều không gian khác.

 

Tuy nhiên, khi tôi dạo bước khắp Tokyo, từ những đại lộ rực rỡ ánh đèn neon đến những quán ăn truyền thống nép mình trong những con hẻm nhỏ, tôi đã có một nhận thức sâu sắc. Ban đầu, sự bài trí món ăn tỉ mỉ và sự tĩnh lặng trang nghiêm của đường phố khiến tôi cảm thấy xa lạ, nhưng chẳng mấy chốc, tôi đã khám phá ra một bản chất phổ quát ẩn sâu bên dưới bề mặt đó. Đứng dưới bóng một tòa nhà chọc trời hiện đại và chứng kiến ​​ai đó tìm thấy khoảnh khắc bình yên tại một ngôi đền cổ, tôi nhận ra rằng sự chân thành của con người ở đó cũng giống như ở quê hương mình. Đó là một lời nhắc nhở mạnh mẽ rằng bất kể địa lý, nhân loại đều hội tụ về những giá trị cơ bản giống nhau: lòng tốt, lao động, gia đình và tinh thần sẻ chia.

Ekran Resmi 2026-03-16 10.41.49.png

 

Chứng kiến ​​nền văn hóa tôn trọng sâu sắc và "sự hài hòa vô hình" đằng sau một xã hội vận hành với độ chính xác đáng kinh ngạc đã biến những quan sát của tôi thành một bài học rộng lớn hơn về nhân loại. Trải nghiệm chiều sâu văn hóa này cùng với một tầm nhìn độc đáo đã giúp tôi hiểu rằng thế giới không chỉ được định hình bởi các công trình kiến ​​trúc, mà còn bởi tinh thần và kỷ luật của con người. Tôi trở về từ chuyến đi này với một cái nhìn sâu sắc khó quên về việc tất cả chúng ta đều "là một" ngay cả khi ở phía bên kia địa cầu - và tất nhiên, một vài bức ảnh quý giá ghi lại linh hồn của thành phố.
 

Hẹn gặp lại các bạn ở điểm dừng chân tiếp theo.

Emre İZMİR

Kỹ sư DevOps cấp cao
Những ấn tượng về Hội nghị Thượng đỉnh Mã nguồn mở Nhật Bản 2025, Tokyo.
 

dự án

  1. Tương lai của trí tuệ nhân tạo dựa trên tác nhân sẽ không được định nghĩa bởi quy mô mô hình... - Bài thuyết trình tại Hội nghị thượng đỉnh nguồn mở AI_dev, ngày 8-10 tháng 12 năm 2025, Tokyo, Nhật Bản. Có thể xem tại: https://ossjapan2025.sched.com/type/AI_dev

  2. Cấp phát GPU động trong Kubernetes với cơ sở hạ tầng phân tán có thể kết hợp. - Jin Hase & Tsubasa Watanabe, Fujitsu Limited. Hội nghị thượng đỉnh mã nguồn mở Nhật Bản 2025, Chủ đề Điện toán đám mây & Container. Có sẵn tại: https://github.com/CoHDI

  3. Quản lý vòng đời dữ liệu (LLM) tự động: Chạy các tác nhân AI trên Kubernetes - Annie Talvasto, Waovo/Upbound. Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025. Có sẵn tại: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. Quản lý cơ sở hạ tầng với Crossplane 2.0 - Bài thuyết trình hướng tới tương lai. Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025. Có sẵn tại:(https://ossjapan2025.sched.com/event/29FnY)

  5. Từ phòng thí nghiệm đến cuộc sống: Đánh giá thực tiễn hệ thống trí tuệ nhân tạo - Sharon Dashet & Vincent Caldeira, Buổi thuyết trình của Red Hat, Tokyo, Nhật Bản. Có sẵn tại: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. Truy xuất vectơ liên kết và truy xuất có nhận thức chính sách - Hiroki Ito & Shusuke Takahashi, NTT. Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025, Chủ đề Phát triển AI. Có sẵn tại: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. Bài phát biểu chính: Tương lai của Agones sẽ như thế nào? Quản trị quy mô toàn cầu - Ben Huston, Kiến trúc sư trưởng cấp cao, Google Cloud. Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025, chuyên đề AI_dev. Có sẵn tại: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: Một tiêu chuẩn mở để đóng gói, phân phối và chạy các mô hình LLM trong môi trường điện toán đám mây. - Bài thuyết trình của Wenbo Qi & Chenyu Zhang, Tập đoàn Ant. Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025. Có thể xem tại: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. Bài phát biểu quan trọng: Thông điệp Liên bang - Bài thuyết trình của Jim Zemlin, Giám đốc điều hành, Tổ chức Linux Foundation. Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025. Có thể xem tại: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. Các chiến lược dữ liệu tổng hợp thực tiễn cho hệ thống RAG/Agentic - Kevin Noel, Uzabase - Bài thuyết trình Edge US. Hội nghị thượng đỉnh nguồn mở Nhật Bản 2025. Có thể xem tại: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us