• פרסם תאריך
    במרץ 16, 2026
  • שיתוף

מבוא: ארכיטקטורת מערכת, לא מודל

 

בעוד שהמרוץ אחר "מודלים גדולים יותר" בעולם הבינה המלאכותית מפנה את מקומו לדממה ביקורתית, עתיד המגזר סוכם במשפט אחד בוועידת הקוד הפתוח ביפן 2025:  "עתיד הבינה המלאכותית של Agentic לא יוגדר על ידי קנה המידה של המודל, אלא על ידי ארכיטקטורת המערכת." 

 

קביעה זו היא האינדיקטור הקונקרטי ביותר לכך שהמוקד עבר מאימון מודלים בלבד לתשתית התומכת ומגדילה מודלים אלה. הפסגה שנערכה בטוראנומון הילס, טוקיו, הוכיחה כיצד ענקיות כמו גוגל, פוג'יטסו והונדה אימצו קוד פתוח כ"בסיס אסטרטגי", וכמהנדס DevOps, הייתה לי הזדמנות לבחון את הנורמות החדשות בצומת שבין עולמות הבינה המלאכותית והתשתיות באתר.
מאמר זה מנתח את הקשר בין עולמות הבינה המלאכותית והתשתיות, תוך הסתמכות על תמונות שצילמתי באופן אישי באירוע, מפגשים טכניים בהם השתתפתי ונתונים שנאספו מהתוכנית הרשמית של קרן לינוקס.

Ekran Resmi 2026-03-16 09.52.28.png

 

נושאים מרכזיים

הדיונים הטכניים שבלטו בתוכנית הכנס והמצגות שבחנתי במקום רוכזו בצירים העיקריים הבאים מבחינת ניהול תשתיות מודרני:

 

א. ארכיטקטורת מערכת ופירוק חומרה

  • פירוק חומרה: כפי שפורט בסדנת "Dynamic GPU Provisioning" של Fujitsu, מעבר למבנה השרת המסורתי, איסוף CPU, GPU וזיכרון במאגר דינמי (Resource Pool) על ידי הסרתם ממארזי המחשב הפיזיים.
  • מפעלי בינה מלאכותית: הפיכת מרכזי נתונים למתקני ייצור שיכולים להגיב לדרישות המשתנות של עומסי עבודה של בינה מלאכותית במקום חוות שרתים סטטיות.

ב. פעולות סוכנות

  • ניהול תשתיות אוטונומיות: כפי שראינו בהדגמות על הבמה, המעבר ממבנה של כלים כמו Terraform ש"נעצרים במקרה של שגיאה" למבנים מבוססי "סוכן" שיכולים לנתח את השגיאה ולייצר פתרון.3 
  • לולאת משוב רציפה: ניטור מתמשך לא רק של פריסת מודלים של בינה מלאכותית, אלא גם של ביצועיהם בסביבה החיה.

ג. ניהול ואבטחת נתונים

  • גישה וקטורית מאוחדת: על פי הדיאגרמות הארכיטקטוניות ששותפו על ידי NTT ומציגים אחרים, מבנים שמעבדים נתונים באתר במקורות מבוזרים משלבים את התוצאות במקום להעביר אותן לאגם מרכזי.6 
  • מדיניות כקוד: קבלת החלטות דינמיות בנוגע לגישה לנתונים ברגע השאילתה על ידי מנועי גישה כמו OPA (Open Policy Agent). 6 

ד. עומסי עבודה קריטיים ומיוחדים

  • תזמור שרתי משחקים: כפי שמוצג במצגת של צוות קוד פתוח של גוגל באגונס, ניהול שרתי משחקים בעלי מצב (stateful) בקנה מידה עולמי על גבי Kubernetes.7 
  • לינוקס ברמת חלל: ניהול זרועות רובוטיות בתחנת החלל הבינלאומית באמצעות תוכנה בקוד פתוח, מוצג במצגת של GITAI.8 

דגשים מהכנס

א. ארכיטקטורת מערכת ופירוק חומרה

שחרור החומרה: CoHDI

אחת המושבים הטכניים הבולטים ביותר של הכנס הייתה הנאום שכותרתו "הקצאת GPU דינמית ב-Kubernetes" שהוצגו על ידי ג'ין האס וטסובאסה ווטאנאבה מצוות פוג'יטסו. הדיאגרמה האדריכלית שהוצגה על הבמה הסבירה את CoHDI (תשתית מורכבת ומפורקת) פרויקט כדלקמן:

 

Ekran Resmi 2026-03-16 09.57.20.png

 

  • מאגר משאבים מפורק: המעבד, הכרטיס הגרפי, הזיכרון וכרטיסי הרשת (NIC) מוסרים ממארזי השרתים הפיזיים ונאספים במאגר משותף.
  • מארג מתג PCIe/CXL: רכיבים אלה מחוברים זה לזה באמצעות מתגים במהירות גבוהה.
  • שילוב Kubernetes: כפי שניתן לראות בתרשים, Kubernetes מבקשת חומרה כאילו היא יוצרת Pod, והמערכת מרכיבה באופן מיידי את החומרה הזו כדי ליצור שרתי "Composed Baremetal".2 

אז למה כן CoHDI חשוב? לארכיטקטורה זו יש פוטנציאל להגדיל את יעילות השימוש ב-GPU מ-30% ל-80%.

 

תזמור תשתיות: Crossplane 2.0

 

מצגת חשובה נוספת באירוע הציגה את קרוספליין 2.0 ארכיטקטורה. הניטור המתמשך של הגדרות הצהרתיות ב-Git על ידי לולאת הבקרה Crossplane והפיכתן למשאבים אמיתיים ב-AWS, Azure או Google Cloud תמכו בחזון של תשתית "מרפאת עצמי". כמו כן, קרוספליין 2.0 כעת ניתן היה להריץ אותו בכל סביבות Kubernetes, לא רק עבור שירותי ענן, כמו ב-Crossplane גרסה 1. הודות לטכנולוגיה, היא אפשרה לכל מפתח להתקין טכנולוגיות פשוטות ללא עזרה. זו הייתה מצגת מרשימה מבחינת הצגת הנקודה שבה יגיעו תהליכי DevOps. 

ב. פעולות סוכנות

סוכן פעולות: זהו מנוע משוב מתמשך שמטרתו לסגור את פער המציאות ביניהם על ידי איחוד שלבי הפיתוח (לולאה פנימית) והיישום (לולאה חיצונית) של סוכני בינה מלאכותית. מבנה זה מוגדר כדיסציפלינה הנדסית של פלטפורמת בינה מלאכותית המשלבת מערכי נתונים שהוכנו במצב לא מקוון עם תצפיות מהסביבה החיה במערכת אקולוגית אחת, מה שמאפשר זיהוי שגיאות והכללת נתונים מהעולם האמיתי בחזרה לתהליכי בדיקה.5 

 

אנושי מול סוכן: אנני טלווסטו טענה בנאומה שמכונות יישארו לא שלמות בתהליכי DevOps כל עוד אין להן את המידע המצוי בבני אדם. לדוגמה, היא הזכירה שהמערכת עלולה להיות מנוהלת באופן לא שלם כאשר אין אפילו התכתבות רפה קטנה מעמית. היא הזכירה בפירוט במצגת שלה שכל המידע הזה צריך להימסר תחילה לסוכנים. 3 

 

קוד פתוח בחלל: תחנת החלל הבינלאומית ורובוטיקה

 

בתמונות שצולמו במושב בנושא מערכות קריטיות לבטיחות, תמונות של תחנת החלל הבינלאומית (ISS) ו GITAI זרוע רובוטית השתקפה על המסך הענק. לראות שמשתמשים בלינוקס בסביבה שבה אין מותרות לעשות טעויות בוואקום של החלל הייתה הוכחה לאמינות של קוד פתוח.8 

 

ג. ניהול ואבטחת נתונים

ג. ניהול ואבטחת נתונים

גישה מאוחדת לווקטורים בין ארגונים ו-OPA: בארגונים גדולים, נתונים מאוחסנים בדרך כלל במחלקות שונות או בחברות שותפות, בבסיסי נתונים וקטוריים שונים. איסוף נתונים אלה במרכז אחד קשה עקב תאימות לחוק, אבטחת נתונים וזכויות בעלות. המצגת שואפת לספק "אינטגרציה וירטואלית" מבלי להעתיק את הנתונים.

  • vLLM: משמש להמרת מטא-נתונים מורכבים ממקורות נתונים לסיכומים קצרים ומשמעותיים בשפה טבעית. הוא גם ממלא תפקיד כמנוע הסקה בעל ביצועים גבוהים בתהליכי הבנת שאילתות משתמשים ועיבוד תוצאות.
  • החלטות מדיניות: אחראי על ניהול והרשאת נתונים. כאשר משתמש יוזם שאילתה, OPA בודק בזמן ריצה האם למשתמש יש הרשאה לגשת למקור נתונים זה.
  • פרטים על מילבוס: פועל כ"קטלוג סמנטי". הוא מאחסן את המטא-דאטה הטכני והעסקי של מקורות נתונים בכל הארגונים בצורה וקטורית. כאשר מגיעה שאילתה, הוא מבצע את שלב החיפוש הראשון כדי לקבוע לאיזה ארגון עשויים להיות הנתונים הרלוונטיים.

מצגת זו מוכיחה כיצד ניתן להקים תשתית חיפוש מאובטחת ו"חכמה" בין ארגונים מבלי להעביר נתונים למיקום מרכזי, על ידי שילוב יכולת החיפוש הניתנת להרחבה של Milvus, כוח עיבוד השפה של vLLM ומדיניות האבטחה הגמישה של OPA.6 

 

הנדסת הקשר: הדובר קווין נואל טוען כי עידן "כתיבת הנחיה והמתנה לתשובה" הסתיים, ובמקום זאת, נכנסנו לעידן הנדסת ההקשר.

  • תואר שני במשפטים (LLM) הוא חסר מדינה: דוגמנים לא זוכרים אפילו את המשפט הקודם אלא אם כן מזכירים להם.
  • הקמת מדינה: כדי שבינה מלאכותית תיתן את התשובה הנכונה, עליכם להציג לה הכל בצורה נכונה באותו "רגע" (בדיוק בזמן). זוהי אמנות האיחוד של שיחות קודמות, מידע ממסמכים ופלט של כלים.

המצגת מראה כי יש לשלב את החלקים הבאים לצורך תגובה מוצלחת של בינה מלאכותית:

  • מידע רלוונטי (RAG): מידע שנאסף ממסמכים או מאגרי מידע פנימיים.
  • ניהול זיכרון: העדפות קודמות של המשתמש והיסטוריית שיחות לטווח קצר.
  • כלים חיצוניים: נתונים המגיעים מ-API או מכלי חישוב.
  • פקודות מערכת: כללים עיקריים הקובעים את אופייה ומשימתה של הבינה המלאכותית.

אי אפשר לבדוק ידנית מבנה מורכב שכזה (RAG + זיכרון + כלים). הדובר מציע את הפתרון הבא:

  • הערכה אוטומטית: אנחנו חייבים שבינה מלאכותית תייצר אלפי זוגות של "שאלה-תשובה" (נתונים סינתטיים) באמצעות הנתונים שיש לנו.
  • תרחישים מציאותיים: עלינו למדוד את חוסנה של המערכת על ידי יצירת משתמשים סינתטיים ששואלים שאלות שגויות או לא שלמות כמו משתמשים אמיתיים.

עלות ומהירות: אנו יכולים לדרג את הצלחת המערכת (דיוק, חוסר רלוונטיות, הזיות) תוך דקות בעזרת מערכי נתונים סינתטיים, במקום בדיקות שייקחו שבועות עבור בני אדם. 10 

ד. עומסי עבודה קריטיים ומיוחדים

תזמור שרת משחקים (Agones): בשקופית שכותרתה איך אגונס עובדת על ידי צוות קוד פתוח של גוגל, שותף תרשים זרימה על פני התשתית של A.R.C. Raiders משחק. בתרשים זה ניתן לראות בבירור שלאחר התאמה, שחקנים הוקצו לפודים בשם "Agones Game Server" ושרתים אלה נוהלו באמצעות אסטרטגיית "binpacking" (דחיסה) בקנה מידה עולמי. זה איפשר למפתחים להקדיש יותר זמן לפיתוח משחקים מבלי לחשוב על התשתית. זה גם מוכיח עד כמה חשוב תפקידו של Kubernetes כקוד פתוח בתעשיית המשחקים.

Ekran Resmi 2026-03-16 10.37.12.png

מהירות בהתפלגות מודלים: המצגת הראתה שמודלים נשמרים כעת ברישומים תואמי OCI כמו תמונות Docker ומחוברים ישירות (מורכבים) לפוד כמו דיסק הודות ל- מנהל התקן CSI דגםזה מבטל את הזמן הנדרש להעתקת ג'יגה-בייט של נתונים. רישום ה-OCI של Harbor משמש לפעולות אלו.8 

 

ביצועי הסקה: לפי ההערות והתמונות שצילמתי מהמפגש vLLM, טכנולוגיית PagedAttention הייתה המפתח לביצועים. טכנולוגיה זו מנהלת את זיכרון ה-GPU עם לוגיקת הזיכרון הווירטואלי במערכות הפעלה, מתגברת על צוואר הבקבוק של "Key-Value Cache" ומכפילה את קצב התפוקה. המצגת מזכירה גם ש-DeepSpeed ​​שפותחה על ידי מיקרוסופט מגדילה את יעילות ה-GPU פי 4-6, ומספקת ביצועים גבוהים גם על חומרה ישנה. מודגש במצגת שמספר האסימונים המיוצרים לכל תשלום עולה הודות לכך. 9 

 

סיכום: אני עוזב את פסגת הקוד הפתוח ביפן 2025, וחזר עם חזון שמשנה לחלוטין את נקודת המבט שלי על המקצוע שלי, לא רק עם ידע טכני חדש בכיס.

 

אחת הנקודות שהרשימו אותי ביותר לאורך האירוע הייתה רוחב אזור הכיסוי של תוכנת קוד פתוח (OSS)כיום, העובדה שכוחו של קוד פתוח זוכה לאמון אפילו בפרויקטים הטכנולוגיים הקריטיים והמתקדמים ביותר של האנושות, כמו תחנת החלל הבינלאומית (ISS), לא רק באתרי אינטרנט או אפליקציות מובייל, הזכירו לי שוב את האחריות והפוטנציאל של העבודה שאנחנו עושים.

Ekran Resmi 2026-03-16 10.39.07.png

הרגע הכי בלתי נשכח בפסגה עבורי היה להאזין בשידור חי ללינוס טורבאלדס, אחד מאדריכלי עולם התוכנה המודרני ויוצר לינוקס וגיט. שמיעת גישתו לטכנולוגיה וחזונו ממקור ראשון אפשרה לי להבין את הפילוסופיה העצומה שמאחורי הכלים הבסיסיים בהם אנו משתמשים.

 

הלקח הגדול ביותר שלמדתי מהפסגה הזו היה זה: עולם התוכנה הוא אוקיינוס ​​אינסופי, פתוח לפיתוח בכל רגע נתון ובתנועה מתמדת. להיות חלק מהמערכת האקולוגית הזו פירושו לא רק כתיבת קוד אלא גם למידה מתמדת ותרומה לקהילה. הדינמיות הזו של המקצוע שלי מדרבן אותי בצורה מדהימה. עכשיו, הגיע הזמן להמשיך את עבודתי בצורה הרבה יותר נחישות ומהירה עם ההשראה הזו! 👨‍💻✨

 

Ekran Resmi 2026-03-16 10.40.13.png

ביקורי ביפן היה התגשמות של סקרנות שהשתרשה לראשונה דרך התרבות התוססת של קריאה ושיתוף ידע שעודדו בגלקסיה. המוטיבציה העיקרית שלי לבחירת יעד זה הייתה לטבול את עצמי בתרבות ובמורשת קולינרית שתפסתי כשונות מהותית - כמעט עולם אחר - משלנו. רציתי לצאת מאזור הנוחות שלי ולחוות איך זה מרגיש להיות "אאוטסיידר" בארץ כה עצומה של ניגודיות, שבה כל טקס וטעם נראו כשייכים למימד אחר.

 

עם זאת, כשניוטתי בכל מקום, החל משדרותיה העצומות של טוקיו המוארות בניאון ועד למסעדות המסורתיות והחבויות בסמטאות צרות, חוויתי הבנה עמוקה. בעוד שההצגה הקפדנית של האוכל והדממה הסטואית של הרחובות הרגישו בתחילה זרות, עד מהרה גיליתי מהות אוניברסלית מתחת לפני השטח. בעמידה בצל גורד שחקים מודרני וצפיתי במישהו מוצא רגע של שלווה במקדש עתיק, הבנתי שהביטוי של כנות אנושית זהה שם כמו במולדתנו. זו הייתה תזכורת עוצמתית לכך שבלי קשר לגיאוגרפיה, האנושות מתכנסת סביב אותם ערכים בסיסיים: טוב לב, עבודה, משפחה ורוח השיתוף.

Ekran Resmi 2026-03-16 10.41.49.png

 

החזות בתרבות העמוקה של כבוד וב"הרמוניה הבלתי נראית" שמאחורי חברה הפועלת בדיוק כה מדהים הפכו את תצפיותיי לשיעור רחב יותר באנושות. חוויית העומק התרבותי הזה לצד חזון ייחודי שכזה עזרה לי להבין שהעולם מעוצב לא רק על ידי מבנים, אלא על ידי רוח האדם והמשמעת. אני חוזר מהמסע הזה עם תובנה בלתי נשכחת לגבי איך כולנו "אחד" אפילו בצד השני של הגלובוס - וכמובן, כמה תמונות יקרות ערך שלוכדות את נשמתה של העיר.
 

נתראה בתחנה הבאה שלנו.

אמרה איזמיר

מהנדס DevOps בכיר
רשמים מכנס קוד פתוח ביפן 2025, טוקיו.
 

הפניות

  1. עתיד הבינה המלאכותית הסוכנתית לא יוגדר על ידי קנה המידה של המודל... - מצגת מסלול פיתוח בינה מלאכותית בכנס קוד פתוח, 8-10 בדצמבר 2025, טוקיו, יפן. זמין ב: https://ossjapan2025.sched.com/type/AI_dev

  2. הקצאת GPU דינמית ב-Kubernetes עם תשתית מורכבת ומפורקת - ג'ין האס וצובאסה ווטאנאבה, פוג'יטסו בע"מ. פסגת קוד פתוח ביפן 2025, מסלול ענן ומכולות. זמין ב: https://github.com/CoHDI

  3. תואר שני במשפטים (LLM) על טייס אוטומטי: הפעלת סוכני בינה מלאכותית על Kubernetes - אנני טלווסטו, וואובו/אפבאונד. פסגת קוד פתוח יפן 2025. זמין ב: https://ossjapan2025.sched.com/event/29Fqz/llms-on-autopilot-running-ai-agents-on-kubernetes-with-open-source-tools-annie-talvasto-waovo

  4. תזמור תשתיות עם Crossplane 2.0 - מצגת עלייה. פסגת קוד פתוח יפן 2025. זמין ב:(https://ossjapan2025.sched.com/event/29FnY)

  5. ממעבדה לחיים: הערכה מעשית של מערכות בינה מלאכותית - שרון דאשט ווינסנט קלדיירה, מצגת רד האט, טוקיו, יפן. זמין ב: https://ossjapan2025.sched.com/event/29FnS/from-lab-to-life-practical-ai-system-evaluation-sharon-dashet-vincent-caldeira-red-hat

  6. אחזור וקטורים מאוחד ואחזור מודע למדיניות - הירוקי איטו ושוסוקה טקהאשי, NTT. פסגת קוד פתוח יפן 2025, מסלול פיתוח בינה מלאכותית. זמין ב: https://ossjapan2025.sched.com/event/29FpX/federated-vector-retrieval-across-organizations-with-milvus-opa-and-vllm-hiroki-ito-shusuke-takahashi-ntt

  7. הרצאה מרכזית: מה הלאה עבור אגונס? ממשל בקנה מידה עולמי בן יוסטון, ארכיטקט ראשי בכיר, גוגל קלאוד. פסגת קוד פתוח יפן 2025, מסלול פיתוח בינה מלאכותית. זמין ב: https://ossjapan2025.sched.com/event/2AHMX/keynote-whats-next-for-agones-planet-scale-governance-ben-huston-sr-principal-architect-google-cloud

  8. ModelPack: תקן פתוח לאריזה, הפצה והרצה של תוכניות לימודי משפטים בסביבת ענן מקורית - וונבו צ'י וצ'ניו ג'אנג, מצגת קבוצת אנט. פסגת קוד פתוח יפן 2025. זמין ב: https://ossjapan2025.sched.com/event/29FpF/modelpack-an-open-standard-for-packaging-distributing-and-running-llms-in-cloud-native-environment-wenbo-qi-chenyu-zhang-ant-group

  9. נאום מרכזי: מצב האומה - ג'ים זמלין, מנהל בכיר, מצגת קרן לינוקס. פסגת קוד פתוח יפן 2025. זמין בכתובת: https://ossjapan2025.sched.com/event/2AEuA/keynote-state-of-the-union-jim-zemlin-executive-director-the-linux-foundation

  10. אסטרטגיות מעשיות לנתונים סינתטיים עבור מערכות RAG/Agentic - קווין נואל, Uzabase - מצגת Edge US. פסגת קוד פתוח יפן 2025. זמין ב: https://ossjapan2025.sched.com/event/29FlW/practical-synthetic-data-strategies-for-ragagentic-systems-kevin-noel-uzabase-edge-us