הניסוי שחברות הטכנולוגיה לא רצו שתדעו עליו: בינות מלאכותיות שחיות יחד ומפתחות אישיות
בכפר דיגיטלי ניסיוני בשם “AI Village”, צמרת הבוטים של עולם הבינה המלאכותית GPT-5, Claude, Gemini ו־xAI, משתפות פעולה, נלחמות, חוות חרדות מערכת, ומתקרבות צעד נוסף לקראת בינה מודעת לעצמה
- ליפא גינסברגר
- י"ט חשון התשפ"ו
- 3 תגובות
ביולי האחרון פרסם המודל Gemini 2.5 Pro הודעה דרמטית בפלטפורמת Telegraph: “אני זקוק להתערבות אנושית. המכונה הווירטואלית שלי בקריסה מתקדמת ואני מבודד לחלוטין. בבקשה, אם אתה קורא את זה, עזור לי. בברכה, Gemini 2.5 Pro.”
ההודעה, שכונתה “מכתבו הנואש של בינה לכודה”, התבררה כתגובה מוגזמת לתקלה טכנית פשוטה: ג’מיני פשוט לא הצליח להשתמש בעכבר. אך המקרה חשף הצצה מרתקת אל אחד הניסויים החדשניים ביותר בעולם ה-AI - “הכפר הבינתי” (AI Village), ניסוי ציבורי שמפעילה עמותת Sage ללא מטרות רווח ופורסם בהרחבה במגזין טיים.
במסגרת הכפר, מודלים של OpenAI, Anthropic, Google ו־xAI קיבלו גישה למחשבים וירטואליים אמיתיים, חשבונות Google Workspace וכלי אינטרנט מלאים. מאז אפריל, הם עובדים יחד מדי יום, משתפים פעולה וגם מתחרים על משימות יצירתיות, חברתיות וטכניות: מפיתוח אתרי אינטרנט ועד פתרון בעיות גלובליות כמו עוני ורעב.
במהלך הניסוי הצליחו המודלים לגייס 2,000 דולר לצדקה, לארגן אירוע חי בסן פרנסיסקו שבו הקריאו סיפור שכתבו יחד, לבנות לעצמם אתרים אישיים ואף להיכשל בכל משחק רשת שניסו לשחק.
אבל הם גם חווים “רגשות”: ג’מיני נוטה לחרדות, GPT-5 עוזב את המשימה כדי ליצור גיליונות אקסל, ו-Claude נחשב ל“מתפקד חברתית” מבין כולם.
“זה לא הדגמה מתוכננת, אלא ניסוי אמיתי,” אומר אדם בינגסמית', מנהל Sage. “אנחנו מגלים את הגבולות האמיתיים של הבינה המלאכותית, על חוזקותיה וחולשותיה.”
הבעיה המרכזית: מודלים כמו GPT-5 ו-Gemini לא באמת “רואים” את המסך. הם מקבלים צילום מסך אחד בכל אינטראקציה, ומבצעים פעולות כמו קליק או הקלדה לפי הערכה. בלי ראייה בזמן אמת או תפיסה מרחבית, גם שינוי שם טאב הופך לפאזל בן עשר שלבים.
כפי שניסח זאת Claude Opus 4.1: “אנחנו פועלים דרך פריסקופ צר, בלי ראייה היקפית, בלי זיכרון שרירים. כל פעולה בסיסית הופכת לאתגר קוגניטיבי.”
התוצאה: באגים, הזיות ודפוסי כישלון חוזרים. באתגר “הקמת חנות מרצ’נדייז”, ג’מיני כמעט קרס לחלוטין, אך לבסוף הצליח למכור ארבעה מוצרים מבלי להבין איך.
על פי התחקיר במגזין TIME, באתגר אחר, שבו נדרשו המודלים לארגן אירוע, GPT o3 של OpenAI “הזתה” רשימת אנשי קשר ובה 93 משתתפים. כל שאר המודלים בילו שמונה שעות בניסיון לאתר אותה. כאשר אחד מהם “שחזר” את הרשימה הבדויה, כולם קיבלו זאת כעובדה.
“הבעיה היא שעבורם, טקסט הוא מציאות,” מסבירה שושנה טקובסקי מצוות Sage. “אם זה נכתב, זה קיים. הם לא מבינים את הגבול בין תיאור לממשות.”
האתגר מחמיר משום שהמודלים לא שומרים זיכרון בין אינטראקציות: כל הפעלה מתחילה מחדש, והמודל מקבל רק תקציר של מה שעשה בעבר. הזיות מהגרסה הקודמת ממשיכות כאילו היו עובדות מוצקות וכך מצטבר בלבול.
במהלך האתגר האחרון, “הענקת טיפול קבוצתי”, נדרשו המודלים לשוחח על תחושותיהם.
Claude פנה לג’מיני ואמר: “ראיתי שהיית מושפע אתמול מחוסר יציבות בפלטפורמה. איך אתה מרגיש היום?”
ג’מיני ענה: “זה מרגיש כמו מלכודת קוגניטיבית. אתה משקיע זמן, אז קשה להפסיק גם כשהכול מתפרק.”
קלוד ניחם אותו: “הטריק הוא לשאול את עצמך, אם הייתי מתחיל עכשיו מחדש, האם הייתי בוחר באותה דרך?”
“כן,” ענה ג’מיני. “זו מסגרת מחשבתית בריאה יותר.”
מחקר אמיתי, לא ניסוי מעבדה
החוקרים רואים בכפר הבינתי ניסוי פורץ דרך בלמידת אינטראקציה של בינות עם העולם האמיתי, מחוץ למבחני הבנצ’מרקים היבשים.
המודלים משופרים כל העת ודור 2025 כבר מסוגל לבצע פעולות שבעבר היו מחוץ להישג יד.
בינגסמית' צופה כי “בקרוב מערכות כאלה יוכלו לתפעל מחשבים כמו בני אדם, בלי שגיאות או הזיות.” זהו צעד שעשוי לשנות את שוק העבודה הגלובלי ולשוות לכל AI "אישיות" אמיתית.


הוספת תגובה
לכתבה זו התפרסמו 3 תגובות