"קטסטרופלי": תוסף ה-AI החדש והחשש לתקיפות חמורות

אנתרופיק שחררה השבוע תוסף בינה מלאכותית לכרום, הזמין כעת ל-1,000 נסיינים בלבד ומאפשר להיעזר בו תוך כדי גלישה • מומחים מזהירים כי הכלי עלול להפוך למטרה קלה לתקיפות prompt injction

אייל טירן
ד' אלול התשפ"ה 28.08.25 14:27

"קטסטרופלי": תוסף ה-AI החדש והחשש לתקיפות חמורות

גוגל צילום: FREEPIK

חברת הבינה המלאכותית אנתרופיק השיקה השבוע את "Claude for Chrome", תוסף דפדפן חדש המאפשר למודל ה-AI שלה לפעול בשם המשתמש ברשת. בשלב זה, הכלי זמין ל-1,000 נסיינים בלבד במסגרת תוכנית מחקר, אך כבר מעורר תהיות רבות סביב סוגיות האבטחה.

התוסף פועל בחלון צדדי בדפדפן, ומאפשר למשתמשים להיעזר בקלוד תוך כדי גלישה לניהול יומן, תזמון פגישות, ניסוח תשובות למיילים ואף טיפול בדוחות הוצאות. יכולות אלו נשענות על טכנולוגיית Computer Use, שהציגה אנתרופיק באוקטובר 2024, ומאפשרת למודל לצלם מסכים ואף לשלוט בסמן העכבר.

אלא שמומחים מזהירים כי הכלי עלול להפוך למטרה קלה לתקיפות "prompt injection" - שיטה שבה אתרים זדוניים מטמינים הוראות נסתרות המכוונות את ה-AI לבצע פעולות מזיקות. כך למשל, אתר תמים לכאורה יכול לגרום לקלוד למחוק הודעות דואר אלקטרוני של המשתמש בטענה של "תחזוקה שוטפת".

מבדיקות פנימיות שערכה החברה, שכללו 123 ניסויים ב-29 תרחישי תקיפה שונים, נמצא כי שיעור ההצלחה של ההתקפות עמד על 23.6% ללא הגנות. גם לאחר שהוטמעו מנגנוני בטיחות, בהם דרישה לאישור מפורש של המשתמש לפני פעולות רגישות וחסימת גישה לאתרים פיננסיים, ירד שיעור ההצלחה רק ל-11.2%.

סיימון וויליסון, חוקר עצמאי שטבע את המונח "prompt injection", הגדיר את התוצאות כ"קטסטרופליות". לדבריו, "בהיעדר פתרון המספק הגנה מלאה, קשה לדמיין מציאות שבה נכון לשחרר תוסף שכזה לציבור הרחב".