"קטסטרופלי": תוסף ה-AI החדש והחשש לתקיפות חמורות
אנתרופיק שחררה השבוע תוסף בינה מלאכותית לכרום, הזמין כעת ל-1,000 נסיינים בלבד ומאפשר להיעזר בו תוך כדי גלישה • מומחים מזהירים כי הכלי עלול להפוך למטרה קלה לתקיפות prompt injction
- אייל טירן
- ד' אלול התשפ"ה
חברת הבינה המלאכותית אנתרופיק השיקה השבוע את "Claude for Chrome", תוסף דפדפן חדש המאפשר למודל ה-AI שלה לפעול בשם המשתמש ברשת. בשלב זה, הכלי זמין ל-1,000 נסיינים בלבד במסגרת תוכנית מחקר, אך כבר מעורר תהיות רבות סביב סוגיות האבטחה.
התוסף פועל בחלון צדדי בדפדפן, ומאפשר למשתמשים להיעזר בקלוד תוך כדי גלישה לניהול יומן, תזמון פגישות, ניסוח תשובות למיילים ואף טיפול בדוחות הוצאות. יכולות אלו נשענות על טכנולוגיית Computer Use, שהציגה אנתרופיק באוקטובר 2024, ומאפשרת למודל לצלם מסכים ואף לשלוט בסמן העכבר.
אלא שמומחים מזהירים כי הכלי עלול להפוך למטרה קלה לתקיפות "prompt injection" - שיטה שבה אתרים זדוניים מטמינים הוראות נסתרות המכוונות את ה-AI לבצע פעולות מזיקות. כך למשל, אתר תמים לכאורה יכול לגרום לקלוד למחוק הודעות דואר אלקטרוני של המשתמש בטענה של "תחזוקה שוטפת".
מבדיקות פנימיות שערכה החברה, שכללו 123 ניסויים ב-29 תרחישי תקיפה שונים, נמצא כי שיעור ההצלחה של ההתקפות עמד על 23.6% ללא הגנות. גם לאחר שהוטמעו מנגנוני בטיחות, בהם דרישה לאישור מפורש של המשתמש לפני פעולות רגישות וחסימת גישה לאתרים פיננסיים, ירד שיעור ההצלחה רק ל-11.2%.
סיימון וויליסון, חוקר עצמאי שטבע את המונח "prompt injection", הגדיר את התוצאות כ"קטסטרופליות". לדבריו, "בהיעדר פתרון המספק הגנה מלאה, קשה לדמיין מציאות שבה נכון לשחרר תוסף שכזה לציבור הרחב".


הוספת תגובה
לכתבה זו טרם התפרסמו תגובות