מהי ההזנה הרעילה של האינטרנט?

ההזנה הרעילה מתייחסת להכנסת טקסטים מטעה או מזוהמים לאימון מודלים של בינה מלאכותית, מה שמוביל ליצירת תוכן שגוי או מעורפל.

למה זה חשוב?

זה חשוב כי מודלים כמו צ'אט GPT מאומנים על נתונים ציבוריים מהאינטרנט, וכל תוכן מזויף יכול להשפיע לרעה על תוצאותיהם, במיוחד בתחומים רגישים.

מי מעורב במחקר הזה?

המחקר בוצע על ידי צוותים ממרכז הבינה המלאכותית הבריטי, מכון אלן טיורינג וחברת אינטרופיק.

מהן ההשפעות הצפויות של ההזנה הרעילה?

ההשפעות כוללות ירידה באמינות המודלים, במיוחד במשימות רגישות כמו רפואיות, משפטיות וביטחוניות.

מהן ההמלצות של החוקרים?

החוקרים ממליצים להחמיר את מנגנוני הסינון של מקורות הנתונים, לפתח כלים לזיהוי תוכן מזוהם ולהטיל סטנדרטים של שקיפות.

איך מתבצע ההתקפה על המודלים?

ההתקפה מתבצעת על ידי הפצת מאמרים ופוסטים מזויפים באינטרנט, כך שהחומרים הללו נכנסים לקבוצת הנתונים לאימון המודלים.

חוקרים מזהירים: "הזנה רעילה" של האינטרנט מאיימת על התנהגות מודלים כמו צ'אט GPT

חוקרים מזהירים כי מודלים של בינה מלאכותית לשונית, כמו צ'אט GPT וג'ימיני, עשויים להיות מופעלים על ידי הכנסת טקסטים מטעה באינטרנט – מה שמכונה "הזנת נתונים רעילה" – מה שמוביל ליצירת תוכן שגוי או מעורפל.

סיכום הממצאים

צוותים ממרכז הבינה המלאכותית הבריטי ומכון אלן טיורינג וחברת אינטרופיק ביצעו ניסוי הכשרה שהראה כי הכנסת כ-250 מסמכים מזוהמים מספיקה להשפיע לרעה על תוצאות המודלים. לאחר מכן, המודלים ייצרו טקסטים מעורפלים ולא מהימנים, מה שמראה את קלות השפעתם של גורמים זדוניים על התנהגות המערכות.

איך מתבצע ההתקפה?

ההתקפה מתבססת על הפצת מאמרים ופוסטים מזויפים או מזוהמים במקומות ציבוריים באינטרנט (אתרים אישיים, בלוגים, ויקיפדיה … וכו'), כך שהחומרים הללו הופכים לחלק מקבוצת הנתונים שמשתמשים בהם מאוחר יותר לאימון המודלים או לעדכון שלהם. לפי החוקרים, יצירת כ-250 מאמרים מזוהמים עשויה להיות מספיקה לשנות את התנהגות המודל.

למה זה מסוכן?

רוב המודלים מאומנים על נתונים ציבוריים מהאינטרנט, ולכן כל תוכן מזויף הופך למקור פוטנציאלי ללמידה.

הזנת נתונים רעילה מחלישה את התלות בבינה מלאכותית במשימות רגישות (רפואיות, משפטיות, ביטחוניות).

ההתקפה קלה יחסית לביצוע וסיכוניה נרחבים כי הקורבנות עשויים לא לגלות את המניפולציה במהירות.

המלצות החוקרים וההשפעות הצפויות

החוקרים קוראים ל:

להחמיר את מנגנוני הסינון והאימות של מקורות הנתונים לפני השימוש בהם באימון.

לפתח כלים לזיהוי תוכן מזוהם ומנגנוני מעקב אחרי מקור הנתונים.

להטיל סטנדרטים חזקים של שקיפות בתהליכי עדכון מודלי הבינה המלאכותית.

והחוקרים מציינים כי عدم اتخاذ إجراءات فعّילות עשוי להגביל את התלות הבטוחה בבינה מלאכותית בתחומים חיוניים.

חוקרים מזהירים: "הזנה רעילה" של האינטרנט מאיימת על התנהגות מודלים כמו צ'אט GPT

שתף חדשות

תגיות

חוקרים מזהירים: "הזנה רעילה" של האינטרנט מאיימת על התנהגות מודלים כמו צ'אט GPT

שתף חדשות

תגיות

חדשות קשורות

פיקוח בינלאומי על התוכן .. ומדינות פועלות להגן על קטינים

איך רובוטי צ'אט משפיעים על המוח האנושי?

חוקרים מזהירים: "הזנה רעילה" של האינטרנט מאיימת על התנהגות מודלים כמו צ'אט GPT

מחברים תובעים את "אפל" על שימוש בספרים מפרים לפיתוח הבינה המלאכותית שלה