چگونه حمله «سمی کردن» دادهها انجام میشود؟

این حمله با انتشار مقالات و پستهای جعلی یا آلوده در مکانهای عمومی اینترنت انجام میشود. این محتواها به مجموعه دادههایی تبدیل میشوند که در آموزش یا بهروزرسانی مدلها استفاده میشوند.

تأثیر «سمی کردن» دادهها بر روی هوش مصنوعی چیست؟

سمی کردن دادهها میتواند وابستگی به هوش مصنوعی را در وظایف حساس مانند پزشکی، قانونی و امنیتی تضعیف کند و خطرات گستردهای به همراه دارد زیرا قربانیان ممکن است به سرعت دستکاری را شناسایی نکنند.

چه اقداماتی برای مقابله با «سمی کردن» دادهها پیشنهاد شده است؟

محققان خواستار تشدید مکانیزمهای فیلتر و تأیید منابع داده، توسعه ابزارهایی برای شناسایی محتوای آلوده و تحمیل استانداردهای قوی برای شفافیت در فرآیندهای بهروزرسانی مدلهای هوش مصنوعی هستند.

چه سازمانهایی در این تحقیق شرکت داشتهاند؟

تیمهایی از مرکز هوش مصنوعی بریتانیا، مؤسسه آلن تورینگ و شرکت انتروپیک در این تحقیق مشارکت داشتهاند.

محققان هشدار می‌دهند: «سمی کردن» اینترنت رفتار مدل‌هایی مانند چت جی‌پی‌تی را تهدید می‌کند

Q: چرا محققان نگران «سمی کردن» اینترنت هستند؟

محققان نگرانند زیرا مدلهای هوش مصنوعی زبانی مانند چت جیپیتی و جیمینای میتوانند از طریق وارد کردن متون گمراهکننده در اینترنت دستکاری شوند، که این میتواند منجر به تولید محتوای نادرست یا مبهم شود.

محققان هشدار داده‌اند که مدل‌های هوش مصنوعی زبانی، مانند چت جی‌پی‌تی و جیمینای، می‌توانند از طریق وارد کردن متون گمراه‌کننده در اینترنت - که به آن «سمی کردن داده‌ها» گفته می‌شود - دستکاری شوند و این منجر به تولید محتوای نادرست یا مبهم می‌شود.

خلاصه نتایج

تیم‌هایی از مرکز هوش مصنوعی بریتانیا و مؤسسه آلن تورینگ و شرکت انتروپیک یک آزمایش آموزشی انجام دادند که نشان داد وارد کردن حدود ۲۵۰ سند آلوده کافی است تا بر خروجی‌های مدل‌ها تأثیر منفی بگذارد. پس از آن، مدل‌ها متون مبهم و غیرقابل اعتماد تولید کردند که نشان‌دهنده سهولت تأثیرگذاری عوامل مخرب بر رفتار سیستم‌ها است.

چگونه حمله انجام می‌شود؟

حمله بر اساس انتشار مقالات و پست‌های جعلی یا آلوده در مکان‌های عمومی در اینترنت (سایت‌های شخصی، وبلاگ‌ها، ویکی‌پدیا و غیره) است، بنابراین این مواد بخشی از مجموعه داده‌هایی می‌شوند که بعداً در آموزش یا به‌روزرسانی مدل‌ها استفاده می‌شود. به گفته محققان، ایجاد حدود ۲۵۰ مقاله آلوده ممکن است کافی باشد تا رفتار مدل را تغییر دهد.

چرا این موضوع خطرناک است؟

اکثر مدل‌ها بر روی داده‌های عمومی از اینترنت آموزش می‌بینند، بنابراین هر محتوای جعلی می‌تواند منبعی بالقوه برای یادگیری باشد.

سمی کردن داده‌ها وابستگی به هوش مصنوعی را در وظایف حساس (پزشکی، قانونی، امنیتی) تضعیف می‌کند.

حمله نسبتاً آسان برای اجرا است و خطرات آن گسترده است زیرا قربانیان ممکن است به سرعت دستکاری را شناسایی نکنند.

توصیه‌های محققان و آثار پیش‌بینی شده

محققان خواستار:

تشدید مکانیزم‌های فیلتر و تأیید منابع داده قبل از استفاده در آموزش.

توسعه ابزارهایی برای شناسایی محتوای آلوده و مکانیزم‌های پیگیری منبع داده.

تحمیل استانداردهای قوی برای شفافیت در فرآیندهای به‌روزرسانی مدل‌های هوش مصنوعی.

محققان اشاره می‌کنند که عدم اتخاذ اقدامات مؤثر ممکن است به کاهش وابستگی ایمن به هوش مصنوعی در زمینه‌های حیاتی منجر شود.

محققان هشدار می‌دهند: «سمی کردن» اینترنت رفتار مدل‌هایی مانند چت جی‌پی‌تی را تهدید می‌کند

اشتراک گذاری خبر

تگ‌ها

آخرین اخبار

اعتراف جدید بدولت فلسطین .. بلژیک به بریتانیا، کانادا و استرالیا ملحق می‌شود

نتایج یانصیب تگزاس ۳ سپتامبر ۲۰۲۵: اعداد پاوربال با جایزه ۱.۴ میلیارد دلار و نتایج پیک ۳ کامل

بستن پلتفرم Streameast: سقوط بزرگ‌ترین وب‌سایت پخش ورزشی غیرقانونی در جهان

ترامپ وضعیت اضطراری ویژه سوریه را برای یک سال دیگر تمدید کرد

وزارت کشور مصر ادعای "پیام‌های خودکشی" در زندان‌ها را رد کرد و تأکید کرد: هیچ اعتصابی و هیچ تلاش خودکشی وجود ندارد

اخبار مرتبط

نظارت بین‌المللی بر محتوای ... و کشورهایی که برای حفاظت از نوجوانان اقدام می‌کنند

چگونه ربات‌های چت بر ذهن انسان تأثیر می‌گذارند؟

محققان هشدار می‌دهند: «سمی کردن» اینترنت رفتار مدل‌هایی مانند چت جی‌پی‌تی را تهدید می‌کند

نویسندگان علیه "اپل" به اتهام استفاده از کتاب‌های دارای حق نشر برای توسعه هوش مصنوعی خود شکایت کردند