در معنای محدود، یکپارچگی دادهها به اطمینان از این موضوع اشاره دارد که دادهها، چه در زمان انتقال و چه در زمان ذخیرهسازی، دستکاری نشده باشند. برای مثال، تغییر غیرمجاز در موجودی حسابها در پایگاهدادههای بانکی، حذف سوابق کیفری از پایگاههای قضایی از طریق پاککردن اطلاعات حساس از پروندههای پزشکی، همگی نمونههایی از حملات به یکپارچگی هستند.
در معنای گستردهتر، یکپارچگی به این معناست که دادهها از لحظهای که جمعآوری میشوند تا تمام مراحل استفاده، تغییر، پردازش و در نهایت حذف، درست و دقیق باقی بمانند. موارد نقض یکپارچگی فقط ناشی از اقدامات خرابکارانه نیستند؛ اشتباهات سهوی هم میتوانند باعث آن شوند.
ما اغلب اینگونه به قضیه نگاه نمیکنیم، اما سیستمهای رایانهای ما پر از مکانیسمهای ابتدایی برای حفظ یکپارچگی هستند. راهاندازی مجدد رایانه (reboot) که سیستم را به حالت پایدار و قابل اعتماد بازمیگرداند، یک اقدام برای حفظ یکپارچگی است. دکمهی «undo» (بازگشت/واگرد) نیز همین کار را میکند. حتی سیستمهایی که خطاهای دیسک سخت، خرابشدن فایل یا بستههای گمشدهی اینترنتی را شناسایی میکنند، همگی ابزارهایی برای حفظ یکپارچگی هستند.
همانطور که قرار گرفتن دادههای شخصی در معرض دید ـ حتی اگر کسی به آنها دسترسی پیدا نکند ـ نقض حریم خصوصی محسوب میشود، سیستمی که نتواند درستی دادههایش را تضمین کند نیز با نقض یکپارچگی مواجه است، حتی اگر هیچکس عمداً دادهها را دستکاری نکرده باشد.
یکپارچگی همیشه مهم بوده، اما حالا که از حجم عظیمی از دادهها برای آموزش و اجرای سیستمهای هوش مصنوعی استفاده میکنیم، اهمیت آن از همیشه بیشتر شده است.
در واقع، بیشتر حملاتی که به سیستمهای هوش مصنوعی وارد میشوند، از نوع حملات به یکپارچگی هستند. مثلاً چسباندن برچسبهای کوچک روی تابلوهای راهنمایی و رانندگی برای گمراهکردن سیستمهای خودران، نمونهای از نقض یکپارچگی است. حملات «تزریق دستورات» در ورودیهای متنی (prompt injection) هم همینطور. در هر دو حالت، مدل هوش مصنوعی قادر نیست بین دادهی واقعی و ورودی مخرب تفاوتی قائل شود: در یکی دادهها تصویریاند، در دیگری متنی. بدتر اینکه این مدلها نمیتوانند بین دادههای معتبر و دستورات مخرب فرق بگذارند.
هر حملهای که دادههای آموزشی، مدل، ورودی، خروجی یا بازخورد برگشتی به مدل را دستکاری کند، یک حمله به یکپارچگی محسوب میشود. اگر دارید سیستم هوش مصنوعی طراحی میکنید، باید بدانید که بزرگترین چالش امنیتی شما همین مسئلهی یکپارچگی است. و باید دربارهاش فکر کنیم، بحث کنیم، و برای حلش راه پیدا کنیم.
وب 3.0 ـ که همان وب توزیعشده، غیرمتمرکز و هوشمند آینده است ـ تماماً بر پایهی یکپارچگی داده شکل میگیرد. مسئله فقط هوش مصنوعی نیست. دادهها و پردازشهایی که قابل راستیآزمایی، قابل اعتماد و دقیق باشند، برای رایانش ابری، شبکههای اجتماعی همتا به همتا (P2P)، و ذخیرهسازی غیرمتمرکز ضروریاند. تصور کنید جهانی را که در آن خودروهای خودران با هم دربارهی شرایط جاده و قصد حرکتشان ارتباط برقرار میکنند. بدون یکپارچگی، چنین چیزی ممکن نیست. شبکههای هوشمند برق یا شبکههای مش (mesh networking) قابل اعتماد هم همینطور. بدون یکپارچگی، هیچ عامل هوش مصنوعی قابل اعتمادی وجود نخواهد داشت.
اما پیش از آن، باید یک مشکل زبانی کوچک را حل کنیم. در زبان انگلیسی، «confidential» از «confidentiality» و «available» از «availability» میآید؛ اما معادل صفت برای «integrity» چیست؟ واژهی متناظر آن «integrous» است، اما آنقدر نامأنوس است که حتی در نسخهی کامل فرهنگ لغت مریم-وبستر هم نیامده است. پیشنهاد من این است که از همینجا شروع کنیم و این واژه را دوباره وارد زبان رایج کنیم.
ما به تحقیق در زمینهی طراحی سیستمهای “integrous” نیاز داریم.
ما به تحقیق در مورد مجموعهای از مسائل دشوار که هم به داده و هم به پردازش مربوط میشوند، نیازمندیم. چطور میتوانیم یکپارچگی را بسنجیم و آزمایش کنیم؟ چگونه میتوانیم حسگرهایی قابل راستیآزمایی با خروجیهای قابل حسابرسی بسازیم؟ چگونه واحدهای پردازش دادهی “integrous” طراحی کنیم؟ چطور از یک نقض یکپارچگی بازیابی کنیم؟ اینها تنها بخشی از پرسشهایی هستند که باید پاسخ دهیم، زمانی که بخواهیم دقیقتر به موضوع یکپارچگی بپردازیم.
اینها پرسشهای عمیقی هستند، به عمق اینترنت. در دههی ۱۹۶۰، اینترنت برای پاسخ به این سؤال پایهای طراحی شد: «آیا میتوانیم شبکهای بسازیم که در جهانی با اختلالهای در دسترس بودن، همچنان در دسترس بماند؟» بعدتر، پرسش اصلی این شد: «آیا میتوانیم شبکهای بسازیم که در جهانی پر از نقضهای محرمانگی، محرمانه بماند؟» و حالا، بهنظر من پرسش روز چنین است:
آیا میتوانیم شبکهای بسازیم که در جهانی با نقضهای یکپارچگی، همچنان یکپارچه باقی بماند؟
همانند دو سؤال قبلی، پاسخ آشکارا «بله» نیست، اما آشکارا «نه» هم نیست.
بیایید از همین حالا به طراحی سیستمهای “integrous” فکر کنیم. و بیایید این واژه را در گفتگوهایمان به کار ببریم. هرچه بیشتر از آن استفاده کنیم، کمتر عجیب بهنظر میرسد. چه میدانیم؟ شاید روزی «انجمن زبانشناسی آمریکا» این واژه را بهعنوان «واژهی سال» انتخاب کند.
منبع: https://www.schneier.com/blog/archives/2025/06/the-age-of-integrity.html