نقدی بر ستایش‌های بی‌پایان از «کلان‌داده‌ها»

سایبرپژوه۱۴۰۱-۱۱-۱۵

زمان تقریبی مطالعه 5 دقیقه

کلان‌داده‌ها با جنبه‌های مختلف زندگی اجتماعی درآمیخته‌اند، از انتخابات گرفته تا قانون‌گذاری، تجارت، بهداشت و حتی وبگاه‌های خبری. به‌عنوان یک نمونه خارجی از این درآمیختگی، می‌توان به انتخابات ریاست‌جمهوری ۲۰۱۶ آمریکا که ترامپ در آن به پیروزی رسید، اشاره کرد. کلان‌داده‌ها و معنا و مفهومش با تحولات اجتماعی، سیاسی و فناورانه ایجاد می‌شود و از آن‌ها تأثیر می‌پذیرد. پیچیدگی‌های جدید عرصه کلان‌داده‌ها، از جمع‌آوری تا تجزیه‌وتحلیل، مستلزم دریافت‌هایی تازه برای مطالعه اخلاق و سیاست کلان‌داده‌ها است. کلان‌داده‌ها نه‌تنها مشکلات قدیمی‌شان مثل عینیت، دقت، صحت و شمولیت را حل نکرده‌اند، بلکه با مسائلی جدید مثل سوگیری‌ها، تحت‌تأثیر منافع بودن و ایجاد اشکال جدیدی از تجاوز و تعدی هم روبرو هستند. دسترسی همیشگی به چیزی، لزوماً به معنای اخلاقی بودن آن (کلان‌داده‌ها) نیست.

هیاهو در مورد کلان‌ داده‌‌ها و مشکلات و رسوایی‌هایی بحث‌برانگیز در این حوزه، مدت زیادی است که در سطح جهان دائما در حال افزایش بوده است. نقض حریم خصوصی در جمع‌آوری کلان داده ها ، استفاده و به‌اشتراک‌گذاری کلان‌داده‌ها بر همه بازیگران این صحنه تأثیر داشته است؛ خواه شرکت‌هایی مثل گوگل، توییتر و متا (فیس‌بوک) و خواه حتی فراتر از شرکت‌ها، دولت‌ها، سازمان‌ها و یا مؤسسات آموزشی و بهداشتی. در این میان روشن گشته است که با رشد سریع شبکه‌های اجتماعی و برنامه‌های تلفن همراه، ذی‌نفعان مختلف حجم زیادی از داده‌ها را جمع‌آوری و استفاده می‌کنند؛ و آن‌ها این کارها را بدون توجه به ملاحظات سیاسی و اخلاقی انجام می‌دهند.

ازآنجاکه کلان‌داده‌ها بر قسمت‌های متنوع و گسترده‌ای از زندگی و جوامع انسانی تأثیر می‌گذارند، کاربست کلان‌داده‌ها باید موشکافانه بررسی گردد.

در این نوشته قرار است به‌صورت مختصر با دریافت‌هایی تازه در زمینه اخلاق و سیاست کلان‌داده‌ها آشنا شویم. منبع این آشنایی، ویژه‌نامه‌ای است که نشریه مطالعات علوم اجتماعی رایانه (Social Science Computer Review) سال ۲۰۱۸ در باب همین موضوع منتشر کرده است؛ اگر علاقه‌مند شدید، می‌توانید برای مطالعه بیشتر، به این ویژه‌نامه رجوع کنید. مقالات این ویژه‌نامه در کنار یکدیگر با استفاده از طیف گسترده‌ای از رهیافت‌های نظری و روش‌شناختی، دریافت‌هایی تازه از چندین بعد اخلاق و سیاست کلان‌داده‌ها ارائه می‌کنند و هر یک به‌نوبه خود به ما نشان می‌دهند که آگاهی و تلاش برای درک عمیق‌تر از سوگیری‌ها و محدودیت‌های ذاتی موجود در تحلیل و کاربست کلان‌داده‌ها، بسیار مهم است.

آیا کلان داده ها همیشه مفید اند؟

کلان‌داده‌ها با جنبه‌های مختلف زندگی اجتماعی درآمیخته‌اند، از انتخابات گرفته تا قانون‌گذاری، تجارت، بهداشت و حتی وبگاه‌های خبری؛ به‌عنوان یک نمونه خارجی از این درآمیختگی، می‌توان به انتخابات ریاست‌جمهوری ۲۰۱۶ آمریکا که ترامپ در آن به پیروزی رسید، اشاره کرد. کلان‌داده‌ها و معنا و مفهومش با تحولات اجتماعی، سیاسی و فناورانه ایجاد می‌شود و از آن‌ها تأثیر می‌پذیرد. پیچیدگی‌های جدید عرصه کلان‌داده‌ها، از جمع‌آوری تا تجزیه‌وتحلیل، مستلزم دریافت‌هایی تازه برای مطالعه اخلاق و سیاست کلان‌داده‌ها است. کلان‌داده‌ها نه‌تنها مشکلات قدیمی‌شان مثل عینیت، دقت، صحت و شمولیت را حل نکرده‌اند، بلکه با مسائلی جدید مثل سوگیری‌ها، تحت‌تأثیر منافع بودن و ایجاد اشکال جدیدی از تعدی هم روبرو هستند؛ دسترسی همیشگی به چیزی، لزوماً به معنای اخلاقی بودن آن (کلان‌داده‌ها) نیست.

در اینجا به چهار جنبه از اخلاق و سیاست کلان‌داده‌ها می‌پردازیم: ۱. سوگیری‌های احتمالی در جمع‌آوری و تفسیر کلان‌داده‌ها؛ ۲. نگرانی‌های جمعی و فردی شهروندان در مورد (سوء)استفاده از کلان‌داده‌ها در حیات اجتماعی و برای اهداف رسانه‌ای؛ ۳. پروژه‌های ملی دولت‌ها در سطح ملی برای کلان‌داده‌ها؛ ۴. رهنمودهایی برای پژوهش‌های آتیه.

برای این‌ها، داده‌هایی از مردم آمریکا، داده‌های توییتری مربوط به باندهای خلاف‌کاری در آمریکا، داده‌هایی از یک بحث جامعه‌محور در کانادا و داده‌هایی از شهروندان کانادایی بررسی شده است. برای پروژه‌های ملی دولت‌ها نیز پوشش رسانه‌ای در چین و هند بررسی شده است. این حجم از داده‌ها، چشم‌اندازهایی گسترده به آن‌ها داده است؛ چیزی که برای بحث پیرامون کلان‌داده‌ها ضروری است.

جهت گیری ارزشی در گردآوری کلان داده ها

مقاله «سوگیری‌های بالقوه در کلان‌داده‌ها: کسانی که در شبکه‌های اجتماعی نادیده گرفته می‌شوند» با استفاده از تحلیل داده‌های جمع‌آوری شده از مجموعه متنوعی از وبگاه‌ها، نشان می‌دهد که متغیرهای مردم‌شناختی ارتباط وثیقی با میزان استفاده از شبکه‌های اجتماعی دارند؛ یعنی مثلاً افرادی که جایگاه اقتصادی-اجتماعی بهتری دارند، به طور قابل‌توجهی بیشتر از دیگران از این وبگاه‌ها استفاده می‌کنند. پیامد مهم یافته‌های این پژوهش این است که هرچه قدر هم که چنین داده‌هایی بزرگ باشند، نمی‌توانند نماینده عموم مردم باشند. علاوه بر این، این مقاله بر این تأکید دارد که مطالعات مبتنی بر کلان‌داده‌های این وبگاه‌ها تمایل دارند که دیدگاه‌های افرادی را که خاص هستند، انعکاس دهند؛ و اغلب بدون اینکه متوجه این سوگیری‌های ذاتی باشند، به این کار مبادرت می‌ورزند.

بر کسی پوشیده نیست که مجریان قانون از رسانه‌های دیجیتال برای نظارت بر جوامع حاشیه‌ای استفاده می‌کنند؛ استخراج و تحلیل چنین داده‌هایی معمولاً بدون درک زمینه‌ها و دید میدانی صحیح انجام می‌شود. مقاله «هوش مصنوعی و شمولیت: [داده‌های توییتری] جوانانی که درگذشته درگیر باندهای خلاف‌کاری بودند؛ متخصص موضوعی تحلیل داده‌های توییتری سازمان‌نیافته» با استفاده از رهیافت‌های ترکیبی و میان‌رشته‌ای نشان می‌دهد که چگونه می‌توان این‌گونه داده‌ها را به‌درستی درک کرد. دید میدانی می‌باید و می‌تواند به سمت رهیافت‌هایی جامع‌تر و آگاهانه‌تر از جامعه، هدایت شود و برای تحلیل و رمزگشایی از داده‌ها، با آن‌ها ادغام گردد. چالش‌های جمع‌آوری و تحلیل داده‌ها در این عرصه می‌تواند با مشارکت جامعه و دانشگاه حل شود تا شاهد سیاست‌گذاری‌های تأثیرگذار در این عرصه باشیم.

دو مقاله دیگر، به مورد دوم اختصاص دارند. «ساخت یک روایت عمومی از مقررات کلان‌داده‌ها و نتایج تجزیه‌وتحلیلِ بحثی جامعه‌محور» مقاله‌ای است که چهار نگرانی جامعه خاصی را – شامل دیدگاه‌های متعددی از جمله نیروهای پلیس محلی، شهری و استانی، هیئت‌مدیره مدارس، دانشگاه‌ها، شهرداری‌ها و مراکز خدمات غیردولتی – گرد هم می‌آورد و با تحلیل مضمون، چهار دغدغه اعضای این جامعه را شناسایی می‌کند: اخلاقیات داده‌های عمومیِ موردِ بررسی؛ شیوه‌های مشاوره و سوادآموزی؛ چارچوب‌های تنظیم‌گری، و همکاری‌های بیناسازمانی. ذی‌نفعان جامعه، نگرانِ روایت‌های غلطی هستند که تحلیل‌های بزرگ‌مقیاس می‌توانند بسازند؛ نگران سوگیری‌های احتمالی ناشی از حذف و نادیده‌گیری بعضی از گروه‌های اجتماعی و نیازهای آنان، و در نتیجه، ارائه نابرابر خدمات.

سوء استفاده از کلان داد ها

یکی از محوری‌ترین مسائل کلان‌داده‌ها و پژوهش‌های شبکه‌های اجتماعی، نگاه مردم به استفاده رسانه‌ها از داده‌های شبکه‌های اجتماعی است، موضوعی که مقاله دوم، «دیدگاه شهروندان در مورد استفاده رسانه‌ها از شبکه‌های اجتماعی برای پی‌بردن به افکار عمومی»، به آن می‌پردازد. این پژوهشِ اکتشافی که این دفعه برخلاف اغلب پژوهش‌های قبلی، به دیدگاه شهروندان می‌پردازد، مبتنی بر یک نظرسنجی آنلاین میان بزرگسالان کانادا است و نشان می‌دهد مردم ترجیح می‌دهند رسانه‌ها از داده‌های انبوه استفاده کنند؛ آن دسته از داده‌ها که نتوان با آن افراد را تشخیص داد. یکی از نکات جالب این است که افرادی که زیاد نظرات سیاسی می‌دهند، شیوه نوظهور رسانه‌ها در به‌کارگیری داده‌های کلان را می‌پسندند و این یعنی احتمالاً فعالیتشان در فضای مجازی به‌خاطر این است که نظرشان دیده و شنیده شود. این مقاله بر توسعه دستورالعمل‌های اخلاقی جامع برای استفاده از داده‌های شبکه‌های اجتماعی تأکید می‌کند و خواستار شفافیت نحوه استفاده رسانه‌ها از این داده‌ها است.

سوء استفاده دولت ها از کلان داده ها

جنبه سوم، تأثیر روندهای کلان اجتماعی-سیاسی بر تولید، توزیع و کاربرد کلان‌داده‌ها و شکل‌دهی ساختار آن‌ها است. دولت‌هایی مثل چین و هند پروژه‌هایی ملی را پیش می‌برند که داده‌های میلیاردها شهروند را جمع‌آوری و تجزیه‌وتحلیل می‌کند و قطعاً این، پیامدهای عمیق اجتماعی، اقتصادی و سیاسی دارد. مقاله «داده‌های بزرگ و توهم انتخاب؛ مقایسه پروژه‌های کلان‌داده‌ها در هند و چین به‌عنوان گفتمان‌های فناوری اجتماعی» تحلیلی مقایسه‌ای است که نشان می‌دهد رسانه‌های خبری این دو کشور نمی‌توانند نقش حیاتی «نظارت‌گری» را بازی کنند، چون پیوندهایی نهادی و ایدئولوژیک با دولت و بنگاه‌ها دارند. آن‌ها مصادیق منافع عمومی را نادیده می‌گیرند و به سراغ منافع تجاری می‌روند؛ به همین دلیل به‌نوعی در چارچوب‌دهی و حل مسائل متوجه کلان‌داده‌ها تحت‌تأثیر پروژه‌های ملی دولت شکست‌خورده محسوب می‌شوند.

علوم اجتماعی محاسباتی در مقابل علوم اجتماعی سنتی در عصر کلان داده

مقاله آخر، «هنگامه مواجهه داده‌های ردیابی دیجیتال با نظریه سنتی ارتباطات: رهنمودهای نظری و روش‌شناختی»، پنج تفاوت میان داده‌های علوم اجتماعی مرسوم و داده‌های ردیابی دیجیتال را برجسته می‌کند: ۱. نمونه‌گیری در مقابل مردم ۲. توزیع نرمال در مقابل توزیع توانی ۳. تعمیم‌دهی در مقابل شبیه‌سازی ۴. قیاسی در مقابل استقرایی ۵. ادراکی در مقابل واقعی. بسیاری از این تفاوت‌ها کمی است، نه کیفی. این مقاله تذکر می‌دهد که کیفیت داده‌های ردیابی دیجیتال کمتر از چیزی است که طرف‌داران رهیافت‌های کلان‌داده‌ای بخواهند به آن اذعان کنند. مقاله به بحث در مورد چگونگی کمک نظری و روش‌شناختی داده‌های ردیابی دیجیتال به پیشرفت پژوهش‌های ارتباطاتی هم می‌پردازد و خواستار هم‌افزایی و همکاری است تا جستارهای نظری و روش‌شناختی نوینی شکل بگیرد که بر مشکلات کنونی فائق آید.

چیزی که فقدانش در این ویژه‌نامه مشهود است و خودِ ویژه‌نامه نیز به آن اعتراف می‌کند، نگاهی به پویایی داده‌ها و سیاست‌ها، میان بخش عمومی و خصوصی است؛ منظور این است که پشت‌صحنه کلان‌داده‌ها و چگونگی مدیریت و کاربست کلان‌داده‌ها برای پژوهشگران چندان روشن نیست. پژوهشگران دقیقاً نمی‌دانند شرکت‌ها، دولت‌ها و سازمان‌ها عملاً چگونه با داده‌ها کار می‌کنند و همین باعث می‌شود پژوهش‌های اخلاق و سیاست کلان‌داده‌ها محل مناقشه باشد.

سایبرپژوه۱۴۰۱-۱۱-۱۵

زمان تقریبی مطالعه 5 دقیقه

نقدی بر ستایش‌های بی‌پایان از «کلان‌داده‌ها»

سایبر چیست؟

تکنولوژی؟ ترجیح می‌دهم که نه! نگاهی به شخصیت «چهارشنبه» به روایت تیم برتون

جنگ ترکیبی چیست؟

اینترنت ، منابع طبیعی را می‌بلعد

عصر دیجیتال

از ربات ها تا آی بات ها : شمایل/نماد شناسی هوش مصنوعی

کمپین‌های سیاسی در بازی‌های ویدیوئی

مصاحبه سایبرپژوه با یک ربات؛ Chat GPT از آینده تقسیم کار اجتماعی برای ما می‌گوید

نوشته های مشابه

آیا اصول اخلاقی نقشی در طراحی بازی‌ها دارند؟

ماموریت جدید وزارت ارتباطات مشخص شد!

گوگل؛ شاهرگ دنیای اینترنت

سایبرپانک : ضدجریان سایبری