نقدی بر ستایشهای بیپایان از «کلاندادهها»
کلاندادهها با جنبههای مختلف زندگی اجتماعی درآمیختهاند، از انتخابات گرفته تا قانونگذاری، تجارت، بهداشت و حتی وبگاههای خبری. بهعنوان یک نمونه خارجی از این درآمیختگی، میتوان به انتخابات ریاستجمهوری ۲۰۱۶ آمریکا که ترامپ در آن به پیروزی رسید، اشاره کرد. کلاندادهها و معنا و مفهومش با تحولات اجتماعی، سیاسی و فناورانه ایجاد میشود و از آنها تأثیر میپذیرد. پیچیدگیهای جدید عرصه کلاندادهها، از جمعآوری تا تجزیهوتحلیل، مستلزم دریافتهایی تازه برای مطالعه اخلاق و سیاست کلاندادهها است. کلاندادهها نهتنها مشکلات قدیمیشان مثل عینیت، دقت، صحت و شمولیت را حل نکردهاند، بلکه با مسائلی جدید مثل سوگیریها، تحتتأثیر منافع بودن و ایجاد اشکال جدیدی از تجاوز و تعدی هم روبرو هستند. دسترسی همیشگی به چیزی، لزوماً به معنای اخلاقی بودن آن (کلاندادهها) نیست.
هیاهو در مورد کلان دادهها و مشکلات و رسواییهایی بحثبرانگیز در این حوزه، مدت زیادی است که در سطح جهان دائما در حال افزایش بوده است. نقض حریم خصوصی در جمعآوری کلان داده ها ، استفاده و بهاشتراکگذاری کلاندادهها بر همه بازیگران این صحنه تأثیر داشته است؛ خواه شرکتهایی مثل گوگل، توییتر و متا (فیسبوک) و خواه حتی فراتر از شرکتها، دولتها، سازمانها و یا مؤسسات آموزشی و بهداشتی. در این میان روشن گشته است که با رشد سریع شبکههای اجتماعی و برنامههای تلفن همراه، ذینفعان مختلف حجم زیادی از دادهها را جمعآوری و استفاده میکنند؛ و آنها این کارها را بدون توجه به ملاحظات سیاسی و اخلاقی انجام میدهند.
ازآنجاکه کلاندادهها بر قسمتهای متنوع و گستردهای از زندگی و جوامع انسانی تأثیر میگذارند، کاربست کلاندادهها باید موشکافانه بررسی گردد.
در این نوشته قرار است بهصورت مختصر با دریافتهایی تازه در زمینه اخلاق و سیاست کلاندادهها آشنا شویم. منبع این آشنایی، ویژهنامهای است که نشریه مطالعات علوم اجتماعی رایانه (Social Science Computer Review) سال ۲۰۱۸ در باب همین موضوع منتشر کرده است؛ اگر علاقهمند شدید، میتوانید برای مطالعه بیشتر، به این ویژهنامه رجوع کنید. مقالات این ویژهنامه در کنار یکدیگر با استفاده از طیف گستردهای از رهیافتهای نظری و روششناختی، دریافتهایی تازه از چندین بعد اخلاق و سیاست کلاندادهها ارائه میکنند و هر یک بهنوبه خود به ما نشان میدهند که آگاهی و تلاش برای درک عمیقتر از سوگیریها و محدودیتهای ذاتی موجود در تحلیل و کاربست کلاندادهها، بسیار مهم است.
آیا کلان داده ها همیشه مفید اند؟
کلاندادهها با جنبههای مختلف زندگی اجتماعی درآمیختهاند، از انتخابات گرفته تا قانونگذاری، تجارت، بهداشت و حتی وبگاههای خبری؛ بهعنوان یک نمونه خارجی از این درآمیختگی، میتوان به انتخابات ریاستجمهوری ۲۰۱۶ آمریکا که ترامپ در آن به پیروزی رسید، اشاره کرد. کلاندادهها و معنا و مفهومش با تحولات اجتماعی، سیاسی و فناورانه ایجاد میشود و از آنها تأثیر میپذیرد. پیچیدگیهای جدید عرصه کلاندادهها، از جمعآوری تا تجزیهوتحلیل، مستلزم دریافتهایی تازه برای مطالعه اخلاق و سیاست کلاندادهها است. کلاندادهها نهتنها مشکلات قدیمیشان مثل عینیت، دقت، صحت و شمولیت را حل نکردهاند، بلکه با مسائلی جدید مثل سوگیریها، تحتتأثیر منافع بودن و ایجاد اشکال جدیدی از تعدی هم روبرو هستند؛ دسترسی همیشگی به چیزی، لزوماً به معنای اخلاقی بودن آن (کلاندادهها) نیست.
در اینجا به چهار جنبه از اخلاق و سیاست کلاندادهها میپردازیم: ۱. سوگیریهای احتمالی در جمعآوری و تفسیر کلاندادهها؛ ۲. نگرانیهای جمعی و فردی شهروندان در مورد (سوء)استفاده از کلاندادهها در حیات اجتماعی و برای اهداف رسانهای؛ ۳. پروژههای ملی دولتها در سطح ملی برای کلاندادهها؛ ۴. رهنمودهایی برای پژوهشهای آتیه.
برای اینها، دادههایی از مردم آمریکا، دادههای توییتری مربوط به باندهای خلافکاری در آمریکا، دادههایی از یک بحث جامعهمحور در کانادا و دادههایی از شهروندان کانادایی بررسی شده است. برای پروژههای ملی دولتها نیز پوشش رسانهای در چین و هند بررسی شده است. این حجم از دادهها، چشماندازهایی گسترده به آنها داده است؛ چیزی که برای بحث پیرامون کلاندادهها ضروری است.
جهت گیری ارزشی در گردآوری کلان داده ها
مقاله «سوگیریهای بالقوه در کلاندادهها: کسانی که در شبکههای اجتماعی نادیده گرفته میشوند» با استفاده از تحلیل دادههای جمعآوری شده از مجموعه متنوعی از وبگاهها، نشان میدهد که متغیرهای مردمشناختی ارتباط وثیقی با میزان استفاده از شبکههای اجتماعی دارند؛ یعنی مثلاً افرادی که جایگاه اقتصادی-اجتماعی بهتری دارند، به طور قابلتوجهی بیشتر از دیگران از این وبگاهها استفاده میکنند. پیامد مهم یافتههای این پژوهش این است که هرچه قدر هم که چنین دادههایی بزرگ باشند، نمیتوانند نماینده عموم مردم باشند. علاوه بر این، این مقاله بر این تأکید دارد که مطالعات مبتنی بر کلاندادههای این وبگاهها تمایل دارند که دیدگاههای افرادی را که خاص هستند، انعکاس دهند؛ و اغلب بدون اینکه متوجه این سوگیریهای ذاتی باشند، به این کار مبادرت میورزند.
بر کسی پوشیده نیست که مجریان قانون از رسانههای دیجیتال برای نظارت بر جوامع حاشیهای استفاده میکنند؛ استخراج و تحلیل چنین دادههایی معمولاً بدون درک زمینهها و دید میدانی صحیح انجام میشود. مقاله «هوش مصنوعی و شمولیت: [دادههای توییتری] جوانانی که درگذشته درگیر باندهای خلافکاری بودند؛ متخصص موضوعی تحلیل دادههای توییتری سازماننیافته» با استفاده از رهیافتهای ترکیبی و میانرشتهای نشان میدهد که چگونه میتوان اینگونه دادهها را بهدرستی درک کرد. دید میدانی میباید و میتواند به سمت رهیافتهایی جامعتر و آگاهانهتر از جامعه، هدایت شود و برای تحلیل و رمزگشایی از دادهها، با آنها ادغام گردد. چالشهای جمعآوری و تحلیل دادهها در این عرصه میتواند با مشارکت جامعه و دانشگاه حل شود تا شاهد سیاستگذاریهای تأثیرگذار در این عرصه باشیم.
دو مقاله دیگر، به مورد دوم اختصاص دارند. «ساخت یک روایت عمومی از مقررات کلاندادهها و نتایج تجزیهوتحلیلِ بحثی جامعهمحور» مقالهای است که چهار نگرانی جامعه خاصی را – شامل دیدگاههای متعددی از جمله نیروهای پلیس محلی، شهری و استانی، هیئتمدیره مدارس، دانشگاهها، شهرداریها و مراکز خدمات غیردولتی – گرد هم میآورد و با تحلیل مضمون، چهار دغدغه اعضای این جامعه را شناسایی میکند: اخلاقیات دادههای عمومیِ موردِ بررسی؛ شیوههای مشاوره و سوادآموزی؛ چارچوبهای تنظیمگری، و همکاریهای بیناسازمانی. ذینفعان جامعه، نگرانِ روایتهای غلطی هستند که تحلیلهای بزرگمقیاس میتوانند بسازند؛ نگران سوگیریهای احتمالی ناشی از حذف و نادیدهگیری بعضی از گروههای اجتماعی و نیازهای آنان، و در نتیجه، ارائه نابرابر خدمات.
سوء استفاده از کلان داد ها
یکی از محوریترین مسائل کلاندادهها و پژوهشهای شبکههای اجتماعی، نگاه مردم به استفاده رسانهها از دادههای شبکههای اجتماعی است، موضوعی که مقاله دوم، «دیدگاه شهروندان در مورد استفاده رسانهها از شبکههای اجتماعی برای پیبردن به افکار عمومی»، به آن میپردازد. این پژوهشِ اکتشافی که این دفعه برخلاف اغلب پژوهشهای قبلی، به دیدگاه شهروندان میپردازد، مبتنی بر یک نظرسنجی آنلاین میان بزرگسالان کانادا است و نشان میدهد مردم ترجیح میدهند رسانهها از دادههای انبوه استفاده کنند؛ آن دسته از دادهها که نتوان با آن افراد را تشخیص داد. یکی از نکات جالب این است که افرادی که زیاد نظرات سیاسی میدهند، شیوه نوظهور رسانهها در بهکارگیری دادههای کلان را میپسندند و این یعنی احتمالاً فعالیتشان در فضای مجازی بهخاطر این است که نظرشان دیده و شنیده شود. این مقاله بر توسعه دستورالعملهای اخلاقی جامع برای استفاده از دادههای شبکههای اجتماعی تأکید میکند و خواستار شفافیت نحوه استفاده رسانهها از این دادهها است.
سوء استفاده دولت ها از کلان داده ها
جنبه سوم، تأثیر روندهای کلان اجتماعی-سیاسی بر تولید، توزیع و کاربرد کلاندادهها و شکلدهی ساختار آنها است. دولتهایی مثل چین و هند پروژههایی ملی را پیش میبرند که دادههای میلیاردها شهروند را جمعآوری و تجزیهوتحلیل میکند و قطعاً این، پیامدهای عمیق اجتماعی، اقتصادی و سیاسی دارد. مقاله «دادههای بزرگ و توهم انتخاب؛ مقایسه پروژههای کلاندادهها در هند و چین بهعنوان گفتمانهای فناوری اجتماعی» تحلیلی مقایسهای است که نشان میدهد رسانههای خبری این دو کشور نمیتوانند نقش حیاتی «نظارتگری» را بازی کنند، چون پیوندهایی نهادی و ایدئولوژیک با دولت و بنگاهها دارند. آنها مصادیق منافع عمومی را نادیده میگیرند و به سراغ منافع تجاری میروند؛ به همین دلیل بهنوعی در چارچوبدهی و حل مسائل متوجه کلاندادهها تحتتأثیر پروژههای ملی دولت شکستخورده محسوب میشوند.
علوم اجتماعی محاسباتی در مقابل علوم اجتماعی سنتی در عصر کلان داده
مقاله آخر، «هنگامه مواجهه دادههای ردیابی دیجیتال با نظریه سنتی ارتباطات: رهنمودهای نظری و روششناختی»، پنج تفاوت میان دادههای علوم اجتماعی مرسوم و دادههای ردیابی دیجیتال را برجسته میکند: ۱. نمونهگیری در مقابل مردم ۲. توزیع نرمال در مقابل توزیع توانی ۳. تعمیمدهی در مقابل شبیهسازی ۴. قیاسی در مقابل استقرایی ۵. ادراکی در مقابل واقعی. بسیاری از این تفاوتها کمی است، نه کیفی. این مقاله تذکر میدهد که کیفیت دادههای ردیابی دیجیتال کمتر از چیزی است که طرفداران رهیافتهای کلاندادهای بخواهند به آن اذعان کنند. مقاله به بحث در مورد چگونگی کمک نظری و روششناختی دادههای ردیابی دیجیتال به پیشرفت پژوهشهای ارتباطاتی هم میپردازد و خواستار همافزایی و همکاری است تا جستارهای نظری و روششناختی نوینی شکل بگیرد که بر مشکلات کنونی فائق آید.
چیزی که فقدانش در این ویژهنامه مشهود است و خودِ ویژهنامه نیز به آن اعتراف میکند، نگاهی به پویایی دادهها و سیاستها، میان بخش عمومی و خصوصی است؛ منظور این است که پشتصحنه کلاندادهها و چگونگی مدیریت و کاربست کلاندادهها برای پژوهشگران چندان روشن نیست. پژوهشگران دقیقاً نمیدانند شرکتها، دولتها و سازمانها عملاً چگونه با دادهها کار میکنند و همین باعث میشود پژوهشهای اخلاق و سیاست کلاندادهها محل مناقشه باشد.