علم داده و یادگیری ماشین در بخشهای مختلف صنعتی و اقتصادی ما کاربرد دارد. امروزه بسیاری از تصمیمگیریهای انسانی با مشورت الگوریتمهای یادگیری ماشین و یا حتی توسط خود الگوریتمها انجام میگیرد. مسائل اخلاقی مرتبط با علم داده در سطوح مختلفی قابل بررسی هستند؛ مسائلی که زندگی فردی و حریم خصوصی را تحت تأثیر قرار میدهد و مسائلی که تأثیرات گستردهای بر گروههای مختلف جامعه دارد. مسائل اخلاقی علم داده در زمینههای اعتبار داده، حریم خصوصی و مشکلات ناشی از عدم استفادهی مناسب از علم داده بروز میکند و دانشمندان داده تلاش میکنند با شناسایی این مسائل اخلاقی از بروز آنها جلوگیری کنند. در این متن، میخواهیم در مورد تأثیرات و پیامدهای اجتماعی علم داده مطالبی را ارائه کنیم.
هنگام انجام فرآیندهای علم داده، اقداماتی جهت اعتبارسنجی فرآیندهای علم داده انجام میشود؛ اقداماتی از قبیل بررسی تناسب داده با سوالی که از علم داده برای پاسخ به آن سوال استفاده میشود یا نمایش مناسب دادهها به هنگام انتقال یافتههای فرآیند تحلیل داده. مسئلهی حفظ حریم خصوصی نیز از جمله مسائلی است که در فرآیندهای علم داده همیشه مورد نظر است و حتی قوانین مهمی نیز در این راستا تدوین شده است که متخصصان علم داده را ملزم به رعایت برخی موارد قانونی میکند. این امکانات برای کاهش جنبههای نامناسب استفاده از داده لازم هستند، اما مسائل اخلاقی علم داده تنها به این موارد خاتمه نمییابد. درواقع هنوز هم امکان آن وجود دارد که کاربست داده تأثیرات اجتماعی غیرمنتظرانهای به دنبال داشته باشد. پیامدهای اجتماعی استفاده از علم داده لزوماً منفی نیستند و میتوانند مثبت باشند. حتی میتوان با استفادهی مناسب از علم داده، در حل مشکلات اجتماعی جامعه سهیم بود. در واقع کسبوکارهایی وجود دارند که هدف آنها استفاده از منافع علم داده جهت خدمترسانی به عموم جامعه است. در این یادداشت به نمونههایی از این شرکتها و فعالیتهای آنها اشاره خواهیم کرد. البته استفاده از علم داده پیامدهای منفی اجتماعی نیز میتوانند به دنبال داشته باشند که در اینجا بحث خواهیم کرد.
پیامدهای اجتماعی مطلوب استفاده از علم داده
همانطور که اشاره کردیم برخی از شرکتها از علم داده برای تأثیرگذاری مثبت در مسائل اجتماعی استفاده میکنند. در این یادداشت یک شرکت را مثال میزنیم و سعی میکنیم نشان دهیم که این شرکت چگونه از علم داده در کار خود استفاده میکند.
شرکت سوشالکاپس[۱] با هدف حل مسائل مهم جهانی از طریق استفاده از علم داده تأسیس شده است. این شرکت به مدت 5 سال است که ابزارهایی توسعه داده است که بتوان پروژههای علم داده را در مقیاسهای بزرگ پیادهسازی کرد. این شرکت از کلانداده برای یافتن سریعترین مسیر به خانهها و ردیابی محمولههای غذایی استفاده میکند. هدف این شرکت استفاده از علم داده در حل مسائلی است که سلامت، امنیت و شادی میلیاردها انسان را تحت تأثیر قرار میدهد[۲].
نمونهای از مسائل حل شده توسط این شرکت، بهبود دستیابی به بازار برای کشاورزان خرد در زامبیا است. این مسئله با همکاری برنامهی جهانی غذای[۳] سازمان ملل متحد انجام شده است. برنامهی جهانی غذا یک برنامه، مانو[۴]، تهیه کرده است که کشاورزان روستایی در زامبیا را به دادههای بازار و خریداران متصل میکند. برنامهی جهانی غذا از برنامهی کالکت[۵] که محصول شرکت سوشال کاپس است برای نظارت و ارزیابی اثر برنامهی آزمایشی خود استفاده کرده است [1].
یکی از مشکلات در زامبیا، عدم دسترسی کشاورزان خرد به اطلاعات بازار به خاطر فقر بود. در سرتاسر آفریقا، میلیونها کشاورز روستایی خرد گرفتار فقر هستند. بازار کشاورزی روستایی غیرمتمرکز است و کشاورزان به اطلاعات واقعی و در لحظهی بازار دسترسی ندارند. به این دلیل، آنها مجبور میشوند که محصولات خود را به یک دلال محلی با قیمت بسیار پایین بفروشند. این عدم تقارن در دسترسی به اطلاعات، مانع از گسترش کسبوکار کشاورزان و افزایش درآمدشان میشود. برای حل این مشکل، سازمان جهانی غذا برنامهی مانو را تهیه کرد که در واقع یک بستر مجازی برای بازار کشاورزان است. با ارائهی اطلاعات واقعی و در لحظه در مورد قیمت محصولات و اتصال کشاورزان به خریداران، برنامهی مانو یک بازار شفاف و مطمئن ایجاد کرده است که کشاورزان قدرت چانهزنی بیشتری دارند و در نهایت میتوانند محصولات خود را به قیمت منصفانهتری به فروش برسانند. برنامهی جهانی غذا، اپلیکیشن مانو را در 4 منطقه از زامبیا به صورت آزمایشی اجرا کرده است تا اثرات آن را شناسایی و ردیابی کند. محصولات علم دادهی شرکت سوشالکاپس در این فاز از پروژه که نیاز به جمعآوری دارد، کمک کرده است.
در هنگام استفادهی آزمایشی از اپلیکشین مانو، برنامهی جهانی غذا از نرمافزار کالکت که یک برنامهی گوشی تلفن همراه جهت جمعآوری داده است به منظور نظارت و ارزیابی اثر اپلیکیشن مانو استفاده کرده است. با تجهیز 50 کشاورز پیشرو به کالکت، برنامهی آزمایشی توانست تراکنشهای بین کشاروزان پیشرو و خریداران نهایی را به صورت موفقیتآمیز اندازهگیری کند. در همین حال، کالکت برای جمعآوری دادههای اقتصادی و دادههای اجتماعی کشاورزان دنبالهرو نیز استفاده شد. در این بررسی منظور از کشاورزان دنبالهرو، کشاورزانی است که با استفاده از طریق تراکنش با کشاورزان پیشرو به بازار مجازی متصل شدند. برنامهی جهانی غذا با ترکیب دادههای جمعآوریشده توسط کالکت به یک سامانهی واحد، توانست شبکهی بین خریداران، کشاورزان پیشرو و کشاورزان دنبالهرو به دست آورد و اثر برنامهی آزمایشی خود را به دقت ارزیابی کند. اوین جویس[۶]، عضو برنامهی جهانی غذا و مدیر اپلیکیشن مانو، میگوید:
«با استفاده از نرمافزار کالکت، ما توانستیم از کشاورزان خرد روستایی که تا به حال دادهای فراهم نکرده بودند، داده جمعآوری کنیم. نکتهی جالب این است که دادهای که آنها فراهم کردند، با جزئیات، دقیق، در زمان واقعی و مختص موقعیت جغرافیایی خاصی بود. ما از این بصیرتها استفاده کردیم تا طراحی پروژه را طوری تطبیق دهیم که مطمئن باشیم اپلیکیشن مانو به کشاورزان آسیبپذیر این جوامع کمک میکند.»
امیلی زاندونا[۷]، تحلیلگر داده در مانو و عضو برنامهی جهانی غذا میگوید:
«زمانی که کلانداده را تحلیل میکنیم، یکی از بازدارندههای اصلی زمان لازم برای مرتبسازی داده است. سرعت مرتبسازی داده در نرمافزار کالکت با قابلیت بارگیری داده بسیار قابل توجه است. داده از قبل مرتب شده است و آمادهی تحلیل است.»
نتیجهی این اقدامات در برنامهی آزمایشی این بود که 50 کشاورز پیشرو و تقریباً 1200 کشاورز دنبالهرو توانستند نزدیک به 100 تراکنش را از طریق اپلیکیشن انجام دهند. این تراکنشها وزنی نزدیک به 50000 کیلوگرم و ارزشی معادل 47000 دلار در بر داشت. با توجه به این آمار امیدوارکننده و دادههای جمعآوری شده با کالکت، برنامهی جهانی غذا قصد دارد که پروژه را گسترش دهد تا 500 کشاورز پیشرو و 25000 کشاورز دنبالهرو را شامل شود.
پیامدهای اجتماعی نامطلوب استفاده از علم داده
علم داده پیامدهای اجتماعی نامطلوب و منفی نیز میتواند داشته باشد. یکی از سختترین کارهای در توسعهی محصولات و فرآیندهای دادهمحور، پیشبینی اثرات اجتماعی نامطلوب آنهاست. این اثرات معمولاً تا قبل از پیادهسازی ناشناخته هستند و پیچیدگی تعاملات انسانی در جامعه، پیشبینی آنها را دشوار میکند.
یکی از پیامدهای نامطلوب اجتماعی علم داده، دامن زدن به کلیشهها[۸] است. کلیشهها عبارتهایی کلی در مورد یک جمعیت از جامعه هستند و معمولاً بخشی از حقیقت را در خود دارند. اما قضاوت یک فرد خاص از یک جمعیت بر اساس کلیشههای رایج در مورد آن جمعیت منصفانه و عادلانه نیست. باور به کلیشهها میتواند در عملکرد افراد نتایج مثبت یا منفی داشته باشد. در اینجا بیشتر جنبهی منفی باور به کلیشهها مورد نظر ماست.
در روانشناسی نظریهای به نام تهدید کلیشه[۹] وجود دارد. تهدید کلیشهای موقعیتی است که در آن افراد در معرض خطر یا احساس خطر انطباق با کلیشههای مربوط به گروه اجتماعی خود هستند. به عنوان مثال، کلیشهی رایجی وجود دارد که زنان در فعالیتهای ریاضی و منطقی ضعیفتر از مردان هستند. حال اگر دختری در یک مسابقهی ریاضی با گروهی از پسران قرار گیرد، باور به این کلیشه (خودآگاه یا ناخودآگاه) در چنین موقعیتی، عملکرد او را ممکن است تضعیف کند.
اما دقت کنید که کلیشهها از اطلاعات و حوادث گذشته ناشی میشوند. به عنوان مثال، از سال 1924/1303 تا کنون، هر 4 سال یک بار مدال فیلدز[۱۰] به بزرگترین ریاضیدانان جهان اعطا میشود. در میان برندگان مدال فیلدز، تنها یک بار این جایزه توسط یک زن برده شده است؛ خانم مریم میرزاخانی که دانشآموختهی کارشناسی ریاضی دانشگاه صنعتی شریف بود. کلیشهها ریشه در حقیقت دارند اما تمام آن نیستند و نباید مبنای قضاوت در مورد افراد یک گروه اجتماعی (یک جنسیت یا یک نژاد و …) قرار گیرند.
ما انسانها در ساختن کلیشههای از دادههای قبلی استفاده میکنیم و ممکن است در تصمیمگیریها این کلیشهها بر ذهن ما اثرگذار باشد. الگوریتمهایی که از دادههای قبلی استفاده میکنند نیز از این اشتباه مصون نیستند. در واقع الگوریتمهای دادهمحور از همین روش برای قضاوت در مورد افراد استفاده میکنند. آنها با استفاده از خصوصیات و صفات یک فرد، به سوال مربوط به آن شخص پاسخ میدهند و پاسخ آنها بسیار کمیتر و مبتنی بر عدد و رقم است. بنابراین از ماشینها نیز انتظار چنین پیامدهای اجتماعی میرود و در کاربست آنها به این مسئله نیز باید توجه کرد.
در فضای رسانه مفهومی به نام اتاقک پژواک[۱۱] وجود دارد. اتاقک پژواک یعنی محیطی که در آن یک فرد تنها با عقاید، نظرات و باورهایی نزدیک به نظرات خودش روبهرو میشود و نظرات و عقاید بدیل را در نظر نمیگیرد[۱۲] [2]. قرارگرفتن در چنین محیطی میتواند تهدیدات اجتماعی و سیاسی ایجاد کند. فردی که در اتاقک پژواک قرارگرفته است و عقاید مخرب یا اشتباهی دارد، اگر به زیانبار بودن عقاید خود پی نبرد ممکن است بر اساس عقاید خود دست به اقدامات مخرب یا جنایتکارانه بزند.
برای خارج کردن یک شخص از اتاقک پژواک، نخستین گام آگاه ساختن او به وجود نظریات و عقاید بدیل است؛ عقایدی که شاید برای آن شخص دلپذیر نباشد اما وجود دارد و طرفدارن بسیاری نیز دارد. این قسمت همان جایی است که علم داده میتواند مشکلآفرین باشد. در بسیاری از الگوریتمهای یادگیری ماشین که در رسانههای اجتماعی همانند توئیتر، اینستاگرام، تلگرام و … استفاده میشود، هدف الگوریتم آن است که با تشخیص علاقهمندیهای کاربر، محتوایی را به او پیشنهاد دهد که برای او خوشآیند باشد. این الگوریتمها که سامانههای پیشنهادگر نام دارند و از دو نوع داده برای دادن پیشنهادهای مناسب ممکن است بهرهمند شوند. نخستین نوع داده، دادههای حاصل از فعالیتهای خود شخص در بستر یک وبسایت یا رسانهی اجتماعی است. به عنوان مثال، کاربر ممکن است در بستر اینستاگرام کاربری در پستهایی که محتوای عاشقانه دارد کامنت گذاشته باشد یا آنها را لایک کرده باشد و کاربر دیگری محتواهای فوتبالی را پسندیده باشد. ماشین با استفاده از این دادهها، به کاربر اول محتواهای عاشقانه را پیشنهاد میدهد و به کاربر دوم محتواهای فوتبالی را. دومین نوع داده که میتواند مورد استفاده قرار گیرد، دادههای فعالیتهای مربوط به حلقهی دوستان کاربر و دادههای اشخاصی است که دوست کاربر نیستند اما محتواهایی مشابه با محتواهای کاربر را میپسندند.
در هر حالت، الگوریتمهای یادگیری ماشین هدف پیشنهاد محتوای بهینه و جذاب به کاربر را دارند و بنابراین این الگوریتمها کاربر را در اتاقک پژواک قرار میدهند.
بگذارید نمونهی دیگری از اثرات اجتماعی نامطلوب استفاده از علم داده ارائه کنیم. یک پیشفرض رایج در جامعه و به خصوص در بین دانشگاهیان وجود دارد و آن این است که جوامع با دادههای باز؛ یعنی جوامعی که در آن دادهها در دسترس عموم هستند کاری خوب است و به مردمسالاری کمک میکند. در مرحلهی اول این مطلب معقول به نظر میرسد. اگر تمام دادهها در دسترس همگان قرار بگیرد، افراد بیشتری میتوانند از دادههای اطلاعات مربوط به خود را استخراج کنند و متناسب با شرایط موجود برنامهریزی کنند. همچنین در کاهش فسادهای سیستمی نیز میتواند مفید باشد. اما آیا دادههای باز اثرات اجتماعی نامطلوبی نیز میتواند داشته باشد؟
ادارهی آموزش و پروش ایالت نیویورک در آمریکا دادههای آموزشی را به صورت رایگان و کاملاً باز در اختیار عموم قرار داده است[۱۳]. آنها امکاناتی برای نمایش و مصورسازی دادهها به شکل جدول و نمودار در وبسایت خود فراهم کردهاند اما با وجود این، اشخاص میتوانند دادهها را خود بارگیری نمایند و اطلاعات متنوعتری را از آنها استخراج کنند. هدف اصلی این خدمات، کمک به والدین و خانوادهها در انتخاب بهترین مدرسه برای تعلیم و تربیت فرزندانشان است.
نخستین مشکل در خود دادههاست. افراد یک جامعه در مورد آموزش مناسب طرز فکر یکسانی ندارند. از نظر عدهای آموزشی مناسب است که دانشآموزان را برای امتحانهای ورود به دانشگاه آماده کند، اما از نظر برخی دیگر آموزشی مناسبتر است که به دانشآموزان مهارتهای زندگی و ارتباطی کافی جهت زندگی اجتماعی بهتر در جامعه را آموزش دهد. میزان تنوع نظرها بسیار بیشتر از آنی است که گفته شده است، بنابراین جمعآوری دادهها با هدف کمک به انتخاب مدرسهی بهتر، کاری پیچیده است و نمیتواند ملاکهای تمام افراد یک جامعه را در بر بگیرد.
دومین مشکل در میزان بهرهبرداری افراد مختلف از دادههای باز است. میزان بهرهبرداری خانوادههای مختلف از دادهها یکسان نیست. خانوادههای مختلف سواد آماری و حتی سواد پایهی متفاوتی دارند. برخی خانوادهها امکان وقت گذاشتن برای فهم دادهها و معنای متغیرهای مختلف را دارند. برخی هم امکانات اقتصادی لازم برای استخدام تحلیلگران داده و بررسی گزینههای پیشرو دارند. اما بسیاری از خانوادهها یا سواد کافی ندارند یا وقت کافی ندارند و یا ثروت کافی ندارند تا بتوانند از همین دادههای باز برای انتخاب مناسبتر استفاده کنند. بنابراین یکی از پیامدهای اجتماعی همین دادههای باز آن است که باز بودن دادهها کمکی به گسترش عدالت کمکی نمیکند. برای بسیاری از افراد جامعه، دادههای باز نه اطلاعات آنها را فزایش میدهد و نه قدرت تصمیمگیری آنها را بهتر میکند. بنابراین دادههای باز در این مورد، حتی به گسترش بیعدالتی کمک نیز میکند.
سومین مورد که در دادههای باز باید توجه شود، در نحوهی انتخاب است. در بسیاری از موارد، آن انتخابی که به صلاح جامعه است با خواهشهای فردی انسانها و موقعیتهای مطلوب آنها در تضاد است. به عنوان مثال، مطالعات دانشگاه هاروارد نشان میدهد که وجود تنوع در کارکنان یک محیط به نفع مجموعه است با این وجود کارکنان چنین محیطهایی کمتر شاد هستند و کمتر احساس موفقیت میکنند [3]. اگر به کارکنان در این زمینه حق انتخاب داده میشد، آنها برای شادی خود محیطی با تنوع کمتر انتخاب میکردند هرچند این انتخاب به نفع مجموعه یا جامعه نباشد. دقیقاً به همین دلیل، انتخاب مدارس به مردم جامعه اجازهی «خودتفکیکی[۱۴]» میدهد. خانوادههای سیاهپوست مدارسی را انتخاب میکنند که اکثر دانشآموزان سیاهپوست هستند و سفیدپوستان مدارسی را ترجیح میدهند که بیشتر بچهها سفیدپوست هستند. این نوع گزینش حتی قبل از وجود دادههای باز هم صورت میگرفت اما با ظهور پدیدهی دادههای باز، خودتفکیکی افزایش یافته است. بدین سبب، مدارس ایالت نیویورک در کل آمریکا، بیشترین تفکیک و جداسازی را دارند [4]. دادههای باز سبب تفکیک و جداسازی گروههای مختلف جامعه شده است و بدون شک در درازمدت پیامدهای فردی و اجتماعی جدی را به دنبال خواهد داشت. حتی کودکان خانوادههای برخوردار در محیطهایی با تنوع گروههای اجتماعی، بهتر پرورش مییابند اما بسیاری از والدین این کودکان برخلاف چنین واقعیتی انتخاب میکنند.
هنگامی که دادههای باز را انتشار میدهیم به چه پیامدهای اجتماعی باید فکر کنیم؟ آیا دادههای باز به همدلی و وحدت بین آحاد جامعه کمک میکند؟ یا اینکه سبب جدایی و قطبیت بیشتر در جامعه میشود؟ چه کسی ارزشهای ما را تعیین میکند و چه کسی بر حرکت ما به سمت آن ارزشها نظارت میکند؟ اگر به جنبههای مختلف، مزایا و معایب دادههای باز فکر نکنیم، باز کردن دادهها و در دسترس قرار دادن آنها برای همه، به گسترش بیعدالتی و مشکلات ساختاری جامعه قوت میبخشد. مخلص کلام این است که دادههای باز که در ابتدا امری مطلوب و منصفانه به نظر میرسد، میتواند اثرات اجتماعی نامطلوبی داشته باشد و بنابراین در مورد آنها باید عمیقتر اندیشید.
جمعبندی
استفاده از علم داده نیازمند توجه به نکات اخلاقی بسیاری است. بخشی از این نکات اخلاقی مانند حریم خصوصی، مورد توجه ویژهای است و جنبههای گوناگون آن تا حد خوبی شناسایی شدهاند. مسائل حریم خصوصی، ناشناس ماندن، مالکیت داده و اعتبارسنجی داده و کاربست علم داده در فصلهای قبل بررسی شد. در این فصل هدف ما بررسی پیامدهای اجتماعی کاربست علم داده بود. پیشبینی پیامدهای اجتماعی علم داده، دشوارترین پیشبینی در کاربست علم داده است. دانشمندان علم داده در فرآیند علم داده بیشتر به بخشهای ریاضی و بهینه کردن الگوریتمها توجه دارند. اگر در مورد مسائل اخلاقی فکر کنند در ابتدا به آن دسته از نکات اخلاقی توجه خواهند کرد که جنبهی قانونی و حقوقی پیدا کردهاند. با گذر از این مرحله، مسائل اخلاقی دیگری که اثرات آنها مشخصتر است مورد توجه قرار خواهد گرفت. بررسی اثرات اجتماعی معمولاً کار سختی است و پیشبینی آن در ابتدا نیاز به جامعنگری، گفتگو با متخصصان جامعهشناسی است. برای جلوگیری از اثرات اجتماعی منفی کاربست علم داده در جامعه، متخصصان علم داده و کسبوکارهای دادهمحور باید در مورد محصولات دادهمحور خود به صورت مرتب بازخورد دریافت کنند و مسیر خود را مطابق با مصالح جمعی اصلاح نمایند.