บริษัทเทคโนโลยียักษ์ใหญ่ 4 อันดับแรกของโลกอย่าง Google, Facebook, Amazon และ Alibaba ล้วนเป็นบริษัทที่ทำรายได้หลัก หรือบางส่วนจากข้อมูลของผู้ใช้งานทั้งสิ้น จนมีคำกล่าวที่ว่า ถ้าคุณไม่ได้ซื้อสินค้า และคุณก็ไม่ใช่ลูกค้า แสดงว่าคุณนั่นแหละคือสินค้า

If you are not paying for it, you’re not the customer; you’re the product being sold

Andrew Lewis

โดยข้อมูลในระบบจะถูกนำไปใช้สร้างระบบ Recommendation , Personalize marketing, Image classification และเทคโนโลยีปัญญาประดิษฐ์ล้ำหน้าอื่น ๆ ซึ่งมีโครงสร้างพื้นฐานจากที่ทุกคนยิมยอมเปิดเผยข้อมูลเหล่านั้นแก่ตัวบริษัทเพื่อใช้บริการออนไลน์เหล่านั้นได้แบบฟรี ๆ

พื้นฐานของเทคโนโลยีปัญญาประดิษฐ์คือ ข้อมูลที่มีคุณภาพ

ในโลกของเทคโนโลยีเป็นที่รู้กันดีว่า Garbage In, Garbage Out กล่าวคือเทคโนโลยีเหล่านี้ อยู่บนพื้นฐานของการมีข้อมูลที่มีคุณภาพสูงที่ได้มาจากผู้ใช้งานในระบบ หากข้อมูลที่ได้จากผู้ใช้งานไม่สมบูรณ์ มีการปลอมแปลง หรือมีจำนวนน้อยลง จะส่งผลต่อคุณภาพของเทคโนโลยีปัญญาประดิษฐ์ได้ นี่จึงเป็นช่องว่างที่ช่วยให้สาธารณชนในฐานะเจ้าของข้อมูล (Data subject) สามารถมีอำนาจต่อรองกับบริษัทเทคโนโลยีเหล่านั้น โดยการเลือกให้หรือไม่ให้ข้อมูลเหล่านั้น ซึ่งส่งผลต่อตัวเทคโนโลยีปัญญาประดิษฐ์เหล่านี้โดยตรงจนเกิดคำว่า Data Activism หรือการเคลื่อนไหวทางการเมืองโดยใช้ข้อมูลเป็นเครื่องมือต่อรอง

Garbage In, Garbage Out คือถ้าคุณใส่ข้อมูลขยะลงไป คอมพิวเตอร์ก็จะตอบคำถามของคุณด้วยขยะเช่นกัน เพื่อให้โปรเจคด้านข้อมูลของคุณมีประสิทธิภาพ คุณอาจจะต้องเริ่มตั้งแต่การเก็บข้อมูลให้เป็น Machine readable format หากคุณผู้อ่านสนใจ เรายังมีบทความ รู้จัก Machine readable format แนวทางการจัดเก็บข้อมูลที่วิเคราะห์ต่อง่าย และ คนใช้ข้อมูลชอบ ให้ได้ศึกษาเพิ่มเติมด้วย

กลไกสำคัญที่ทำให้สาธารณชนสามารถใช้ข้อมูลเป็นเครื่องต่อรองได้

เรื่อง Data Activism เป็นเรื่องใหม่มาก ๆ เพราะมีหลาย ๆ ปัจจัยที่ให้เกิดอำนาจต่อรองดังนี้

  1. การเกิดขึ้นกฏหมายคุ้มครองข้อมูลส่วนบุคคลที่เข้มแข็งทั่วโลก
    กฏหมายคุ้มครองข้อมูลส่วนบุคคลอย่าง GDPR, CCPA และ PDPA ให้สิทธิเจ้าของข้อมูลในการควบคุมข้อมูลของตัวเองในการลบ หรือไม่ให้ข้อมูลหากไม่เห็นด้วยกับนโยบายความเป็นส่วนตัวของบริษัทเหล่านั้น โดยมีโทษปรับอย่างชัดเจนหากบริษัทละเมิดสิทธิของผู้ใช้ซึ่งไม่เหมือนกับในอดีต
  2. พฤติกรรมผู้บริโภคที่หันมาใส่ใจเรื่องความเป็นส่วนตัวมากขึ้น
    ในกลุ่มนักการตลาดเริ่มพูดถึง Segment การตลาดใหม่อย่าง Privacy Actives ที่พร้อมจะเปลี่ยนแบรนด์ทันที หากรู้สึกได้ถึงความไม่โปร่งใสในการใช้ข้อมูลส่วนตัวของพวกเขา โดยมองเรื่อง ความเป็นส่วนตัว ในมุมมองเดียวกับประเด็นปัญหาทางสังคม และสิทธิมนุษยชนอื่น ๆ ที่แบรนด์ต่าง ๆ ควรมีความรับผิดชอบทางสังคมด้วย
  3. การเจาะระบบฐานข้อมูลที่เกิดขึ้นอยู่ทุกวัน ทำให้คนเริ่มกังวลเกี่ยวกับการให้ และดูแลรักษาข้อมูลของบริษัทเหล่านี้
    ในยุคนี้ มีการโจมตีทางไซเบอร์เป็นเรื่องปกติ ตั้งแต่ Ransomware, Wannacry, DDos ดังนั้นถึงแม้ว่าเราจะไม่ได้สนใจว่าบริษัทจะเอาข้อมูลเราไปทำอะไรบ้าง แต่ก็ต้องเป็นกังวลว่าจะเกิดอะไรขึ้นถ้าข้อมูลของเรารั่วไหลออกไปสู่มือผู้ไม่หวังดี โดยเฉพาะข้อมูลที่อ่อนไหวมาก ๆ เช่นข้อมูลสุขภาพ ข้อมูลทางการเงินที่เราได้ให้ข้อมูลไว้กับบริษัทเทคโนโลยีต่าง ๆ
  4. การเกิดขึ้นของสินค้า และบริการทางเลือกที่ใส่ใจความเป็นส่วนตัว
    ผู้ใช้งานทั่วไปในปัจจุบันสามารถเลือกใช้สินค้าและ บริการที่ไม่มีนโยบายเก็บข้อมูลผู้ใช้ใดใดเลยได้ (โดยที่สินค้าและบริการเหล่านี้ส่วนใหญ่ยังใช้งานได้ฟรีเหมือนเดิม) อย่างเช่น ใช้ Instant Messenger อย่าง Signal แทนที่จะใช้ Whatsapp, ใช้ Search engine อย่าง DuckDuckGo แทนการใช้ Google และท่องอินเตอร์เน็ตด้วย Tor แทนการใช้ Chrome
    การเกิดขึ้นของบริการทางเลือกเหล่านี้จึงเป็นช่องทางให้เรายังคงสามารถใช้ประโยชน์จากเทคโนโลยีเหล่านี้โดยไม่ต้องลดความเป็นส่วนตัวลงแม้แต่น้อย

3 กลยุทธ์สำคัญในการต่อรองกับบริษัทเทคโนโลยียักษ์ใหญ่

โดยนักวิจัยจาก Northwestern University ได้ออกงานวิจัยเรื่อง Data Leverage: A Framework for Empowering the Public in its Relationship with Technology Companies ซึ่งกล่าวถึง 3 กลยุทธ์สำคัญในการแสดงออกทางการใช้ข้อมูลเพื่อเรียกร้องต่อบริษัทเทคโนโลยี (Data Union) เหมือนที่สหภาพแรงงานเรียกร้องต่อโรงงานอุตสาหกรรมในอดีต (Labor Union) ดังนี้

1 Data Strikes

Data Strikes หมายถึงการลบข้อมูล หรือหยุดการใช้งานบริการจากบริษัทนั้น หรือใช้ซอฟแวร์พิเศษเพื่อปิดกั้นการเก็บข้อมูลโดยเฉพาะอย่าง Privacy Badger และ AdBlock เพื่อเป็นการประท้วง วิธีการนี้ทำให้เหล่า Data Activist ต้องหยุดใช้งานบริการทางอินเตอร์เน็ตเหล่านั้นซึ่งอาจส่งผลต่อการใช้ชีวิต เหมือนอย่างที่ Kashmia Hill นักข่าวของ Gizmodo ได้เคยลองหยุดใช้บริการเหล่านี้ ก่อนที่จะมาพบว่ามันยากเพียงใด ที่จะใช้ชีวิตโดยไม่มีเทคโนโลยีเหล่านี้

ต้องทำมากแค่ไหน ?

ในการทำ Data Strikes ต้องการคนเข้าร่วมขบวนการอย่างน้อย 30% ของผู้ใช้ทั้งหมดในระบบ จึงจะส่งผลต่อประสิทธิภาพของระบบปัญญาประดิษฐ์ในระบบถึง 50% อ้างอิงจากกรณีของระบบ Movie Recommendation

กรณีศึกษานี้เคยทำสำเร็จมาแล้ว กับบริษัท Facebook ที่ได้มีประกาศนโยบายการแบ่งปันข้อมูลแอปพลิเคชั่น Whatsapp กับเครือบริษัท Facebook เหตุการณ์ครั้งนั้นทำให้ผู้ใช้ส่วนใหญ่ (หลักล้านคน) หยุดการใช้งานและลบ Whatsapp แล้วไปใช้บริการทางเลือกแทนอย่าง Signal, Telegram จนทางบริษัท Facebook ต้องเลื่อนนโยบายออกไปอย่างไม่มีกำหนด

2 Data Poisoning

Data Poisoning เป็นวิธีการที่ร้ายกว่า Data Strikes กล่าวคือแทนที่จะเลิกให้ข้อมูลแก่บริษัท ผู้ประท้วงเลือกที่จะให้ข้อมูลแบบผิด ๆ แทน การกระทำที่เข้าข่ายกรณีนี้ได้แก่ การสร้างบัญชีผู้ใช้ปลอม ๆ การให้ข้อมูลปลอม ๆ การดูหนัง/ อ่านบทความที่ตัวเองไม่ได้สนใจ หรือไปจนถึงการติดตั้งโปรแกรม AdNauseam ที่เป็น Browser extension ที่จะคลิกโฆษณาทุกอันที่ปรากฏบน newsfeed ซึ่งจะส่งผลต่อระบบ Recommendation และ Market prediction ในอนาคต

วิธีการนี้เหล่า Data Activist จะต้องมีความรู้ทางเทคโนโลยีขั้นสูงเพื่อจงใจให้ข้อมูลแบบผิด ๆ และหากไม่มีเป้าหมายที่ชัดเจน การทำ Data Poisoning อาจจะเป็นผลดีต่อเทคโนโลยีปัญญาประดิษฐ์ด้วยซ้ำ ที่จู่ ๆ ก็มีคนมาช่วยพัฒนาระบบจากการใส่ข้อมูลที่ผิดลงไป ทำให้เทคโนโลยีปัญญาประดิษฐ์นั้นทำงานได้ แม้ข้อมูลจะผิดปกติ

ต้องทำมากแค่ไหน ?

ในการทำ Data Poisoning ต้องการคนเข้าร่วมขบวนการอย่างน้อย 3%-5% ของชุดข้อมูลทั้งหมด ก็เพียงพอต่อการทำให้ระบบ Classification ง่าย ๆ ทำงานผิดพลาดได้แล้ว สำหรับคนที่สนใจศึกษาเพิ่มเติม ลองอ่าน Certified defenses for data poisoning attacks. In Advances in neural information processing systems. และ Witches’ Brew: Industrial Scale Data Poisoning via Gradient Matching

3 Conscious Data Contribution

วิธีการนี้เหล่า Data Activist ไม่จำเป็นต้องเลิกใช้บริการทางอินเตอร์เน็ต แบบ Data Strikes ไม่จำเป็นต้องมีความรู้ทางเทคโนโลยีแบบ Data Poisoning เพียงแค่เลือกใช้บริการ หรือให้ข้อมูลกับบริษัทคู่แข่งที่มีจรรยาบรรณมากกว่าเพื่อเพิ่มศักยภาพในการแข่งขันให้กับบริษัทคู่แข่ง หรือบริจาคข้อมูล (Data Donation) ให้กับองค์กรไม่แสวงหาผลกำไรอย่าง Mozilla เพื่อให้องค์กรสามารถสร้างสินค้าทางเลือกดี ๆ ให้เราใช้ได้ อย่างองค์กร Mozilla ก็มีโครงการ Mozilla Common Voice ให้ทุกคนสามารถบริจาคเสียง เพื่อนำมาใช้ในการพัฒนาระบบรู้จำเสียงพูด (Voice Recognition)

ความท้าทาย และโอกาสใหม่ ๆ ของ Data Activism

การเคลื่อนไหวด้วยการใช้ข้อมูลเป็นเครื่องต่อรองยังเป็นเรื่องใหม่มาก ๆ ที่ยังถูกตั้งคำถามถึงขอบเขตของการกระทำ เช่นการทำ Data Poisoning อาจทำให้ระบบปัญญาประดิษฐ์ที่มีเจตนาที่ดีทำงานผิดพลาดได้ หรือกรณีศึกษาของ Wikipedia ที่เป็นแพลตฟอร์มเปิดในการทำสารานุกรมออนไลน์ที่มีบางช่วง มีแต่ข้อมูลไม่มีคุณภาพ

รวมไปถึงที่ในวงการวิชาการยังตั้งคำถามถึงประสิทธิภาพของวิธีการเหล่านี้ จึงเป็นการบ้านที่ทำให้เหล่านักวิจัยต้องศึกษา Social movement นี้ต่อไป

ไม่แน่ว่าในอนาคตเราอาจจะได้เห็นแคมเปญทางด้านข้อมูลที่เชิญชวนในรูปแบบที่ว่า ถ้าเราสามารถหาคนเข้าร่วมขบวนการได้ X คนเพื่อเข้าร่วมการ Data Strike ต่อบริษัท Y เราสามารถคาดการณ์ได้ว่าจะลดความแม่นยำของเทคโนโลยีปัญญาประดิษฐ์ของบริษัทนั้นลง Z% ซึ่งเพียงพอให้บริษัทนั้นทำตามสิ่งที่ผู้เข้าร่วมเรียกร้อง

มีคำถามสงสัยเพิ่มเติม ?

หากคุณสนใจเกี่ยวกับเรื่องที่เราเขียน สิ่งที่เราทำ และโครงการที่เราตั้งใจจะดำเนินงานในอนาคต คุณสามารถติดต่อพูดคุยกับเราได้


ขอบคุณแหล่งอ้างอิง: