อันที่จริงตัวผู้เขียนก็พอได้ทราบข่าวสารทางช่องทางต่างๆเกี่ยวกับกรณี Cambridge Analytica หรือ CA ซึ่งเป็นบริษัทลูกของ SCL (Strategic Communication Laboratories) ที่ใช้ข้อมูลของผู้ใช้งานจาก Facebook ต่อการแทรกแซงการเลือกตั้งประธานาธิบดีของสหรัฐอเมริกาในปี ค.ศ.2016 แต่ก็เหมือนกับหลายๆท่านคือแค่รับทราบ อาจเป็นเพราะคิดว่าเป็นเรื่องของประเทศอื่น คงไม่ได้เกี่ยวข้องกับประเทศเรากระมัง เลยไม่ได้ตระหนักถึงภาวะเสี่ยงที่อาจมี (หรือมีแล้ว) ต่อประเทศไทยก็เป็นได้ แต่เมื่อได้ดูภาพยนตร์เรื่อง The Great Hack ที่ออกฉายทาง Netflix ทำให้ตระหนักได้ว่าต้องเขียนบทวิเคราะห์นี้เพื่อชี้ให้เห็นถึงประโยชน์และโทษของการใช้เทคโนโลยี ซึ่งเนื้อหาในภาพยนตร์กล่าวถึงการเปิดโปง สัมภาษณ์และสืบสวนต่อการกระทำของ CA ซึ่งเป็นผู้รับจ้างในการวิเคราะห์และสร้างแคมเปญหาเสียงให้ Donald Trump เพื่อชิงตำแหน่งประธานาธิบดีของอเมริกา โดยได้ใช้ข้อมูลของผู้ใช้งานจาก Facebook มาใช้ในการวิเคราะห์และสร้างแคมเปญที่สนับสนุน Donald Trump รวมทั้งสร้างแคมเปญที่ใช้ในการลดความน่าเชื่อถือฝั่ง Hillary Clinton จน Donald Trump ได้รับชัยชนะ จากข้อเท็จจริงและเนื้อเรื่องในภาพยนตร์เป็นที่ประจักษ์แล้วว่าทาง CA ได้ออกมายอมรับผิด ยื่นขอล้มละลายกิจการและเลิกกิจการ แต่บริษัท SCL ซึ่งเป็นบริษัทแม่ยังคงอยู่ รวมทั้งเมื่อวันที่ 12 กรกฎาคม 2019 ที่ผ่านมาทาง Facebook ยอมจ่ายค่าปรับราว 5,000 ล้านยูเอสดอลลาร์ หรือมากกว่า 150,000 ล้านบาท โดยคำสั่ง FTC (The Federal Trade Commission) โทษฐานไม่สามารถปกป้องข้อมูลส่วนตัวของผู้ใช้งานจนทำให้ CA ซึ่งอ้างว่าซื้อข้อมูลมา สามารถใช้ข้อมูลของผู้ใช้งานกว่า 30 ล้านราย (คิดเฉพาะข้อมูลของผู้ใช้งานในสหรัฐอเมริกาที่ถูกกล่าวอ้างในภาพยนตร์เพื่อใช้วิเคราะห์หาเสียงเลือกตั้ง และประเมินว่าการปรับเงินจาก Facebook ทำได้เฉพาะข้อมูลส่วนบุคคลของประชาชนอเมริกาที่ถูกละเมิดเท่านั้น) ไปใช้ในการวิเคราะห์พฤติกรรมและสร้างแคมเปญต่างๆจนส่งผลต่อการเลือกตั้ง ซึ่งเป็นค่าปรับที่มากที่สุดในประวัติศาสตร์ที่เกี่ยวข้องกับการละเมิดสิทธิส่วนบุคคล
โดยส่วนตัวผู้เขียนถือว่าเป็นผู้มีความรู้ (นิดหน่อย) เกี่ยวกับเทคโนโลยี ที่เกี่ยวข้องกับภาพยนตร์เรื่องนี้ซึ่งก็คือ Big Data และ Machine Learning ซึ่งเป็นเรื่องของ Data science นั่นเอง โดยทั่วไปถ้าผู้ที่เคยศึกษาด้านนี้มักจะศึกษาและได้ทดลองจากการใช้ข้อมูลซึ่งเรียกว่า data set สำหรับการวิเคราะห์ต่างๆ ซึ่งข้อมูลที่ใหญ่สุดๆที่มีให้ลองโหลดจากอินเทอร์เน็ตมาเล่นกันอย่างมากที่สุดก็ประมาณเป็นหลักแสนเรคอร์ด แต่ในทางธุรกิจนั้นคำว่า Big data มักมีขนาดข้อมูลใหญ่กว่านั้นมากมาย ซึ่งในกรณีศึกษานี้ข้อมูลที่ได้มีที่มาจากการดอกเตอร์ Aleksandr Kogan ซึ่งเป็นศาสตราจารย์ด้านจิตวิทยาของมหาวิทยาลัยเคมบริดก์ ได้สร้างแอพพลิเคชันชื่อ This Is Your Digital Life เป็นแบบสอบถามเพื่อการศึกษาพฤติกรรมผู้ใช้งานเกี่ยวกับการดำเนินชีวิตในยุคดิจิทัล และมีผู้ใช้งาน Facebook ตอบประมาณ 270,000 ราย (บางบทความบอกว่า 305,000 ราย) ประเด็นอยู่ที่แอพพลิเคชันตัวนี้สามารถเข้าถึงข้อมูลส่วนบุคคลต่างๆที่เป็น friend ของผู้ใช้งานที่ใช้งานแอพพลิเคชันดังกล่าวได้อีกด้วย (นี่คือช่องโหว่ที่เป็นความผิดพลาดของ Facebook ที่ไม่ปกป้องการเข้าถึงข้อมูลอื่นโดยไม่ได้รับอนุญาตได้ ปัจจุบันช่องโหว่นี้คงถูกปิดแล้ว) ทำให้สามารถเข้าถึงข้อมูลต่างๆตั้งแต่ข้อมูลพื้นฐานรวมทั้งข้อมูลการใช้งานต่างๆของผู้ใช้งานเช่น เวลาที่โพสต์ โพสต์ที่เปิดอ่าน โพสต์ที่กด like และอื่นๆ รวมแล้วสามารถเข้าถึงข้อมูลผู้ใช้งานได้กว่า 87 ล้านรายทั่วโลกได้ ทำให้ CA มี data set ที่ใหญ่มากเรียกว่า Super Big Data กันเลยทีเดียว การมีข้อมูลขนาดใหญ่นี้เราสามารถนำมาวิเคราะห์ด้วยขั้นตอนวิธีต่างๆที่เรียกว่า Machine Learning เพื่อหาความสัมพันธ์ แนวโน้ม หรือการคาดการณ์ต่างๆ หรือวิเคราะห์หาพฤติกรรมต่างๆได้อย่างดี ขอยกตัวอย่างง่าย (แต่ไม่เกี่ยวกับกรณีนี้) เช่น ถ้ามินิมาร์ทเก็บข้อมูลการขายละเอียดพอ สามารถนำมาใช้ส่งเสริมการขายได้ โดยอาจจะวิเคราะห์ได้ว่าเวลาที่คนชอบซื้อนมกิน มักจะซื้อขนมแบบไหนไปกินด้วย และชอบซื้อกินเวลาไหน หรือกล่องนมขนาดไหนที่นิยม ผู้ผลิตหรือผู้ขายจะได้ทำการตลาดได้ตรงกลุ่ม ตรงช่วงเวลา หรือวางสินค้าขนมที่อยากส่งเสริมการขายใกล้ๆกับนมด้วย อย่างไรก็ตามการวิเคราะห์ข้อมูลขนาดใหญ่มากดังกล่าวมักต้องมีเทคโนโลยีและทรัพยากรทางการประมวลผลที่มีประสิทธิภาพสูงมาก ซึ่งเป็นเรื่องของ Data engineering นั่นเอง ถ้าไม่มีระบบประมวลผลที่มีประสิทธิภาพอาจใช้เวลานานมากกว่าจะประมวลผลเสร็จ ปัจจุบันมีเครื่องมือที่มีประสิทธิภาพหลายตัวเช่นการใช้ Hadoop และ/หรือ Spark เป็น platform สำหรับการประมวลผลขนาดใหญ่เป็นต้น
อันที่จริงแล้วเทคโนโลยีดังกล่าวมีประโยชน์มากต่อการวิเคราะห์หาคุณสมบัติร่วม ความเกี่ยวเนื่องร่วมกัน หรือประมาณการณ์แนวโน้ม ของสิ่งที่สนใจ เช่นการวิเคราะห์แนวโน้มการเป็นมะเร็งจากภาพเอกซ์เรย์เป็นต้น ต่อมาวงการธุรกิจได้ประยุกต์ใช้เทคโนโลยีดังกล่าวเพื่อการวิเคราะห์พฤติกรรมผู้บริโภค (เช่นที่ยกตัวอย่างเรื่องนม) โดยมุ่งหวังการสร้างยอดขายหรือกำไรให้มากขึ้น ซึ่งที่จริงก็ไม่ใช่ประเด็นที่น่าเป็นห่วง แต่การนำเทคโนโลยีนี้ไปใช้เพื่อสร้างการเปลี่ยนแปลงที่เกี่ยวพันกับอนาคตของประเทศเช่นการเลือกตั้ง เป็นสิ่งที่น่าเป็นห่วงมาก จากกรณีศึกษานี้และเนื้อหาในภาพยนตร์ได้ยืนยันแล้วว่ามีการใช้เทคโนโลยีนี้สร้างผลกระทบต่อการเลือกตั้งหรือลงประชามติที่สำคัญๆได้ และมีการเปิดเผยว่า CA เคยมีส่วนเกี่ยวข้องกับการเลือกตั้งกว่า 30 ประเทศ (ดูรูป) เช่นกรณีของประเทศทรินิแดดและโตเบโก ที่ CA ได้สร้างแคมเปญ Do So ให้กับผู้สมัครฝั่งชาวอินเดีย โดยวิเคราะห์พฤติกรรมและรณรงค์เจาะจงกลุ่มผู้เลือกตั้งหน้าใหม่ที่เป็นชาวพื้นเมืองผิวดำไม่ออกไปเลือกตั้ง โดยการให้ประชาสัมพันธ์และให้ข้อมูลที่มีเนื้อหาสร้างความเข้าใจผิดให้กลุ่มผู้เลือกตั้งรู้สึกผิดหวังต่อการเลือกตั้งที่ผ่านมา ส่งผลผู้เลือกตั้งกลุ่มนี้ไม่ออกไปใช้สิทธิ์กว่า 40% ในขณะที่ผู้เลือกตั้งหน้าใหม่ชาวอินเดียออกไปใช้สิทธิ์ตามปกติ ทำให้ผู้สมัครฝั่งชาวอินเดียชนะการเลือกตั้งในที่สุด หรือแม้กระทั่งกรณีของการเลือกตั้งประเทศสหรัฐอเมริกาตามที่ทราบกันอยู่ รวมทั้งกรณี Brexit ด้วย นอกจากนี้เนื้อหาในภาพยนตร์ยังมีการกล่าวถึงการสร้างแคมเปญในประเทศไทยด้วย (ขอไม่กล่าวถึง)
สาเหตุที่ควรจริงจังและสร้างมาตรการป้องกันเหตุการณ์ลักษณะนี้ก็คือ การใช้เทคโนโลยีเพื่อวิเคราะห์พฤติกรรม สร้างแนวทางการประชาสัมพันธ์ รวมทั้งการปรับเปลี่ยนพฤติกรรมของกลุ่มเป้าหมายด้วยเทคโนโลยีนี้มักได้ผลและมีประสิทธิภาพมาก เพราะสามารถวิเคราะห์พฤติกรรมและจำลองสถานการณ์ต่างๆเพื่อดูผลกระทบของการสร้างหรือบิดเบือนข้อมูลที่ผิดไปจากเดิมหรือสร้างข้อมูลลวง รวมทั้งห่วงโซ่ของข้อมูลที่ผิดเพี้ยน ทำให้การตัดสินใจของคนผู้รับข่าวสารเหล่านี้ผิดไปจากข้อมูลที่ควรจะเป็นข้อเท็จจริง ไม่ได้เป็นการติดสินใจที่อยู่บนพื้นฐานของความเข้าใจที่ถูกต้อง ทำให้กลุ่มบุคคลที่ใช้บริการจากผู้รับจ้าง เช่น CA หรือ SCL หรือผู้รับจ้างรายอื่น มีโอกาสต่อการสร้างความเปลี่ยนแปลงต่ออนาคตของประเทศได้ และไม่มีหลักประกันว่าผู้รับจ้างเหล่านี้อาจไม่ได้ถูกแทรกแซงหรือควบคุมจากผู้มีอำนาจอื่นเช่นประเทศอื่นๆอีกทอดหนึ่ง โดยในภาพยนตร์ผู้เปิดเผยข้อเท็จจริงท่านหนึ่งคือ Brittany Kaiser อดีตผู้อำนวยการฝ่ายพัฒนาธุรกิจของ CA ได้กล่าวว่าเทคโนโลยีนี้จัดว่าเป็นอาวุธในสงครามข่าวสาร (มีข้อมูลว่าเธอแอบมาหลบซ่อนตัวในประเทศไทย หลังจากที่เธอยอมเปิดเผยความเลวร้ายของ CA ต่อคณะกรรมการสอบสวนของสหรัฐอเมริกา)
ก่อนจบบทวิเคราะห์นี้ผู้เขียนได้บทสรุปอีกอย่างคือควรเปลี่ยนความคิดจาก
ผู้ใดครอบครองสื่อคือผู้ครองอำนาจ มาเป็น
ผู้ใดครอบครองข้อมูลคือผู้ครองอำนาจแทน

Source:
https://qz.com/1239762/cambridge-analytica-scandal-all-the-countries-where-scl-elections-claims-to-have-worked/
บทวิเคราะห์นี้เผยแพร่ที่
http://www.dpu.ac.th/mect/Thai_Study_from_CA_FB.html
เทคโนโลยีที่เกี่ยวข้องกรณี Cambridge Analytica และ Facebook (The Great Hack มีสปอยล์)
โดยส่วนตัวผู้เขียนถือว่าเป็นผู้มีความรู้ (นิดหน่อย) เกี่ยวกับเทคโนโลยี ที่เกี่ยวข้องกับภาพยนตร์เรื่องนี้ซึ่งก็คือ Big Data และ Machine Learning ซึ่งเป็นเรื่องของ Data science นั่นเอง โดยทั่วไปถ้าผู้ที่เคยศึกษาด้านนี้มักจะศึกษาและได้ทดลองจากการใช้ข้อมูลซึ่งเรียกว่า data set สำหรับการวิเคราะห์ต่างๆ ซึ่งข้อมูลที่ใหญ่สุดๆที่มีให้ลองโหลดจากอินเทอร์เน็ตมาเล่นกันอย่างมากที่สุดก็ประมาณเป็นหลักแสนเรคอร์ด แต่ในทางธุรกิจนั้นคำว่า Big data มักมีขนาดข้อมูลใหญ่กว่านั้นมากมาย ซึ่งในกรณีศึกษานี้ข้อมูลที่ได้มีที่มาจากการดอกเตอร์ Aleksandr Kogan ซึ่งเป็นศาสตราจารย์ด้านจิตวิทยาของมหาวิทยาลัยเคมบริดก์ ได้สร้างแอพพลิเคชันชื่อ This Is Your Digital Life เป็นแบบสอบถามเพื่อการศึกษาพฤติกรรมผู้ใช้งานเกี่ยวกับการดำเนินชีวิตในยุคดิจิทัล และมีผู้ใช้งาน Facebook ตอบประมาณ 270,000 ราย (บางบทความบอกว่า 305,000 ราย) ประเด็นอยู่ที่แอพพลิเคชันตัวนี้สามารถเข้าถึงข้อมูลส่วนบุคคลต่างๆที่เป็น friend ของผู้ใช้งานที่ใช้งานแอพพลิเคชันดังกล่าวได้อีกด้วย (นี่คือช่องโหว่ที่เป็นความผิดพลาดของ Facebook ที่ไม่ปกป้องการเข้าถึงข้อมูลอื่นโดยไม่ได้รับอนุญาตได้ ปัจจุบันช่องโหว่นี้คงถูกปิดแล้ว) ทำให้สามารถเข้าถึงข้อมูลต่างๆตั้งแต่ข้อมูลพื้นฐานรวมทั้งข้อมูลการใช้งานต่างๆของผู้ใช้งานเช่น เวลาที่โพสต์ โพสต์ที่เปิดอ่าน โพสต์ที่กด like และอื่นๆ รวมแล้วสามารถเข้าถึงข้อมูลผู้ใช้งานได้กว่า 87 ล้านรายทั่วโลกได้ ทำให้ CA มี data set ที่ใหญ่มากเรียกว่า Super Big Data กันเลยทีเดียว การมีข้อมูลขนาดใหญ่นี้เราสามารถนำมาวิเคราะห์ด้วยขั้นตอนวิธีต่างๆที่เรียกว่า Machine Learning เพื่อหาความสัมพันธ์ แนวโน้ม หรือการคาดการณ์ต่างๆ หรือวิเคราะห์หาพฤติกรรมต่างๆได้อย่างดี ขอยกตัวอย่างง่าย (แต่ไม่เกี่ยวกับกรณีนี้) เช่น ถ้ามินิมาร์ทเก็บข้อมูลการขายละเอียดพอ สามารถนำมาใช้ส่งเสริมการขายได้ โดยอาจจะวิเคราะห์ได้ว่าเวลาที่คนชอบซื้อนมกิน มักจะซื้อขนมแบบไหนไปกินด้วย และชอบซื้อกินเวลาไหน หรือกล่องนมขนาดไหนที่นิยม ผู้ผลิตหรือผู้ขายจะได้ทำการตลาดได้ตรงกลุ่ม ตรงช่วงเวลา หรือวางสินค้าขนมที่อยากส่งเสริมการขายใกล้ๆกับนมด้วย อย่างไรก็ตามการวิเคราะห์ข้อมูลขนาดใหญ่มากดังกล่าวมักต้องมีเทคโนโลยีและทรัพยากรทางการประมวลผลที่มีประสิทธิภาพสูงมาก ซึ่งเป็นเรื่องของ Data engineering นั่นเอง ถ้าไม่มีระบบประมวลผลที่มีประสิทธิภาพอาจใช้เวลานานมากกว่าจะประมวลผลเสร็จ ปัจจุบันมีเครื่องมือที่มีประสิทธิภาพหลายตัวเช่นการใช้ Hadoop และ/หรือ Spark เป็น platform สำหรับการประมวลผลขนาดใหญ่เป็นต้น
อันที่จริงแล้วเทคโนโลยีดังกล่าวมีประโยชน์มากต่อการวิเคราะห์หาคุณสมบัติร่วม ความเกี่ยวเนื่องร่วมกัน หรือประมาณการณ์แนวโน้ม ของสิ่งที่สนใจ เช่นการวิเคราะห์แนวโน้มการเป็นมะเร็งจากภาพเอกซ์เรย์เป็นต้น ต่อมาวงการธุรกิจได้ประยุกต์ใช้เทคโนโลยีดังกล่าวเพื่อการวิเคราะห์พฤติกรรมผู้บริโภค (เช่นที่ยกตัวอย่างเรื่องนม) โดยมุ่งหวังการสร้างยอดขายหรือกำไรให้มากขึ้น ซึ่งที่จริงก็ไม่ใช่ประเด็นที่น่าเป็นห่วง แต่การนำเทคโนโลยีนี้ไปใช้เพื่อสร้างการเปลี่ยนแปลงที่เกี่ยวพันกับอนาคตของประเทศเช่นการเลือกตั้ง เป็นสิ่งที่น่าเป็นห่วงมาก จากกรณีศึกษานี้และเนื้อหาในภาพยนตร์ได้ยืนยันแล้วว่ามีการใช้เทคโนโลยีนี้สร้างผลกระทบต่อการเลือกตั้งหรือลงประชามติที่สำคัญๆได้ และมีการเปิดเผยว่า CA เคยมีส่วนเกี่ยวข้องกับการเลือกตั้งกว่า 30 ประเทศ (ดูรูป) เช่นกรณีของประเทศทรินิแดดและโตเบโก ที่ CA ได้สร้างแคมเปญ Do So ให้กับผู้สมัครฝั่งชาวอินเดีย โดยวิเคราะห์พฤติกรรมและรณรงค์เจาะจงกลุ่มผู้เลือกตั้งหน้าใหม่ที่เป็นชาวพื้นเมืองผิวดำไม่ออกไปเลือกตั้ง โดยการให้ประชาสัมพันธ์และให้ข้อมูลที่มีเนื้อหาสร้างความเข้าใจผิดให้กลุ่มผู้เลือกตั้งรู้สึกผิดหวังต่อการเลือกตั้งที่ผ่านมา ส่งผลผู้เลือกตั้งกลุ่มนี้ไม่ออกไปใช้สิทธิ์กว่า 40% ในขณะที่ผู้เลือกตั้งหน้าใหม่ชาวอินเดียออกไปใช้สิทธิ์ตามปกติ ทำให้ผู้สมัครฝั่งชาวอินเดียชนะการเลือกตั้งในที่สุด หรือแม้กระทั่งกรณีของการเลือกตั้งประเทศสหรัฐอเมริกาตามที่ทราบกันอยู่ รวมทั้งกรณี Brexit ด้วย นอกจากนี้เนื้อหาในภาพยนตร์ยังมีการกล่าวถึงการสร้างแคมเปญในประเทศไทยด้วย (ขอไม่กล่าวถึง)
สาเหตุที่ควรจริงจังและสร้างมาตรการป้องกันเหตุการณ์ลักษณะนี้ก็คือ การใช้เทคโนโลยีเพื่อวิเคราะห์พฤติกรรม สร้างแนวทางการประชาสัมพันธ์ รวมทั้งการปรับเปลี่ยนพฤติกรรมของกลุ่มเป้าหมายด้วยเทคโนโลยีนี้มักได้ผลและมีประสิทธิภาพมาก เพราะสามารถวิเคราะห์พฤติกรรมและจำลองสถานการณ์ต่างๆเพื่อดูผลกระทบของการสร้างหรือบิดเบือนข้อมูลที่ผิดไปจากเดิมหรือสร้างข้อมูลลวง รวมทั้งห่วงโซ่ของข้อมูลที่ผิดเพี้ยน ทำให้การตัดสินใจของคนผู้รับข่าวสารเหล่านี้ผิดไปจากข้อมูลที่ควรจะเป็นข้อเท็จจริง ไม่ได้เป็นการติดสินใจที่อยู่บนพื้นฐานของความเข้าใจที่ถูกต้อง ทำให้กลุ่มบุคคลที่ใช้บริการจากผู้รับจ้าง เช่น CA หรือ SCL หรือผู้รับจ้างรายอื่น มีโอกาสต่อการสร้างความเปลี่ยนแปลงต่ออนาคตของประเทศได้ และไม่มีหลักประกันว่าผู้รับจ้างเหล่านี้อาจไม่ได้ถูกแทรกแซงหรือควบคุมจากผู้มีอำนาจอื่นเช่นประเทศอื่นๆอีกทอดหนึ่ง โดยในภาพยนตร์ผู้เปิดเผยข้อเท็จจริงท่านหนึ่งคือ Brittany Kaiser อดีตผู้อำนวยการฝ่ายพัฒนาธุรกิจของ CA ได้กล่าวว่าเทคโนโลยีนี้จัดว่าเป็นอาวุธในสงครามข่าวสาร (มีข้อมูลว่าเธอแอบมาหลบซ่อนตัวในประเทศไทย หลังจากที่เธอยอมเปิดเผยความเลวร้ายของ CA ต่อคณะกรรมการสอบสวนของสหรัฐอเมริกา)
ก่อนจบบทวิเคราะห์นี้ผู้เขียนได้บทสรุปอีกอย่างคือควรเปลี่ยนความคิดจาก ผู้ใดครอบครองสื่อคือผู้ครองอำนาจ มาเป็น ผู้ใดครอบครองข้อมูลคือผู้ครองอำนาจแทน
บทวิเคราะห์นี้เผยแพร่ที่ http://www.dpu.ac.th/mect/Thai_Study_from_CA_FB.html