faceprince

Facebook กับ Princeton อะไรจะ “เจ๊ง” ก่อนกัน?

“Correlation is not causation” คำพูดติดปากของนักเศรษฐศาสตร์ยุคใหม่ กลายเป็นประเด็นในเชิงสังคมของนักวิทยาศาสตร์จาก Princeton ถึงการเกิดขึ้นและดับไปของ Facebook ที่นักวิทยาศาสตร์จาก Facebook เอาคืนด้วยแบบจำลองเดียวกันและสรุปว่า Princeton เองก็กำลังจะดับไปเช่นกัน

……….


มื่อช่วงต้นปีที่ผ่านมา มีดราม่าครั้งใหญ่ของวงการ IT ที่น่าสนใจสำหรับนักเศรษฐศาสตร์ด้วย เรื่องของเรื่องมีอยู่ว่า นักวิชาการจากภาควิชาวิศวกรรมเครื่องกลและอากาศยาน แห่งมหาวิทยาลัย Princeton ได้นำเสนอบทความชิ้นหนึ่งที่ทำการวิเคราะห์ว่า Facebook จะสูญเสียผู้ใช้งานลงไปประมาณ 80% เมื่อเปรียบเทียบกับในขณะนั้น และอาจจะต้องปิดตัวลงในเวลาหลังจากนั้นไม่นาน

บทความนี้อาจไม่ได้รับความสนใจมากนัก หากไม่ได้ถูกโต้แย้งกลับโดยนักวิทยาศาสตร์ที่ทำงานวิจัยอยู่ใน Facebook เอง ข้อโต้แย้งที่สำคัญเป็นประเด็นเดียวกับงานทางด้านเศรษฐมิติยุคใหม่ (Modern Econometrics) ซึ่งก็คือ “ความสัมพันธ์ทางสถิติไม่ใช่สิ่งเดียวกับความสัมพันธ์เชิงเหตุผล” (Correlation is not causation) โดยพวกเขานำเอาเทคนิควิธีที่นักวิทยาศาสตร์จาก Princeton วิเคราะห์จุดจบของ Facebook กลับไปวิเคราะห์ Princeton เอง และพบว่า Princeton จะต้องปิดตัวก่อน Facebook เสียอีก [น่ากลัวกันจริงๆ -"-]

“Nassau hall อาคารที่เก่าแก่ที่สุดของมหาวิทยาลัย Princeton” (ที่มาของภาพ)

Nassau_hall_princeton_university

เรื่องทั้งหมดเริ่มจาก Cannarella and Spechler (2014) ทำการมองการขยายตัวของเครือข่ายสังคมออนไลน์ (Online Social Networks; OSNs) ด้วยแบบจำลองทางด้านระบาดวิทยา (Epidemiological Models) โดยพวกเขาพิจารณาเครือข่ายสังคมออนไลน์สองประเภทคือ Facebook และ MySpace (ใช้ประสบการณ์ของ MySpace เป็นตัวควบคุมการอธิบายผลของ Facebook) นั่นหมายความว่า พวกเขามองปรากฎการณ์เหล่านี้ด้วยรูปแบบการแพร่กระจายของไวรัส ซึ่งมีสองช่วงเวลาคือช่วงของการติดเชื้อ (Infection) ที่ไวรัสระบาดเพิ่มขึ้น และช่วงของการฟื้นตัว (Recovery) ที่ไวรัสเริ่มลดลงอันเนื่องจากภูมิต้านทานที่สูงขึ้น และนี่คือสาเหตุที่พวกเขาเลือกใช้แบบจำลองที่มีชื่อว่า SIR model (Suspected-Infected-Recovered)

……….

Cannarella and Spechler (2014) ใช้ข้อมูลจาก Search Query จาก Google Trends ตั้งแต่ปี 2004 ถึงต้นปี 2014 มาวิเคราะห์ ดังภาพที่ ๑ ซึ่งจะเห็นว่า MySpace มีอายุอยู่ในช่วง 2004 ถึง 2012 โดยได้รับความนิยมสูงที่สุดในช่วงประมาณปลายปี 2007 ขณะที่ Facebook เกิดขึ้นมาตั้งแต่ปี 2006 และได้รับความนิยมสูงที่สุดในช่วงปลายปี 2013

“ภาพที่ ๑ ปริมาณการค้นหาข้อมูลของ MySpace และ Facebook จาก Google Trends”

Screenshot 2014-03-20 18.26.04

พวกเขานำเอาแบบจำลอง SIR มาจับกับวงจรชีวิตของ MySpace ได้ผลดังภาพที่ ๒ ซึ่งจะเห็นว่าแบบจำลองนี้สามารถอธิบายการเกิดขึ้นและจบลงของเครือข่ายสังคมออนไลน์ได้ค่อนข้างดี (ข้อมูลจริงค่อนข้างฟิตกับเส้นประมาณการของแบบจำลอง)

“ภาพที่ ๒ ปริมาณการค้นหาข้อมูลของ MySpace และผลการประมาณค่าจากแบบจำลอง SIR (ซ้าย) และ irSIR หรือ SIR ปรับค่า (ขวา)”

Screenshot 2014-03-20 18.26.32

เมื่อนำเอาแบบจำลอง SIR ดังกล่าวมาวิเคราะห์ข้อมูล Query ของ Facebook และพยากรณ์ต่อไปในอนาคต ดังภาพที่ ๓ จะพบว่า Facebook น่าจะมีความนิยมลดลงจนเหลือประมาณ 20% ของความนิยมสูงที่สุด (พิจารณาจากเส้นตรงแนวราบที่มีค่า y=20) ประมาณปี 2015 ถึง 2017

“ภาพที่ ๓ ปริมาณการค้นหาข้อมูลของ Facebook และผลการประมาณค่าจากแบบจำลอง SIR”

Screenshot 2014-03-20 18.26.43

……….

แน่นอนว่า Facebook ก็คงไม่อยู่นิ่งเป็นแน่ Mike Develin นักวิทยาศาสตร์ฝั่ง Facebook ชี้ให้เห็นจุดอ่อนบางประการของงานวิจัยว่า ๑) MySpace กับ Facebook ไม่เหมือนกัน การเกิดขึ้นและจบลงของ MySpace ไม่เกี่ยวข้องและไม่อาจนำมาใช้วิเคราะห์ Facebook ได้ ๒) วงจรชีวิตของ Facebook ไม่เหมือนกับแบบจำลองระบาดวิทยา เพราะเครือข่ายสังคมออนไลน์ไม่ได้เหมือนกับการแพร่กระจายของไวรัสเสียทั้งหมด และ ๓) Search Query จาก Google Trends ที่ลดลงนั้น มาจากการที่ผู้ใช้ใช้ Facebook ผ่าน App ในโทรศัพท์มือถือโดยตรง จึงไม่ถูกนับโดย Google Trends ดังนั้นการที่กล่าวว่าความนิยมต่อ Facebook ลดลงอาจไม่ถูกต้องนัก

ที่เจ็บแสบกว่านั้น เขาได้นำเอากรอบแนวคิดแบบจำลอง SIR ที่ Cannarella and Spechler (2014) ใช้วิเคราะห์ Facebook กลับไปวิเคราะห์ Princeton เอง และยังได้ปิดจุดอ่อนบางประการด้วย Develin ใช้จำนวนการตีพิมพ์บทความวิชาการของ Princeton ตั้งแต่ปี 1940 จนถึงปัจจุบันมาวิเคราะห์การเกิดขึ้นและดับลงของ Princeton ทั้งนี้ เพราะจำนวนบทความที่ตีพิมพ์ในวารสารวิชาการเป็นสิ่งที่สำคัญมากๆ ต่อการอยู่รอดของมหาวิทยาลัยในสหรัฐอเมริกา โดยเฉพาะมหาวิทยาลัยที่มีชื่อเสียงระดับต้นๆ

ผลการวิเคราะห์แสดงได้ตามภาพที่ ๔ ซึ่งจำนวนบทความตีพิมพ์ในวารสารวิชาการของ Princeton กำลังลดลง และเมื่อใช้แบบจำลอง SIR มาวิเคราะห์จะพบว่าการตีพิมพ์ดังกล่าวจะลดลงจนเกือบจะหมดไปตั้งแต่ก่อนปี 2020 ซึ่งมีอัตราการลดลงเร็วกว่าความนิยมของ Facebook เสียอีก

“ภาพที่ ๔ ปริมาณการตีพิมพ์บทความวิชาการของ Princeton และผลการประมาณค่าจากแบบจำลอง SIR”

1620405_10101235002950981_70269004_n

……….

Develin ได้วิเคราะห์เพิ่มเติมอีกสองประเด็นเพื่อปิดข้อโต้แย้งที่จะเกิดขึ้น ประเด็นแรก เขาเริ่มจากการพิจารณาความสัมพันธ์ระหว่างปริมาณการค้นหาข้อมูลของมหาวิทยาลัยทางอินเตอร์เน็ต (Search Index) กับจำนวนนักศึกษาที่สมัครเข้าเรียนในมหาวิทยาลัยนั้นๆ (Enrollment) โดยเขาพบว่ามีความสัมพันธ์กันในทางบวกอย่างชัดเจน ดังภาพที่ ๕ หรือกล่าวได้อีกอย่างว่ามหาวิทยาลัยที่ถูกค้นหาทางอินเตอร์เน็ตมากก็จะมีนักศึกษาสมัครเข้าเรียนมากตามไปด้วย

“ภาพที่ ๕ ความสัมพันธ์ของปริมาณการค้นหาข้อมูลกับจำนวนผู้สมัครของมหาวิทยาลัยแต่ละแห่ง”

1619301_10101234999373151_143520663_n

จากนั้นเขาพิจารณาปริมาณการค้นหาข้อมูลเกี่ยวกับมหาวิทยาลัย Princeton และพบว่าลดลงอย่างต่อเนื่องตั้งแต่ปี 2004 ดังภาพที่ ๖ นั่นย่อมหมายความปริมาณการสัมครหรือความสนใจที่จะสมัครของนักศึกษาที่มีต่อมหาวิทยาลัย Princeton กำลังลดลงด้วย โดยจะลดลงเหลือครึ่งหนึ่งจากจำนวนความสนใจในปัจจุบันในปี 2018 และจะไม่มีนักศึกษามาสมัครเลยในปี 2021

“ภาพที่ ๖ ปริมาณการค้นหาข้อมูลของมหาวิทยาลัย Princeton”

1554436_10101235002137611_1432444798_n

สำทับด้วยประเด็นที่สองจากข้อมูลการกด LIKE เพจของ Princeton กับมหาวิทยาลัยคู่แข่งอย่าง Harvard และ Yale ก็พบว่าของ Princeton มีลดลงมานานแลัว และยังไม่มีแนวโน้มจะเพิ่มขึ้นอีกด้วย ดังภาพที่ ๗

“ภาพที่ ๗ ปริมาณการ LIKE ของมหาวิทยาลัย Princeton และมหาวิทยาลัยคู่แข่ง”

1601297_10101234997676551_1912211356_n

……….

ข้อสรุปของ Develin ที่มีต่อ Cannarella and Spechler (2014) ก็คือการนำเอาแบบจำลองใดใดก็ตามมาวิเคราะห์ความเป็นจริง จำเป็นต้องคำนึงถึงบริบทหลายประการ ไม่ใช่แค่หาคำตอบและสรุปจากแบบจำลองเท่านั้น นั่นก็คือ ผลที่ได้จากตัวเลขไม่ได้บอกเหตุและผลเสมอไป เขาจึงนำเอาวิธีคิดเดียวกันมาวิเคราะห์องค์กรที่ Cannarella and Spechler (2014) สังกัดอยู่ นั่นก็คือ Princeton และตั้งคำถามว่ามันจะเป็นอย่างนั้นจริงๆ หรือ

“ภาพบรรยากาศภายในสถานที่ทำงานของ Facebook” (ที่มาของภาพ)

facebook4

อย่างไรก็ตาม อย่าเครียดมากกับข้อถกเถียงนี้นะครับ เพราะ Develin เองก็เขียนในข้อสรุปของเขาว่า เขารัก Princeton และ Princeton ก็ผลิตนักวิทยาศาสตร์เก่งๆ จำนวนมาก เพียงแต่ Correlation is not causation นะครับ เพื่อนๆ ^^






ที่มา:
- John Cannarella, Joshua A. Spechler (2014) “Epidemiological modeling of online social network dynamics” Social and Information Networks (cs.SI); Physics and Society (physics.soc-ph).
- Mike Develin (2014) “Debunking Princeton” online here.

featured image from here

  • Akedemo

    “S” ใน SIR model น่าจะย่อมาจาก susceptible หมายถึงประชากรที่มีโอกาสติดเชื้อ
    “R” ย่อมาจาก removed หมายถึงประชากรที่ออกไปจาก Model แล้วเพราะหายติดเชื้อแล้วสร้างภูมิคุ้มกันหรือเพราะป่วยตายไปแล้ว

  • Passara Thapthimdaeng

    เดี๋ยวนี้ไม่ว่างเขียนแล้วหรอคะ หายไปเป็นปีเลย สมัยก่อนชอบอ่านมาก มีประโยชน์และเข้าใจง่าย อยากให้เขียนต่อจังเลยค่ะ

  • Mai Natchada Kongsri

    โหดดดมากกกกกกก…ชอบๆๆอันนี้ ^^