การวิเคราะห์เครือข่ายสังคม(Social Network Analysis) ถือว่าเป็น Data Science หรือวิทยาศาสตร์ข้อมูลสายเฉพาะทางตัวหนึ่ง ซึ่งแค่เพียงชื่อก็ทำให้ผมสนใจมากครับ เพราะส่วนตัวเชื่อว่ามันเป็นศาสตร์ที่เหมาะสมในการวิเคราะห์ข้อมูลในยุคที่สังคมออนไลน์เฟื่องฟูอย่างในปัจจุบันเป็นอย่างมาก นับตั้งแต่นั้นมาก็ทำให้ผมศึกษาเพิ่มเติมจากหลากหลายแหล่ง จนมีความรู้และเข้าใจในระดับหนึ่ง วันนี้จึงอยากนำมาเล่าสู่กันฟัง พร้อมกรณีตัวอย่างที่น่าสนใจ
การวิเคราะห์เครือข่ายสังคม(Social Network Analysis) คืออะไร?
หัวใจสำคัญของการวิเคราะห์เครือข่ายสังคม หรือ Social Network Analysis(SNA) ก็คือ ข้อมูลที่จะใช้ในการวิเคราะห์ต้องเป็นลักษณะเครือข่ายความเชื่อมโยง ประกอบด้วย “จุด” และ “เส้น” โดยจุดแทนหน่วยของข้อมูล ส่วนเส้น แทนความสัมพันธ์ของหน่วยของข้อมูล เพียงเท่านี้เราก็สามารถนำ SNA มาวิเคราะห์ได้แล้ว ไม่ว่าจะเป็นรูปธรรม อย่างเครือข่ายของถนนในเมืองที่มี จุด คือ แยก และ เส้น คือ ถนนที่เชื่อมแต่ละแยกเข้าด้วยกัน ไปจนถึงสิ่งที่เป็นนามธรรม อย่างเครือข่ายความเป็นเพื่อนกันในห้องเรียน ที่มี จุด คือ นักเรียน และ เส้น คือ การเป็นเพื่อนสนิทกัน เป็นต้น(บางครั้งเราใช้คำว่า “โหนด” แทนคำว่า “จุด”)
SNA ถูกนำมาใช้งานในหลากหลายลักษณะ สำหรับด้านการวิจัยพัฒนาจะนำไปใช้วิเคราะห์เครือข่ายสังคมที่หลากหลายและกว้าง แต่ในทางธุรกิจแล้วส่วนใหญ่จะใช้ในการวิเคราะห์ข้อมูลบนสังคมออนไลน์เป็นหลัก ทั้ง Facebook twitter instagram และอื่น ๆ อีกมากมาย ด้วยเหตุนี้จึงทำให้มีโปรแกรมและเครื่องมือที่ทำออกมาวิเคราะห์เครือข่ายสังคมออนไลน์ออกมาเป็นจำนวนมาก แต่อย่างไรก็ตาม สังคมออนไลน์ที่ได้รับความนิยมในการใช้ SNA มากที่สุด ก็คือ twitter
ลักษณะการวิเคราะห์ข้อมูลของ SNA จะมีเป้าหมายหลัก ๆ อยู่ 2 อย่าง ได้แก่ ค้นหาจุดที่เป็นศูนย์กลางของเครือข่ายสังคม(centrality) และค้นหาจุดที่มีอิทธิพลมากที่สุดในเครือข่ายสังคม(influencers) นอกจากนี้ยังสามารถค้นหาความใกล้ชิดการของเครือข่าย ความเข้มแข็งของเครือข่าย และอื่น ๆ ได้อีกมากครับ ในส่วนนี้ผมจะไม่ขอลงไปสู่ทฤษฎีนะครับ บทความนี้จะขอแค่เพียงแนะนำให้เห็นภาพ แล้วทีนี้เราก็ไปดูตัวอย่างกันเลยดีกว่า :)
กรณีศึกษา: วิเคราะห์การพูดคุยกันใน twitter เกี่ยวกับ libra เงินสกุลดิจิทัลของ Facebook ด้วยโปรแกรม NodeXL
เครื่องมือที่ใช้ในการวิเคราะห์เครือข่ายสังคมมีอยู่หลายตัว แต่ผมเลือกใช้ NodeXL เหตุผลที่เลือกใช้งานขอเก็บไว้พูดคุยกันบทความต่อไปนะครับ วันนี้เรามาดูผลที่ได้จากการวิเคราะห์กันดีกว่า ซึ่ง NodeXL สามารถใช้งานวิเคราะห์สังคมออนไลน์ได้หลายตัว หลายฟังก์ชัน ทั้ง twitter Facebook youtube และอื่น ๆ ณ ที่นี้ เราจะมาดูการใช้งานบน twitter กันครับ
เมื่อเราเปิดโปรแกรมขึ้นมา ก็ไปที่เมนู “import from twitter search network” (หากต้องการค้นหาตาลิสต์รายชื่อบัญชีใน twitter ก็ให้เข้าไปที่เมนู “import from twitter users network”) แล้วใส่คำค้นหาที่ต้องการ วันนี้เราจะลองดูคำว่า “libra” สกุลเงินดิจิทัลตัวใหม่ของ Facebook ว่ามีการพูดคุยกัน twitter อย่างไรบ้าง และบัญชีใดที่เป็นศูนย์กลางของการพูดคุย และบัญชีใดที่มีอิทธิพลต่อการส่งต่อข่าวสารเหล่านั้น โดยเมนูนี้เราจะสามารถเลือกจำนวนการทวิตได้ตามความเหมาะสมครับ ถ้าเยอะเกินไปเราก็จะใช้เวลานาน แต่หากเลือกน้อยเกินไปก็จะได้ข้อมูลที่ไม่น่าสนใจ จากนั้นก็กดปุ่ม “OK” เริ่มการค้นหาและวิเคราะห์ได้เลย
เมื่อ NodeXL ค้นหาออกมาเรียบร้อย เราจะได้ข้อมูลที่เยอะมาก อยู่ในรูปแบบไฟล์ Excel แบ่งเป็น sheets ประกอบไปด้วย ข้อมูลจุดพร้อมค่าต่าง ๆ ที่ได้จากการวิเคราะห์เครือข่ายสังคม ข้อมูลการจัดกลุ่มข้อมูล ข้อมูลส่วนประกอบต่าง ๆ ของเครือข่าย และผลสรุป ซึ่งผมขอกล่าวถึงแต่เพียงผลสรุปตัวนี้นะครับ
ผลสรุปจะบอกเราให้ทราบว่า การพูดคุยเกี่ยวกับคำสำคัญอย่าง “libra” มีเว็บไซต์ใดบ้างมาเกี่ยวข้องมากที่สุด บัญชีใดที่เป็นศูนย์กลางของการพูดคุย บัญชีใดที่มีอิทธิพลมากที่สุด คำสำคัญ ที่เกี่ยวข้องกับคำว่า “libra” เรียงจากมากไปหาน้อย และมีข้อมูลแบ่งตามกลุ่มย่อยให้เราด้วย ทีนี้เราก็จะสามารถนำข้อมูลเหล่านี้ไปใช้ในการวิเคราะห์การตลาด ข่าวสาร และอื่น ๆ ได้อีกมากมาย นอกจากนี้ยังมีนักวิจัยบางท่านที่นำค่าความเป็นศูนย์กลางและค่าความมีอิทธิพลของจุดเหล่านี้ไปเป็นตัวแปรในการสร้างโมเดลพยากรณ์ต่าง ๆ ด้วย
สำหรับผลสรุปที่ผมได้วิเคราะห์คำค้น “libra” via NodeXL ได้ผลดังลิงค์ต่อไปนี้ http://bit.ly/2ZLS5K3 ดึงข้อมูลจากทั้งหมด 18,193 บัญชี และบัญชีที่มีความเป็นศูนย์กลางมากที่สุด ตามลำดับ ได้แก่ @mysticxlipstick @libra_ @facebook @pollito_verde @milkstrology @astrodazueira @musalbas @libra_hn @aquilibra @veronicaofjesus และ Top hashtags ตามลำดับ ได้แก่ #libra #facebook #bitcoin #cryptocurrency #crypto #blockchain #btc #libracoin #cancer โดยมีแผนภาพเครือข่ายดังนี้
สุดท้ายเราก็เก็บสารสนเทศที่ได้จากการวิเคราะห์เป็น Excel เอาไว้ใช้ประโยชน์ หรือหากต้องการเผยแพร่ NodeXL ก็มีฟังก์ชันการอัพโหลดข้อไปเก็บไว้ที่ NodeXL Graph Gallery : http://nodexlgraphgallery.org/Pages/Default.aspx แล้วสามารถแชร์ต่อได้ง่าย ๆ เลยครับ