เมื่อ ChatGPT เครื่องมือที่ทำงานด้วย AI ที่มีความสามารถสูง และเป็นกระแสนิยมไปทั่วโลก โดยเฉพาะการให้ ChatGPT เขียนโค้ด บทความ หรือเรื่องราวต่าง ๆ จากคำสั่งง่าย ๆ ทำให้หลายคนยิ้มแก้มปริ ทั้งบล็อกเกอร์ โปรแกรมเมอร์ นักเรียน นักศึกษา ที่วางแผนจะใช้งาน ChatGPT ทำการบ้านส่งครูอาจารย์ ไม่ดีนะจ๊ะ ๆ ^^ ในที่สุดความฝันเหล่านั้นอาจดับลงด้วยฝีมือของ Edward Tian นักศึกษาปี 4 ของมหาวิทยาลัย Princeton ที่ได้สร้างโปรแกรมที่ชื่อว่า GPTZero ซึ่งแนวคิดเกิดจากการสร้างโมเดลมาตรวจสอบว่า ข้อความมีค่าของความงง (perplexity) และ ความล้น (burstiness) มากน้อยแค่ไหน ถ้าค่าออกมามากแสดงว่าไม่ใช่ ChatGPT เขียน แต่เป็นมนุษย์ทั่วไป
โปรแกรม GPTZero ตรวจจับสิ่งที่เขียนด้วย ChatGPT ได้อย่างไร?
แนวคิดของ Edward Tian คือ มนุษย์ทั่วไปจะมีการเขียนประโยคที่มีความซ้ำซ้อนมากกว่า หรือ ในหนึ่งย่อหน้าจะมีความเกินความขาดที่มากกว่าหุ่นยนต์ เขาจึงนำความคิดนี้มาสร้างโมเดล ถ้าค่าของความงง และความล้นมากก็แสดงว่าเป็น คนแน่ๆ ไม่ใช่หุ่นยนต์นั่นเอง
Edward สร้างโปรแกรม GPTZero โดยใช้ open source GPT-2 มาข่วยสร้างโมเดลในการตรวจจับ ซึ่ง GPT-2 ก็เป็นตระกูลเดียวกับการสร้าง ChatGPT แต่อาจจะเวอร์ชั่นเก่ากว่า กล่าวคือ เอาสิ่งที่เป็น pre train มาช่วยเรียนรู้ตรวจจับนั่นเอง ในเวอร์ชั้นแรก ๆ ที่ออกมาตอนต้นปี ตัวโมเดลนี้ยังไม่ได้ฉลาดมากนัก แต่ก็เพราะว่ามีคนสมัครมาทดสอบโปรแกรมนี้เป็นจำนวนมาก และ การ retrain/tuning ของ Edward เอง ทำให้มันเริ่มเก่งขึ้นมาก
โปรแกรม GPTZero ใครสนใจทดลองใช้งานและช่วยในการทดสอบ สามารถเข้าไปลงทะเบียนทดลองกันได้ ที่ http://gptzero.me และ ติดตาม twitter ของ Edward_the6 ได้เลย จะมีการอธิบายเกี่ยวกับโมเดล อัพเดตผลการทดสอบอยู่เรื่อย ๆ เพื่อให้โปรแกรมสามารถใช้งานได้จริงในเร็ววันนี้