รู้จักกับ DeepSeek บริษัทสตาร์ทอัพจากประเทศจีนซึ่งก่อตั้งมาได้เพียง 1 ปี กำลังเข้ามาเขย่าวงการ AI หลังจากเปิดตัวแชทบอทที่มีประสิทธิภาพเทียบเท่า ChatGPT แต่ใช้พลังงาน, ระบบระบายความร้อน และค่าใช้จ่ายในการฝึกอบรมเพียงเศษเสี้ยวเดียวเมื่อเทียบกับค่าใช้จ่ายของ OpenAI, Google และ Anthropic
และนี่คือทุกสิ่งที่คุณจำเป็นต้องรู้เกี่ยวกับโมเดล V3 และ R1 ของ Deepseek และสาเหตุที่บริษัท AI หน้าใหม่สามารถพลิกโฉมความทะเยอทะยานด้าน AI ของอเมริกาได้อย่างเจ็บแสบ
DeepSeek คืออะไร?
DeepSeek (ชื่อเต็ม “Hangzhou DeepSeek Artificial Intelligence Basic Technology Research Co., Ltd.”) เป็นบริษัทสตาร์ทอัพด้าน AI ของจีนที่ก่อตั้งขึ้นครั้งแรกในฐานะเป็นแค่ห้องทดลองด้าน AI ภายใต้บริษัทแม่ High-Flyer ในเดือนเมษายน 2023 ต่อมาในเดือนพฤษภาคมปีเดียวกัน DeepSeek ได้แยกตัวออกมาเป็นบริษัทของตนเอง (โดยที่ High-Flyer ยังคงเป็นนักลงทุนอยู่) และยังได้เปิดตัวโมเดล DeepSeek-V2 ออกมาอีกด้วย
โดยใน V2 นี้เองที่ DeepSeek เริ่มทำผลงานได้อย่างน่าประทับใจ เพราะตัว AI ของบริษัทมีความสามารถที่ทัดเทียมกับ AI ชั้นนำของบริษัทจีนเจ้าอื่นๆ ที่ถูกพัฒนามาก่อน อย่างเช่น ByteDance, Tencent และ Baidu แต่กลับมีต้นทุนในการดำเนินการที่ต่ำกว่ามากๆ เรียกได้ว่าแค่ตั้งไข่ก็โดดเด่นตั้งแต่ปีแรกภายในประเทศของตัวเองไปเรียบร้อยแล้ว
ต่อมาบริษัทได้ทำการเปิดตัว DeepSeek V3 ในเดือนธันวาคม (ปี 2024) โดยในรุ่น V3 เป็นโมเดลที่มีพารามิเตอร์ขนาดใหญ่ 671 พันล้าน โดยมีรายงานข่าวที่น่าตกใจว่าพวกเขาใช้เวลาในการฝึก AI น้อยมากๆ ใช้เวลาแค่เพียงไม่ถึง 2 เดือนเท่านั้นในการพัฒนา ยิ่งไปกว่านั้นตามการวิเคราะห์ของ Jeffries ที่ได้ออกมาเปิดเผยต้นทุนการฝึกของ AI DeepSeek “ใช้เงินไปเพียง 5.6 ล้านเหรียญสหรัฐ” ซึ่งนับเป็นเพียงเศษเสี้ยวของเงินหลายร้อยล้าน (ถึงพันล้าน) ดอลลาร์ที่บริษัทในสหรัฐฯ เช่น Llama ของ Meta หรือ Gemini ของ Google, รวมถึง Microsoft, xAI และ OpenAI ที่ได้ใช้ไปกับการฝึกโมเดล AI ของตนเอง แถมการทดสอบด้านประสิทธิภาพยังแสดงให้เห็นว่า DeepSeek V3 มีความสามารถที่เทียบเท่าหรืออาจจะดีกว่า GPT-4o และ Claude 3.5 Sonnet ซึ่งเป็น AI เจ้าใหญ่จากทางฝั่งอเมริกาไปแล้วอีกต่างหาก
ในช่วงเดือนพฤศจิกายน 2024 ทาง DeepSeek ก็ได้เปิดตัวโมเดล R1-Lite-Preview ซึ่งเป็นโมเดลในการวิเคราะห์เชิงตรรกะเหตุและผล โดยพวกเขามีความมั่นใจและอ้างว่า โมเดลตัวนี้สามารถทำงานได้ดีกว่าโมเดลที่ใช้เหตุและผลตากตระกูล o1 ของ OpenAI (และแน่นอนพวกเขาทำขึ้นมาในต้นทุนราคาเพียงเสี้ยวเดียวอีกด้วยเช่นกัน) โดยมีการประเมินว่าโมเดล DeepSeek R1 มีค่าใช้จ่ายในการทำงานถูกกว่า o1 ของ OpenAI อยู่ถึงประมาณ 20 ถึง 50 เท่าเลยทีเดียว
และต่อมา DeepSeek ก็ได้เปิดตัว DeepSeek-R1 และ DeepSeek-R1-Zero ซึ่งถือว่าเป็นตัวเต็มพร้อมใช้งานในเดือนมกราคม 2025 แต่สิ่งที่เป็นจุดสำคัญในการประกาศเปิดตัวโมเดล R1 ที่สร้างความหือฮาและแตกต่างจากคู่แข่งอย่าง OpenAI คือการที่มันถูกประกาศว่าเป็นโอเพ่นซอร์ส ซึ่งหมายความว่านักพัฒนาซอฟต์แวร์ทุกคนสามารถนำไปใช้งานได้โดยไม่มีค่าใช้จ่ายใดๆ นั้นเองครับ
ทำให้ DeepSeek V3 และ R1 ได้รับความนิยมอย่างล้นหลามนับตั้งแต่เปิดตัว โดยตัว DeepSeek V3 ซึ่งเป็น AI Assistant ส่วนบุคคล หลังจากถูกปล่อยให้ดาวน์โหลดบน AppStore ก็ขึ้นแท่นเป็นอันดับหนึ่งแทนที่ ChatGPT แทบจะในทันที
DeepSeek สามารถทำอะไรได้บ้าง?
เนื่องจาก DeepSeek เป็นโมเดลภาษาโอเพ่นซอร์สขนาดใหญ่ แชทบอตของ DeepSeek จึงสามารถทำได้แทบทุกอย่างที่ ChatGPT, Gemini และ Claude ทำได้ นอกจากนี้ยังมีกลุ่มโมเดลใหม่ของ DeepSeek ที่เรียกว่า Janus Pro จากผลทดสอบเบื้องต้นก็ยังมีประสิทธิภาพเหนือกว่า DALL-E 3 รวมถึง PixArt-alpha, Emu3-Gen และ Stable Diffusion XL จากผลการทดสอบ Benchmark ตามมาตรฐานในอุตสาหกรรมอีกด้วย
ส่วน DeepSeek-R1 ก็จะเป็นตัวที่ได้รับการออกแบบมาโดยเฉพาะเพื่อดำเนินงานด้านการใช้เหตุผลที่ซับซ้อน สามารถสร้างทางออกของคำตอบได้ทีละขั้นตอนแบบความคิดเชิงตรรกะ ทำงานได้เหมือนกับคู่แข่ง o1 ที่เป็นตัวเก่งของ ChatGPT
แต่จะมีสิ่งที่ผลิตภัณฑ์ของ DeepSeek ทำไม่ได้อยู่ด้วยเช่นกัน นั้นคือการพูดถึงสิ่งที่จีนห้ามไว้ เช่นการพูดถึงจัตุรัสเทียนอันเหมิน, การชุมนุมประท้วงของฝ่ายต่อต้าน หรือการถามถึงประธานาธิบดีสีจิ้นผิงว่ามีความคล้ายคลึงกับวินนี่เดอะพูห์ หรือสิ่งใดๆ ที่เป็นพื้นฐานที่ฝ่ายปกครองจีนถือว่าห้ามพูด แชทบอตของ DeepSeek ก็จะไม่พูดถึงหรือดำเนินการใดๆ ต่อข้อร้องขอเหล่านั้น
ใครสามารถใช้ DeepSeek ได้บ้าง?
เนื่องจากเป็น LLM แบบโอเพ่นซอร์ส โมเดลของ DeepSeek จึงสามารถใช้ได้โดยนักพัฒนาซอฟต์แวร์ทุกคนโดยไม่มีค่าใช้จ่าย ใช้งานได้ฟรี ไม่มีการลิมิต ในขณะที่ OpenAI เรียกเก็บเงินประมาณ 200 ดอลลาร์ต่อเดือน (ประมาณ 700 บาท ) สำหรับการสมัครใช้งาน Pro ที่จำเป็นในการเข้าถึง o1
โมเดลของ DeepSeek มีให้บริการทั้งบนเว็บ ผ่าน API ของบริษัท และผ่านแอปพลิเคชั่นบนมือถือ คุณแค่จะต้องสมัครบัญชี(ฟรี)ที่เว็บไซต์ DeepSeek เพื่อเริมต้นใช้งาน อย่างไรก็ตามในช่วงแรกทางบริษัทได้มีการระงับการสมัครใช้งานใหม่ชั่วคราว จากเหตุโดนโจมตีทางไซเปอร์ที่เป็นอันตรายต่อบริการของ DeepSeek แต่ผู้ใช้ที่มีอยู่สามารถลงชื่อเข้าใช้และใช้แพลตฟอร์มได้ตามปกติ (ในขณะนี้ผู้ใช้ใหม่ สามารถสมัครใช้งานได้ตามปกติแล้ว)
เหตุใด DeepSeek ถึงกลายเป็นเรื่องใหญ่ในทันใด?
นับตั้งแต่เปิดตัว ChatGPT ในเดือนพฤศจิกายน 2023 บริษัท AI ของอเมริกาได้มุ่งเน้นอย่างเต็มที่ในการสร้างโมเดลภาษาขนาดใหญ่ที่ “ใหญ่ขึ้น ทรงพลังขึ้น ครอบคลุมมากขึ้น มีพลังมากขึ้น และใช้ทรัพยากรมากขึ้น” แทนที่จะพยายามสร้าง LLM ที่เน้นความคุ้มทุนและประหยัดพลังงานมากขึ้น
บริษัทต่างๆ เช่น OpenAI, Microsoft, Anthropic และ Google ต่างมองไปในทิศทางเดียวกันว่า การทุ่มทุนมหาศาลด้วยเงินที่มากขึ้น และทรัพยากรที่มากขึ้น ตามสไตล์อเมริกัน จะเป็นกษรพัฒนาเทคโนโลยี AI ที่ดีที่สุด
- โดยในปี 2024 เพียงปีเดียว Elon Musk ซีอีโอของ xAI คาดว่าได้ใช้จ่ายเงินส่วนตัวมากกว่า 10,000 ล้านดอลลาร์สำหรับโครงการ AI
- OpenAI และพันธมิตรเพิ่งประกาศโครงการ Stargate มูลค่า 5 แสนล้านดอลลาร์ที่จะเร่งการก่อสร้างสาธารณูปโภคพลังงานสีเขียวและศูนย์ข้อมูล AI ทั่วสหรัฐอเมริกา
- Google วางแผนที่จะให้ความสำคัญกับการขยายแพลตฟอร์ม Gemini ในปี 2025 ตามที่ Sundar Pichai ซีอีโอกล่าวว่าจะใช้เงินอีกหลายพันล้านดอลลาร์ในปีนี้เพื่อบรรลุเป้าหมายดังกล่าว
- Meta ประกาศในช่วงกลางเดือนมกราคม ว่าจะทุ่มเงินสูงถึง 65 พันล้านดอลลาร์สหรัฐสำหรับการพัฒนา AI ในปีนี้
—ในขณะเดียวกัน DeepSeek เพิ่งแสดงให้โลกเห็นว่าสิ่งเหล่านั้นไม่จำเป็นเลย —
ช่วงเวลาแห่ง “AI Boom” เป็นสิ่งที่โลกตื่นตูมและช่วยกระตุ้นเศรษฐกิจของอเมริกาในช่วงไม่กี่เดือนที่ผ่านมา และทำให้บริษัท GPU เช่น Nvidia ร่ำรวยขึ้นอย่างก้าวกระโดดเมื่อเทียบกับเดือนตุลาคม 2023 จนดูว่าทั่งหมดอาจเป็นเพียงเรื่องหลอกลวงและควรตั้งคำถามว่า สหรัฐฯ มีความเป็นผู้นำในด้าน AI มากเพียงใด?! เพราะแม้ว่าในช่วงปีที่ผ่านมา มีความพยายามในการห้ามการจัดส่ง GPU คุณภาพสูงไปยังจีนซ้ำแล้วซ้ำเล่า ก็ยังไม่สามารถหยุดการเติบโตของการพัฒนา AI ภายในประเทศจีนได้
และสิ่งที่ช่วยกระพือความตื่นตัวของตลาด AI ก็คือมูลค่าหุ้นของ Nvidia ที่ได้สูญเสียไปอย่างมหาศาลในช่วงไม่กี่ชั่วโมงหลังการเปิดตัว V3 มูลค่าหุ้นของบริษัท Nvidia ได้ตกลงไปถึง 17% หรือตีเป็นความสูญเสียราวๆ 600,000 ล้านดอลลาร์ ซึ่งถือเป็นการขาดทุนครั้งใหญ่ที่สุดของบริษัทในประวัติศาสตร์ตลาดหุ้นสหรัฐฯ
โดยสรุป DeepSeek เพิ่งเอาชนะอุตสาหกรรม AI ของอเมริกาในเกมของตัวเอง แม้ DeepSeek จะไม่สามารถเข้าถึงการประมวลผลระดัยไฮเปอร์สเกลของสหรัฐฯ และด้วยวิธีการใดวิธีการหนึ่ง พวกเขาก็สามารถพัฒนาโมเดลที่มีความสามารถในการแข่งขันกับตลาดระดับสูงได้
แล้วคนอเมริกันจะทำอย่างไรกับเรื่องนี้?
Srini Pajjuri นักวิเคราะห์ด้านเซมิคอนดักเตอร์ของ Raymond James กล่าวกับ CNBC “หากสตาร์ทอัพของจีนสามารถสร้างโมเดล AI ที่ทำงานได้ดีพอๆ กับ OpenAI รุ่นล่าสุด และทำงานได้อย่างยอดเยี่ยมที่สุด และสามารถทำขึ้นมาได้ภายในเวลาไม่ถึงสองเดือน และด้วยต้นทุนที่น้อยกว่า 6 ล้านดอลลาร์ แล้ว Sam Altman ( CEO ของ OpenAI เจ้าของ ChatGPT) จะมีประโยชน์อะไรอีก?”
โดนัลด์ ทรัมป์ กล่าวกับ BBC “พวกเรามักมีไอเดียอยู่เสมอ เราเป็นคนแรกเสมอ ฉันคิดว่านี่อาจเป็นการพัฒนาในเชิงบวก เพราะแทนที่จะใช้เงินเป็นพันล้าน คุณจะใช้เงินน้อยลงโดยหวังผลลัพท์ที่เท่าเดิม”
ส่วนทาง Mark Zuckerberg ซีอีโอของ Meta ได้จัดตั้ง War room เพื่อระดมวิศวกรขึ้นมาเป็นจำนวน 4 ห้อง เอาไว้เพื่อทำหน้าที่ค้นหาสูตรการพัฒนาของ DeepSeek โดยเฉพาะ ตามรายงานแจ้งว่ามีทีมจำนวนสองทีมที่กำลังทำการสืบสวนว่า DeepSeek บริหารจัดการความสามารถของ AI ในระดับนี้ ด้วยต้นทุนที่ต่ำเช่นนี้ได้อย่างไร ในขณะที่อีกทีมพยายามค้นหาชุดข้อมูลที่ DeepSeek ใช้ในการสอน AI และทีมสุดท้ายรับผิดชอบในการปรับโครงสร้าง Llama ซึ่งคาดว่าจะปรับเปลี่ยนเลียนแบบสูตรการทำงานของ DeepSeek เมื่อพวกเขาได้ข้อมูลที่่สำคัญมา
Elon Musk ซีอีโอของ xAI ยังคงอยู่กับการวิพากษ์วิจารณ์และเริ่มล้อเลียนข้อกล่าวอ้างด้านประสิทธิภาพของ DeepSeek ในขณะที่บริษัทของเขากำลังพยายามสร้าง “คลัสเตอร์ฝึก AI ที่ทรงพลังที่สุดในโลก” ที่อยู่นอกเมืองเมมฟิส รัฐเทนเนสซี
ในทางกลับกัน CEO ของ OpenAI, Sam Altman ได้แสดงสปิริต กล่าวต้อนรับ DeepSeek สู่การแข่งขัน AI โดยกล่าวว่า “R1 เป็นโมเดลที่น่าประทับใจ โดยเฉพาะอย่างยิ่งที่พวกเขาสามารถทำออกมาได้ในราคาแค่นี้” และในโพสต์ล่าสุดบน X “แน่นอนว่า เราจะส่งมอบโมเดลที่ดีกว่า และมันก็น่าตื่นเต้นจริงๆ ที่เรากำลังมีคู่แข่งรายใหม่! และเราจะปล่อยอัปเดตบางอย่างที่ดีกว่าออกมา”
แม้แต่กองทัพเรือสหรัฐฯ เองก็เข้ามาเกี่ยวข้องด้วยเช่นกัน โดยล่าสุดทางกองทัพสหรัฐฯ ได้ออกคำเตือนแก่ลูกเรือว่าไม่ควรใช้ DeepSeek “ในทุกกรณี” เนื่องจาก “อาจเกิดความกังวลด้านความปลอดภัยและจริยธรรมที่เกี่ยวข้องกับแหล่งที่มาและการใช้งานของโมเดล” ในอีเมลยังระบุไว้ชัดอีกด้วยว่า “จำเป็นอย่างยิ่ง” ที่สมาชิกกองทัพจะต้องไม่ใช้ DeepSeek “ทั้งที่เกี่ยวข้องกับงาน หรือการใช้งานแบบส่วนตัว”
เรียกได้ว่า “ใช้ความไม่ไว้วางใจ” มาเป็นจุดต้านเทคโนโลยีจีนอีกครั้งสำหรับชาวอเมริกา