OpenAI เปิดตัว o1 เอไอที่คิดก่อนตอบ – ใช้เหตุผลแก้ปัญหาคล้ายมนุษย์

Share

Loading

จาก ChatGPT สู่ “o1” OpenAI เปิดตัวโมเดลรุ่นใหม่ในโครงการ “Strawberry” เอไอที่ใช้เหตุผลในการแก้ปัญหาคล้ายมนุษย์ คิดก่อนตอบมากขึ้น ค้นพบว่ามันทำคะแนนสอบโอลิมปิกคณิตศาสตร์ได้สูงถึง 83%

OpenAI บริษัทผู้สร้าง ChatGPT เปิดตัวโมเดล AI รุ่นใหม่ในชื่อ “o1” จุดเด่นของเจ้า o1 คือ ความสามารถในการคิดวิเคราะห์ และแก้ปัญหาที่ซับซ้อนได้ดียิ่งขึ้น

โมเดล o1 ถูกพัฒนาภายใต้ชื่อโครงการภายในว่า “Strawberry” โดยออกแบบให้ใช้เวลาในการคิดวิเคราะห์มากขึ้นก่อนตอบคำถาม เรียกง่ายๆ ว่า มันจะ “คิดก่อนตอบ” มากขึ้นกว่าเดิม ใช้เหตุผลคล้ายกับวิธีการคิดของมนุษย์ แบบ “Reasoning Ability”ทำให้สามารถรับมือกับโจทย์ที่ซับซ้อนในด้านวิทยาศาสตร์ คณิตศาสตร์ และการเขียนโปรแกรมอย่างมีประสิทธิภาพมากกว่าเดิม

รายงานของ OpenAI ยังชี้เพิ่มอีกว่า โมเดลนี้ยังสามารถแก้ปัญหาที่ซับซ้อนได้อย่างเป็นขั้นเป็นตอน ทำให้สามารถรับมือกับโจทย์ที่ซับซ้อนในด้านวิทยาศาสตร์ คณิตศาสตร์ และการเขียนโปรแกรมได้ดีขึ้นอย่างมาก

เอไอภายใต้ซีรีส์ Strawberry มีทั้งหมด 3 โมเดล ได้แก่

  • o1 เป็นโมเดลหลัก
  • o1-preview รุ่นที่มีความสามารถสูงสุด เหมาะสำหรับงานที่ต้องการความแม่นยำสูง
  • o1-mini รุ่นที่เร็วกว่าและราคาถูกกว่า เหมาะสำหรับงานด้านวิทยาศาสตร์และการเขียนโปรแกรม

ผลการทดสอบแสดงให้เห็นถึงความสามารถที่เหนือกว่าโมเดลรุ่นก่อน โดย o1 ทำคะแนนได้ 83% ในการสอบคัดเลือกสำหรับการแข่งขันคณิตศาสตร์โอลิมปิกนานาชาติ เทียบกับ 13% ของ GPT-4o ซึ่งเป็นโมเดลก่อนหน้า นอกจากนี้ ก็มีความแม่นยำในการตอบคำถามทางวิทยาศาสตร์ระดับปริญญาเอกที่ 78% สูงกว่าโมเดล GPT-4o ที่แม่นยำ 56.1% และยังสูงกว่าผู้เชี่ยวชาญที่มีความแม่นยำที่ 69.7%

อย่างไรก็ดี วรวิสุทธิ์ ภิญโญยาง ที่ปรึกษาด้านเอไอให้องค์กร และผู้ร่วมก่อตั้งบริษัท Impact Mind AI และ Insiderly.ai ได้อธิบายในประเด็นนี้เพิ่มเติมว่า Benchmark เหล่านี้ คือ การให้มันทำข้อสอบแล้วเอาไปเทียบ ไม่ได้แปลว่าเก่งกว่าคนจบปริญญาเอกแต่อย่างใด

วรวิสุทธิ์ยังมองว่า “o1 จะสร้างประโยชน์ให้กับวงการวิทยาศาสตร์ อาจจะพัฒนาอะไรขึ้นได้เร็วอีกเยอะ เช่นเดียวกับที่ทาง OpenAI บอกว่า นักวิจัยด้าน Healthcare ก็จะได้ประโยชน์จากพัฒนาการนี้มากๆ เช่นกัน”

การทำงานของ o1

โมเดล o1 ถูกออกแบบให้ “คิดก่อนพูด” โดยใช้เทคนิคที่เรียกว่า “Chain of Thought” หรือ “การคิดแบบลูกโซ่” ซึ่งเลียนแบบกระบวนการคิดของมนุษย์ วิธีการนี้ทำให้ o1 สามารถแยกแยะปัญหาออกเป็นส่วนย่อยๆ และวิเคราะห์ทีละขั้นตอน ก่อนที่จะรวบรวมข้อมูลทั้งหมดเพื่อสร้างคำตอบที่สมบูรณ์

กระบวนการทำงานของ o1 มีดังนี้

  1. รับข้อมูล: o1 รับคำถามหรือปัญหาจากผู้ใช้
  2. แยกแยะปัญหา: ระบบจะแบ่งปัญหาออกเป็นส่วนย่อยๆ
  3. วิเคราะห์ทีละส่วน: o1 จะคิดวิเคราะห์แต่ละส่วนอย่างละเอียด
  4. ตรวจสอบความถูกต้อง: มีการตรวจสอบข้อมูลในแต่ละขั้นตอน
  5. สังเคราะห์คำตอบ: นำข้อมูลทั้งหมดมารวมกันเพื่อสร้างคำตอบที่สมบูรณ์
  6. ทบทวนผลลัพธ์: ตรวจสอบคำตอบสุดท้ายอีกครั้งก่อนแสดงผล

ด้วยกระบวนการนี้ ทำให้ o1 ใช้เวลาในการตอบคำถามนานขึ้น แต่ได้คำตอบที่แม่นยำและน่าเชื่อถือมากขึ้น โดยเฉลี่ยแล้ว o1-preview ใช้เวลาตอบคำถามนานกว่า GPT-4o ถึง 10 เท่า นอกจากนี้ หาก คำถามที่ GPT-4o ใช้เวลา 3 วินาที o1-mini จะใช้เวลา 9 วินาที และ o1-preview จะใช้เวลาถึง 32 วินาที

ทั้งนี้ เอไอจะมีการขัดเกลาข้อมูลก่อนที่จะสร้างเป็นคำตอบออกมา ทำให้โมเดลนี้มีการเรียนรู้ที่จะรับรู้และแก้ไขข้อผิดพลาด ด้วยการแยกแต่ละชุดคำถามเพื่อนำไปสู่กระบวนการวิเคราะห์ทีละขั้น คำตอบที่ได้จึงสมเหตุสมผลมากกว่าเดิม

ทีมวิจัยของ OpenAI อธิบายไว้ว่า o1 จะรักษาอาการ “หลอน” ของระบบได้ กล่าวคือ มันจะมีความผิดพลาดของเอไอน้อยลง “เราพบได้ว่าโมเดลนี้ (o1) เกิดอาการหลอนน้อยลง แต่แน่นอนว่าเราก็ยังฟันธงไม่ได้ว่าเราแก้ปัญหานี้ได้แล้วอย่างหมดจด”

การเข้าถึงและแผนในอนาคต

ขณะนี้ ผู้ใช้ ChatGPT แบบเสียเงินสามารถทดลองใช้ o1-mini และ o1-preview ได้แล้ว แต่มีข้อจำกัดด้านจำนวนข้อความต่อสัปดาห์ ส่วนการใช้งานผ่าน API ยังจำกัดเฉพาะลูกค้าระดับสูงเท่านั้น อย่างไรก็ตาม OpenAI มีแผนที่จะเปิดให้ผู้ใช้ทั่วไปสามารถใช้งาน o1-mini ได้ฟรีในอนาคต

ด้าน แซม อัลท์แมน ประธานกรรมการบริหารของ OpenAI กล่าวว่า บริษัทยังคงให้ความสำคัญกับความปลอดภัยในการใช้งานเอไอ โดยได้พัฒนาวิธีการฝึกด้านความปลอดภัยใหม่ที่ใช้ประโยชน์จากความสามารถในการคิดวิเคราะห์ของโมเดล เพื่อให้ปฏิบัติตามแนวทางด้านความปลอดภัยและการปรับให้สอดคล้องกับหลักจริยธรรม

เนื่องจากโมเดลนี้สามารถคิดและให้คำตอบอย่างเป็นขั้นเป็นตอน ความสามารถนี้ OpenAI มองว่าจะช่วยเสริมเรื่องของความปลอดภัยได้เป็นอย่างดี โดยมีการทดสอบความปลอดภัยผ่านการจำลองการโจมตีทางไซเบอร์ (Red-Teaming) ก่อนการนำไปใช้งานจริง

ท้ายที่สุดแล้ว การเปิดตัวของ o1 ไม่เพียงแต่เป็นความก้าวหน้าทางเทคนิค แต่ยังเป็นสัญญาณของการเปลี่ยนแปลงในวงการเอไอที่มุ่งสู่การสร้างเอไอที่ “เข้าใจ” และ “คิด” มากขึ้น แทนที่จะเป็นเพียงระบบที่ตอบสนองตามข้อมูลที่ได้รับการฝึกฝนมาเท่านั้น

แหล่งข้อมูล

https://www.bangkokbiznews.com/tech/innovation/1144653