OpenAI ผู้สร้าง ChatGPT ประกาศอัปเกรดล่าสุด GPT-4o ซึ่งมีความเป็นมนุษย์มากขึ้น ช่างพูดคุยมากขึ้น รวมถึงสามารถโต้ตอบภาพและวิดีโอของผู้ใช้ได้แบบเรียลไทม์
OpenAI ปล่อยวิดีโอตัวอย่างมากมายที่แสดงให้เห็นความสามารถของ GPT-4o เช่น ช่วยเตรียมตัวสัมภาษณ์, ติดต่อฝ่ายบริการลูกค้าเพื่อขอเปลี่ยน iPhone, เล่น dad joke (คล้ายมุกแป้กของไทย), แปลบทสนทนาแบบเรียลไทม์, เป็นกรรมการตัดสินเป่ายิ้งฉุบ รวมถึงเหน็บแนมได้ด้วย ขณะเดียวกัน ยังมีตัวอย่างที่แสดงให้เห็นปฏิกิริยาของ ChatGPT เมื่อผู้ใช้งานแนะนำลูกสุนัขให้รู้จักเป็นครั้งแรกอีกด้วย (ChatGPT ตอบด้วยเสียงว่า “สวัสดี Bowser เจ้าช่างเป็นสุนัขที่น่ารักสุด ๆ ไปเลย”)
Sam Altman ซีอีโอของ OpenAI กล่าวว่า “มันเหมือน AI ในหนังเลย ผมก็ยังคงประหลาดใจนิด ๆ ที่มันเกิดขึ้นจริง การที่มันสามารถตอบสนองได้เร็วและแสดงออกได้เหมือนมนุษย์จะเป็นการเปลี่ยนแปลงครั้งใหญ่”
OpenAI ระบุว่า “o” ในชื่อ GPT-4o ย่อมาจาก “omni” (ทั้งหมด) ซึ่งเป็นเหมือนเครื่องหมายสู่การโต้ตอบระหว่างมนุษย์กับเครื่องจักรที่เป็นธรรมชาติมากขึ้น โดยในเบื้องต้นจะเปิดให้ใช้เวอร์ชันที่ใส่ได้แค่ข้อความและรูปภาพเท่านั้นในวันที่ 13 พฤษภาคม 2024 ก่อนจะปล่อยตัวเต็มออกมาในภายหลัง
ทั้งนี้ GPT-4o จะเปิดให้ผู้ใช้งาน ChatGPT ทั้งแบบฟรีและเสียเงินสามารถใช้ได้จาก API ของ ChatGPT
ความสามารถในการประมวลผลข้อความ เสียง และภาพ ที่ถูกใส่เข้าไปพร้อมกันของ GPT-4o ถือว่าล้ำหน้าอย่างมากเมื่อเทียบกับรุ่นก่อน ๆ ของ OpenAI ซึ่งมักจะตกหล่นข้อมูลไปอย่างมากเมื่อต้องทำงานหลายอย่างพร้อมกัน
นอกจากนี้ GPT-4o ยังเร็วกว่า GPT-4 Turbo อย่างมาก โดยตอบสนองต่อเสียงที่ใส่เข้าไปได้ในเวลา 2.3 วินาที และมีเวลาตอบสนองเฉลี่ย 3.2 วินาที ใกล้เคียงกับมนุษย์ รวมถึงถูกลง 50% เมื่อเทียบกับ GPT-4 Turbo ด้วย
Reference: cointelegraph