ChatGPT V4 เหนือกว่ามาตรฐาน SAT และสามารถระบุช่องโหว่ในสัญญา ETH

GPT-4 ซึ่งเป็น Chatbot ปัญญาประดิษฐ์ (AI) เวอร์ชันล่าสุด ChatGPT สามารถผ่านการทดสอบระดับมัธยมศึกษาตอนปลายและการสอบของโรงเรียนกฎหมายด้วยคะแนนที่อยู่ในเปอร์เซ็นไทล์ที่ 90 และมีความสามารถในการประมวลผลแบบใหม่ที่ไม่สามารถทำได้ในเวอร์ชันก่อนหน้า

ตัวเลขจากคะแนนการทดสอบของ GPT-4 ถูกแบ่งปันเมื่อวันที่ 14 มีนาคมโดย OpenAI ผู้สร้างมัน โดยเปิดเผยว่ามันยังสามารถแปลงอินพุตภาพ เสียงและวิดีโอเป็นข้อความ นอกเหนือจากการจัดการ “คำสั่งที่เหมาะสมยิ่งขึ้น” ได้อย่างสร้างสรรค์และน่าเชื่อถือมากขึ้น

“มันผ่านการสอบเนติบัณฑิตจำลองด้วยคะแนนประมาณ 10% แรกของผู้สอบ” OpenAI กล่าวเสริม “ในทางตรงกันข้าม คะแนนของ GPT-3.5 อยู่ที่ประมาณ 10% ล่างสุด”

ตัวเลขแสดงให้เห็นว่า GPT-4 ได้คะแนน 163 ในเปอร์เซ็นไทล์ที่ 88 ในการสอบ LSAT ซึ่งเป็นการทดสอบที่นักศึกษาในวิทยาลัยต้องผ่านในสหรัฐอเมริกาจึงจะเข้าเรียนในโรงเรียนกฎหมายได้

ผลการสอบของ GPT-4 และ GPT-3.5 จากการสอบล่าสุดของสหรัฐฯ แหล่งที่มา: OpenAI

คะแนนของ GPT4 จะทำให้อยู่ในตำแหน่งที่ดีที่จะรับเข้าเรียนในโรงเรียนกฎหมายชั้นนำ 20 แห่ง และเป็นคะแนนที่ขาดเพียงไม่กี่คะแนนที่จำเป็นสำหรับการตอบรับเข้าเรียนในโรงเรียนที่มีชื่อเสียง เช่น Harvard, Stanford, Princeton หรือ Yale

ChatGPT เวอร์ชันก่อนหน้าได้คะแนนเพียง 149 คะแนนจาก LSAT ซึ่งอยู่ในอันดับท้ายสุด 40%

GPT-4 ยังได้คะแนน 298 จาก 400 ในการสอบ Uniform Bar ซึ่งเป็นการทดสอบที่ดำเนินการโดยนักศึกษากฎหมายที่เพิ่งสำเร็จการศึกษา ซึ่งอนุญาตให้พวกเขาฝึกเป็นทนายความในเขตอำนาจศาลใดๆ ของสหรัฐฯ

คะแนน UBE จำเป็นต้องได้รับการยอมรับให้ปฏิบัติตามกฎหมายในแต่ละเขตอำนาจศาลของสหรัฐอเมริกา แหล่งที่มา: การประชุมระดับชาติของผู้ตรวจสอบบาร์

ChatGPT เวอร์ชันเก่าประสบปัญหาในการทดสอบนี้ โดยจบที่ 10% ด้านล่างด้วยคะแนน 213 จาก 400

สำหรับการสอบ SAT Evidence-Based Reading & Writing และ SAT Math ที่นักเรียนมัธยมปลายสหรัฐใช้วัดความพร้อมในการเข้ามหาวิทยาลัยนั้น GPT-4 ได้คะแนนเปอร์เซ็นไทล์ที่ 93 และ 89 ตามลำดับ

GPT-4 เป็นเลิศในวิทยาศาสตร์ "ยาก" เช่นกัน โดยมีคะแนนสูงกว่าค่าเฉลี่ยเปอร์เซ็นไทล์ในวิชาชีววิทยา AP (85-100%) เคมี (71-88%) และฟิสิกส์ 2 (66-84%)

ผลการสอบของ GPT-4 และ GPT-3.5 ในช่วงการสอบล่าสุดของสหรัฐอเมริกา ที่มา: OpenAI

อย่างไรก็ตาม คะแนน AP Calculus ค่อนข้างปานกลาง โดยอยู่ในเปอร์เซ็นไทล์ที่ 43 ถึง 59

อีกด้านที่ GPT-4 ขาดไปคือการสอบวรรณคดีอังกฤษ โดยมีคะแนนอยู่ในเปอร์เซ็นไทล์ที่ 8 ถึง 44 ในการทดสอบสองชุดที่แยกจากกัน

OpenAI กล่าวว่า GPT-4 และ GPT-3.5 ใช้การทดสอบเหล่านี้จากการสอบปฏิบัติในปี 2022-2023 และเครื่องมือการประมวลผลภาษานั้น "ไม่มีการฝึกอบรมเฉพาะ"

“เราไม่ได้ฝึกอบรมเฉพาะสำหรับการสอบเหล่านี้ แบบจำลองเห็นปัญหาส่วนน้อยในการสอบในระหว่างการฝึกอบรม แต่เราเชื่อว่าผลลัพธ์ที่ได้จะเป็นตัวแทน”

ผลลัพธ์ทำให้เกิดความกลัวในชุมชน Twitter เช่นกัน

ที่เกี่ยวข้อง ChatGPT จะส่งผลต่อพื้นที่ Web3 อย่างไร คำตอบของอุตสาหกรรม

นิค อัลมอนด์ ผู้ก่อตั้ง FactoryDAO บอก ผู้ติดตาม Twitter 14,300 คนของเขาในวันที่ 14 มีนาคมว่า GPT4 กำลังจะ "ทำให้ผู้คนหวาดกลัว" และจะ "พัง" ระบบการศึกษาทั่วโลก

Conor Grogan อดีตผู้อำนวยการของ Coinbase กล่าวว่าเขาได้ใส่ Ethereum smart contract ลงใน GPT-4 และชี้ไปที่ "ช่องโหว่ด้านความปลอดภัย" หลายรายการทันที และสรุปวิธีการใช้ประโยชน์จากรหัส:

การตรวจสอบสัญญาอัจฉริยะก่อนหน้านี้บน ChatGPT พบว่าเวอร์ชันแรกนั้นสามารถตรวจจับจุดบกพร่องของโค้ดได้ในระดับที่เหมาะสมเช่นกัน

Rowan Cheung ผู้ก่อตั้งจดหมายข่าว AI “The Rundown” แชร์วิดีโอของ GPT ที่แปลงเว็บไซต์ปลอมที่วาดด้วยมือบนแผ่นกระดาษให้เป็นโค้ด