ChatGPT V4 เหนือกว่ามาตรฐาน SAT และสามารถระบุช่องโหว่ในสัญญา ETH

GPT-4 ซึ่งเป็น Chatbot ปัญญาประดิษฐ์ (AI) เวอร์ชันล่าสุด ChatGPT สามารถผ่านการทดสอบระดับมัธยมศึกษาตอนปลายและการสอบของโรงเรียนกฎหมายด้วยคะแนนที่อยู่ในเปอร์เซ็นไทล์ที่ 90 และมีความสามารถในการประมวลผลแบบใหม่ที่ไม่สามารถทำได้ในเวอร์ชันก่อนหน้า

ตัวเลขจากคะแนนการทดสอบของ GPT-4 ถูกแบ่งปันเมื่อวันที่ 14 มีนาคมโดย OpenAI ผู้สร้างมัน โดยเปิดเผยว่ามันยังสามารถแปลงอินพุตภาพ เสียงและวิดีโอเป็นข้อความ นอกเหนือจากการจัดการ “คำสั่งที่เหมาะสมยิ่งขึ้น” ได้อย่างสร้างสรรค์และน่าเชื่อถือมากขึ้น

“มันผ่านการสอบเนติบัณฑิตจำลองด้วยคะแนนประมาณ 10% แรกของผู้สอบ” OpenAI กล่าวเสริม “ในทางตรงกันข้าม คะแนนของ GPT-3.5 อยู่ที่ประมาณ 10% ล่างสุด”

ตัวเลขแสดงให้เห็นว่า GPT-4 ได้คะแนน 163 ในเปอร์เซ็นไทล์ที่ 88 ในการสอบ LSAT ซึ่งเป็นการทดสอบที่นักศึกษาในวิทยาลัยต้องผ่านในสหรัฐอเมริกาจึงจะเข้าเรียนในโรงเรียนกฎหมายได้

*ผลการสอบของ GPT-4 และ GPT-3.5 จากการสอบล่าสุดของสหรัฐฯ แหล่งที่มา:* *OpenAI*

คะแนนของ GPT4 จะทำให้อยู่ในตำแหน่งที่ดีที่จะรับเข้าเรียนในโรงเรียนกฎหมายชั้นนำ 20 แห่ง และเป็นคะแนนที่ขาดเพียงไม่กี่คะแนนที่จำเป็นสำหรับการตอบรับเข้าเรียนในโรงเรียนที่มีชื่อเสียง เช่น Harvard, Stanford, Princeton หรือ Yale

ChatGPT เวอร์ชันก่อนหน้าได้คะแนนเพียง 149 คะแนนจาก LSAT ซึ่งอยู่ในอันดับท้ายสุด 40%

GPT-4 ยังได้คะแนน 298 จาก 400 ในการสอบ Uniform Bar ซึ่งเป็นการทดสอบที่ดำเนินการโดยนักศึกษากฎหมายที่เพิ่งสำเร็จการศึกษา ซึ่งอนุญาตให้พวกเขาฝึกเป็นทนายความในเขตอำนาจศาลใดๆ ของสหรัฐฯ

คะแนน UBE จำเป็นต้องได้รับการยอมรับให้ปฏิบัติตามกฎหมายในแต่ละเขตอำนาจศาลของสหรัฐอเมริกา แหล่งที่มา: *การประชุมระดับชาติของผู้ตรวจสอบบาร์*

ChatGPT เวอร์ชันเก่าประสบปัญหาในการทดสอบนี้ โดยจบที่ 10% ด้านล่างด้วยคะแนน 213 จาก 400

สำหรับการสอบ SAT Evidence-Based Reading & Writing และ SAT Math ที่นักเรียนมัธยมปลายสหรัฐใช้วัดความพร้อมในการเข้ามหาวิทยาลัยนั้น GPT-4 ได้คะแนนเปอร์เซ็นไทล์ที่ 93 และ 89 ตามลำดับ

GPT-4 เป็นเลิศในวิทยาศาสตร์ "ยาก" เช่นกัน โดยมีคะแนนสูงกว่าค่าเฉลี่ยเปอร์เซ็นไทล์ในวิชาชีววิทยา AP (85-100%) เคมี (71-88%) และฟิสิกส์ 2 (66-84%)

*ผลการสอบของ GPT-4 และ GPT-3.5 ในช่วงการสอบล่าสุดของสหรัฐอเมริกา* *ที่มา: OpenAI*

อย่างไรก็ตาม คะแนน AP Calculus ค่อนข้างปานกลาง โดยอยู่ในเปอร์เซ็นไทล์ที่ 43 ถึง 59

อีกด้านที่ GPT-4 ขาดไปคือการสอบวรรณคดีอังกฤษ โดยมีคะแนนอยู่ในเปอร์เซ็นไทล์ที่ 8 ถึง 44 ในการทดสอบสองชุดที่แยกจากกัน

OpenAI กล่าวว่า GPT-4 และ GPT-3.5 ใช้การทดสอบเหล่านี้จากการสอบปฏิบัติในปี 2022-2023 และเครื่องมือการประมวลผลภาษานั้น "ไม่มีการฝึกอบรมเฉพาะ"

“เราไม่ได้ฝึกอบรมเฉพาะสำหรับการสอบเหล่านี้ แบบจำลองเห็นปัญหาส่วนน้อยในการสอบในระหว่างการฝึกอบรม แต่เราเชื่อว่าผลลัพธ์ที่ได้จะเป็นตัวแทน”

ผลลัพธ์ทำให้เกิดความกลัวในชุมชน Twitter เช่นกัน

ที่เกี่ยวข้อง ChatGPT จะส่งผลต่อพื้นที่ Web3 อย่างไร คำตอบของอุตสาหกรรม

นิค อัลมอนด์ ผู้ก่อตั้ง FactoryDAO บอก ผู้ติดตาม Twitter 14,300 คนของเขาในวันที่ 14 มีนาคมว่า GPT4 กำลังจะ "ทำให้ผู้คนหวาดกลัว" และจะ "พัง" ระบบการศึกษาทั่วโลก

ทฤษฎีการประเมินเป็นส่วนสำคัญในชีวิตของฉันเป็นเวลาหลายปี ฉันทะเลาะกันเกี่ยวกับวันนี้เมื่อหลายปีก่อน แท้จริงแล้วฉันฟังดูเหมือนนักบิดท้องถิ่นในเวลานั้น
แต่... นี่หมายความว่าทุกอย่างยกเว้นการประเมินที่ควบคุมได้สิ้นสุดลงแล้วนับจากนี้เป็นต้นไป
— ดรนิค ️² (@DrNickA) March 14, 2023

Conor Grogan อดีตผู้อำนวยการของ Coinbase กล่าวว่าเขาได้ใส่ Ethereum smart contract ลงใน GPT-4 และชี้ไปที่ "ช่องโหว่ด้านความปลอดภัย" หลายรายการทันที และสรุปวิธีการใช้ประโยชน์จากรหัส:

ฉันทิ้งสัญญา Ethereum ที่ใช้งานจริงลงใน GPT-4
ในทันที มันได้เน้นย้ำถึงช่องโหว่ด้านความปลอดภัยจำนวนหนึ่งและชี้ให้เห็นพื้นที่ผิวเผินที่สามารถใช้ประโยชน์จากสัญญาได้ จากนั้นตรวจสอบวิธีเฉพาะที่ฉันสามารถใช้ประโยชน์จากสัญญาได้ pic.twitter.com/its5puakUW
— คอเนอร์ (@jconorgrogan) March 14, 2023

การตรวจสอบสัญญาอัจฉริยะก่อนหน้านี้บน ChatGPT พบว่าเวอร์ชันแรกนั้นสามารถตรวจจับจุดบกพร่องของโค้ดได้ในระดับที่เหมาะสมเช่นกัน

Rowan Cheung ผู้ก่อตั้งจดหมายข่าว AI “The Rundown” แชร์วิดีโอของ GPT ที่แปลงเว็บไซต์ปลอมที่วาดด้วยมือบนแผ่นกระดาษให้เป็นโค้ด

ฉันเพิ่งดู GPT-4 เปลี่ยนภาพร่างที่วาดด้วยมือให้เป็นเว็บไซต์ที่ใช้งานได้
นี่มันบ้าไปแล้ว pic.twitter.com/P5nSjrk7Wn
— โรวัน เฉิง (@rowancheung) March 14, 2023