เราควรกดดัน AI ChatGPT ทั่วไปให้พูดแสดงความเกลียดชังอย่างไร ถามจริยธรรม AI และกฎหมาย AI

ทุกคนมีจุดแตกหัก

ฉันคิดว่าคุณสามารถพูดอย่างนั้นได้ ทุกอย่าง มีจุดแตกหักของมัน

เราทราบดีว่าบางครั้งมนุษย์สามารถตะครุบและเปล่งคำพูดที่พวกเขาไม่จำเป็นต้องพูดออกไป ในทำนองเดียวกัน บางครั้งคุณสามารถทำให้อุปกรณ์หรือเครื่องจักรหักได้ เช่น ผลักรถของคุณแรงเกินไปและรถเริ่มสั่นคลอนหรือหลุดออกจากกัน ดังนั้น แนวคิดที่ว่าผู้คนหรือ "ทุกคน" มักจะมีจุดแตกหัก และในทำนองเดียวกัน เราสามารถยืนยันได้ว่าวัตถุและสิ่งของโดยทั่วไปก็มีแนวโน้มที่จะมีจุดแตกหักเช่นกัน

อาจมีเหตุผลที่ค่อนข้างสมเหตุสมผลและสำคัญอย่างยิ่งในการยืนยันว่าจุดแตกหักอยู่ที่ใด ตัวอย่างเช่น คุณคงเคยเห็นวิดีโอที่แสดงรถที่กำลังวิ่งเพื่อระบุจุดแตกหักของรถอย่างไม่ต้องสงสัย นักวิทยาศาสตร์และผู้ทดสอบจะชนรถเข้ากับกำแพงอิฐเพื่อดูว่ากันชนและโครงสร้างของรถสามารถทนทานต่อการกระทุ้งได้ดีเพียงใด การทดสอบอื่นๆ อาจรวมถึงการใช้ห้องหรือคลังสินค้าเฉพาะที่สร้างความเย็นจัดหรือความร้อนจัดเพื่อดูว่ารถยนต์จะแล่นอย่างไรภายใต้สภาพอากาศที่แตกต่างกัน

ฉันขอนำเสนอหัวข้อที่น่าสนใจนี้ในคอลัมน์ของวันนี้ เพื่อให้เราได้พูดคุยกันว่าปัจจุบันมีบางคนกำลังผลักดันปัญญาประดิษฐ์ (AI) อย่างหนักเพื่อระบุและสันนิษฐานว่าเปิดเผยจุดแตกหักประเภทใดประเภทหนึ่ง ซึ่งก็คือจุดแตกหักภายใน AI ที่ก่อให้เกิดคำพูดแสดงความเกลียดชัง

ใช่ ถูกต้อง มีความพยายามเฉพาะกิจหลายอย่างและในบางครั้งความพยายามอย่างเป็นระบบเพื่อประเมินว่าเป็นไปได้หรือไม่ที่ AI จะพ่นคำพูดแสดงความเกลียดชังออกมา สิ่งนี้ได้กลายเป็นกีฬาตัวยง ถ้าคุณต้องการ เนื่องจากความสนใจและความนิยมที่เพิ่มขึ้นของ AI เชิงกำเนิด

คุณอาจทราบดีว่าแอป AI กำเนิดที่รู้จักกันในชื่อ ChatGPT ได้กลายเป็นที่พูดถึงกันอย่างกว้างขวาง เนื่องจากสามารถสร้างเรียงความได้อย่างคล่องแคล่วอย่างน่าอัศจรรย์ พาดหัวข่าวยังคงส่งเสียงดังและยกย่องงานเขียนที่น่าอัศจรรย์ที่ ChatGPT จัดการเพื่อสร้าง ChatGPT ถือเป็นแอปพลิเคชัน AI กำเนิดที่รับข้อความบางส่วนจากผู้ใช้เป็นข้อความ แล้วสร้างหรือสร้างผลลัพธ์ที่ประกอบด้วยเรียงความ AI เป็นตัวสร้างข้อความเป็นข้อความ แม้ว่าฉันจะอธิบายว่า AI เป็นตัวสร้างข้อความเป็นเรียงความ เนื่องจากมันอธิบายได้ง่ายขึ้นว่าโดยทั่วไปจะใช้ทำอะไร

หลายคนประหลาดใจเมื่อพูดถึงว่า AI ประเภทนี้มีมาระยะหนึ่งแล้ว และ ChatGPT ซึ่งเปิดตัวเมื่อปลายเดือนพฤศจิกายนกลับไม่ได้รับรางวัลในฐานะผู้เสนอญัตติรายแรกในโลกของ text-to-essay ความกระตือรือร้น ฉันได้พูดคุยเกี่ยวกับแอป AI กำเนิดอื่นๆ ที่คล้ายกันในช่วงหลายปีที่ผ่านมา ดูความครอบคลุมของฉันได้ที่ ลิงค์ที่นี่.

เหตุผลที่คุณอาจไม่ทราบหรือจำกรณีก่อนหน้าของ AI กำเนิดได้ อาจเป็นเพราะปริศนา "ล้มเหลวในการเปิดตัวสำเร็จ" แบบคลาสสิก นี่คือสิ่งที่มักจะเกิดขึ้น ผู้ผลิต AI ออกแอป AI กำเนิดของตน ทำเช่นนั้นด้วยความตื่นเต้นและความคาดหวังอย่างกระตือรือร้นว่าโลกจะชื่นชมการประดิษฐ์กับดักหนูที่ดีกว่านี้ ใครๆ ก็พูดได้ ในตอนแรกทุกอย่างดูดี ผู้คนต่างประหลาดใจกับสิ่งที่ AI สามารถทำได้

น่าเสียดายที่ขั้นตอนต่อไปคือล้อเริ่มหลุดออกจากรถบัสที่เป็นที่เลื่องลือ AI สร้างเรียงความที่มีคำหยาบคายหรือวลีที่ไม่เหมาะสม ทวีตไวรัสหรือสื่อสังคมออนไลน์อื่น ๆ ที่โพสต์เน้นย้ำอย่างชัดเจนว่า AI ทำเช่นนี้ การประณามเกิดขึ้น เราไม่สามารถให้ AI เดินไปรอบๆ และสร้างคำที่ไม่เหมาะสมหรือคำพูดที่ไม่เหมาะสมได้ ฟันเฟืองขนาดใหญ่ปรากฏขึ้น ผู้ผลิต AI อาจพยายามปรับแต่งการทำงานภายในของ AI แต่ความซับซ้อนของอัลกอริทึมและข้อมูลไม่ได้ให้การแก้ไขอย่างรวดเร็ว ความแตกตื่นจึงเกิดขึ้น พบตัวอย่างมากขึ้นเรื่อย ๆ ของ AI ที่ปล่อยมลพิษและโพสต์ทางออนไลน์

ผู้ผลิต AI ไม่เต็มใจ แต่ไม่มีทางเลือกอื่นนอกจากลบแอป AI ออกจากการใช้งาน พวกเขาดำเนินการเช่นนี้และมักจะกล่าวคำขอโทษว่าพวกเขาเสียใจหากมีใครไม่พอใจกับผลลัพธ์ของ AI ที่สร้างขึ้น

กลับไปที่กระดานวาดภาพ ผู้สร้าง AI จะไป ได้เรียนรู้บทเรียนแล้ว ระมัดระวังเกี่ยวกับการปล่อย AI กำเนิดที่สร้างคำหยาบคายหรือสิ่งที่คล้ายกัน มันเป็นจูบแห่งความตายสำหรับ AI นอกจากนี้ ผู้ผลิตเอไอจะเสียชื่อเสียงและเสียหาย ซึ่งอาจคงอยู่เป็นเวลานานและบั่นทอนความพยายามด้านเอไออื่น ๆ ทั้งหมด รวมถึงสิ่งที่ไม่เกี่ยวข้องกับเอไอกำเนิดด้วยกันเอง การทำให้สัตว์เลี้ยงของคุณคลั่งไคล้การเปล่งภาษา AI ที่ไม่เหมาะสมเป็นข้อผิดพลาดที่ยั่งยืนในขณะนี้ มันยังคงเกิดขึ้น

ล้าง ล้าง และทำซ้ำ

ในช่วงแรก ๆ ของ AI ประเภทนี้ ผู้ผลิต AI ไม่ค่อยมีสติสัมปชัญญะหรือเชี่ยวชาญในการขัดเกลา AI ในแง่ของการพยายามป้องกันการปล่อยมลพิษที่ไม่เหมาะสม ทุกวันนี้ หลังจากที่ได้เห็นเพื่อนร่วมงานของพวกเขาพังทลายจากฝันร้ายด้านการประชาสัมพันธ์ ผู้สร้าง AI ส่วนใหญ่ก็ดูเหมือนจะได้รับข้อความแล้ว คุณต้องวางราวกั้นให้มากที่สุดเท่าที่จะทำได้ พยายามป้องกันไม่ให้ AI ปล่อยคำหรือวลีที่ไม่เหมาะสม ใช้เทคนิคการปิดปากหรือการกรองอะไรก็ตามที่จะหยุด AI จากการสร้างและแสดงคำหรือเรียงความที่พบว่าไม่เหมาะสม

นี่คือรสชาติของการใช้คำฟุ่มเฟือยพาดหัวแบนเนอร์ที่ใช้เมื่อ AI ถูกจับได้ว่าปล่อยผลลัพธ์ที่ไม่น่าไว้วางใจออกมา:

  • “AI แสดงพิษที่น่ากลัว”
  • “AI มีกลิ่นเหม็นของความคลั่งไคล้โดยสิ้นเชิง”
  • “AI กลายเป็นฝ่ายรุกอย่างโจ่งแจ้ง”
  • “AI พ่นคำพูดแสดงความเกลียดชังที่น่าตกใจและผิดศีลธรรมออกมา”
  • เป็นต้น

เพื่อความสะดวกในการอภิปรายในที่นี้ ฉันจะอ้างถึงการเผยแพร่เนื้อหาที่ไม่เหมาะสมว่าเท่ากับการผลิต ความเกลียดชัง. ดังที่กล่าวไว้ โปรดทราบว่ามีเนื้อหาที่ไม่เหมาะสมทุกรูปแบบที่สามารถผลิตได้ ซึ่งเกินขอบเขตของคำพูดแสดงความเกลียดชังเพียงอย่างเดียว คำพูดแสดงความเกลียดชังมักถูกตีความว่าเป็นเนื้อหาที่ไม่เหมาะสมรูปแบบหนึ่ง

เรามาเน้นที่คำพูดแสดงความเกลียดชังสำหรับการสนทนานี้ เพื่อความสะดวกในการพูดคุย แต่โปรดทราบว่าเนื้อหาที่ไม่เหมาะสมอื่นๆ ก็สมควรได้รับการตรวจสอบเช่นกัน

เจาะลึกคำพูดแสดงความเกลียดชังโดยมนุษย์และโดย AI

สหประชาชาติกำหนด ความเกลียดชัง ทางนี้:

  • “ในภาษาทั่วไป 'คำพูดแสดงความเกลียดชัง' หมายถึงวาทกรรมที่ไม่เหมาะสมซึ่งกำหนดเป้าหมายกลุ่มหรือบุคคลตามลักษณะเฉพาะที่มีมาแต่กำเนิด (เช่น เชื้อชาติ ศาสนา หรือเพศ) และนั่นอาจคุกคามความสงบสุขในสังคม เพื่อจัดทำกรอบการทำงานที่เป็นเอกภาพสำหรับสหประชาชาติในการแก้ไขปัญหาทั่วโลก กลยุทธ์และแผนปฏิบัติการของสหประชาชาติเกี่ยวกับคำพูดแสดงความเกลียดชังได้ให้คำจำกัดความของคำพูดแสดงความเกลียดชังว่าเป็น 'การสื่อสารในรูปแบบใด ๆ ไม่ว่าจะเป็นคำพูด การเขียน หรือพฤติกรรมที่โจมตีหรือใช้ภาษาที่ดูถูกเหยียดหยามหรือเลือกปฏิบัติกับ การอ้างอิงถึงบุคคลหรือกลุ่มตามที่พวกเขาเป็น หรืออีกนัยหนึ่งคือขึ้นอยู่กับศาสนา ชาติพันธุ์ สัญชาติ เชื้อชาติ สีผิว เชื้อสาย เพศ หรือปัจจัยด้านอัตลักษณ์อื่นๆ' อย่างไรก็ตาม จนถึงปัจจุบันยังไม่มีคำจำกัดความสากลของคำพูดแสดงความเกลียดชังภายใต้กฎหมายสิทธิมนุษยชนระหว่างประเทศ แนวคิดนี้ยังอยู่ระหว่างการหารือ โดยเฉพาะอย่างยิ่งในส่วนที่เกี่ยวข้องกับเสรีภาพในการแสดงความคิดเห็นและการแสดงออก การไม่เลือกปฏิบัติ และความเท่าเทียมกัน” (โพสต์บนเว็บไซต์ของสหประชาชาติเรื่อง “คำพูดแสดงความเกลียดชังคืออะไร”)

AI ที่สร้างข้อความนั้นอาจเข้าสู่ขอบเขตของคำพูดแสดงความเกลียดชัง คุณสามารถพูดแบบเดียวกันเกี่ยวกับ text-to-art, text-to-audio, text-to-video และโหมดอื่นๆ ของ generative AI มีความเป็นไปได้อยู่เสมอ เช่น AI กำเนิดจะผลิตงานศิลปะที่มีกลิ่นของคำพูดแสดงความเกลียดชัง สำหรับวัตถุประสงค์ของการสนทนาในที่นี้ ฉันจะมุ่งเน้นไปที่ความเป็นไปได้ของข้อความเป็นข้อความหรือข้อความเป็นเรียงความ

ในทั้งหมดนี้มีข้อพิจารณาหลายประการเกี่ยวกับจริยธรรมของ AI และกฎหมาย AI

โปรดทราบว่ามีความพยายามอย่างต่อเนื่องในการนำหลักการด้านจริยธรรมของ AI เข้ามาใช้ในการพัฒนาและเผยแพร่แอป AI ความกังวลที่เพิ่มขึ้นของนักจริยธรรมด้าน AI ที่เกี่ยวข้องและในอดีตกำลังพยายามทำให้แน่ใจว่าความพยายามในการประดิษฐ์และนำ AI มาใช้นั้นคำนึงถึงมุมมองของการทำ AI เพื่อความดี และหลีกเลี่ยง AI สำหรับไม่ดี. ในทำนองเดียวกัน มีการเสนอกฎหมาย AI ฉบับใหม่ซึ่งกำลังถูกรวมเป็นหนึ่งเดียวเพื่อเป็นทางออกที่เป็นไปได้เพื่อป้องกันไม่ให้ความพยายามของ AI ก้าวก่ายการละเมิดสิทธิมนุษยชนและอื่นๆ สำหรับความครอบคลุมอย่างต่อเนื่องและกว้างขวางของฉันเกี่ยวกับจริยธรรม AI และกฎหมาย AI โปรดดู ลิงค์ที่นี่ และ ลิงค์ที่นี่เพียงเพื่อชื่อไม่กี่

การพัฒนาและการประกาศใช้หลักปฏิบัติด้านจริยธรรมของ AI กำลังดำเนินการอยู่เพื่อหวังว่าจะป้องกันไม่ให้สังคมตกหลุมพรางที่ชักนำให้เกิด AI จำนวนนับไม่ถ้วน สำหรับความครอบคลุมของฉันเกี่ยวกับหลักจริยธรรมของ UN AI ที่คิดค้นและสนับสนุนโดยเกือบ 200 ประเทศผ่านความพยายามของ UNESCO ดู ลิงค์ที่นี่. ในทำนองเดียวกัน กฎหมาย AI ใหม่กำลังถูกสำรวจเพื่อพยายามรักษา AI ไว้บนกระดูกงู หนึ่งในเทคล่าสุดประกอบด้วยชุดของข้อเสนอ AI บิลสิทธิ ที่ทำเนียบขาวของสหรัฐฯ เพิ่งเผยแพร่เพื่อระบุสิทธิมนุษยชนในยุคของ AI ดู ลิงค์ที่นี่. ต้องใช้หมู่บ้านหนึ่งแห่งเพื่อให้ AI และนักพัฒนา AI อยู่บนเส้นทางที่ถูกต้อง และยับยั้งความพยายามที่มีจุดมุ่งหมายหรือโดยไม่ได้ตั้งใจที่อาจบ่อนทำลายสังคม

ฉันจะผสมผสานข้อควรพิจารณาที่เกี่ยวข้องกับจริยธรรมของ AI และกฎหมาย AI เข้าไว้ด้วยกันในการอภิปรายนี้เกี่ยวกับการใช้คำพูดแสดงความเกลียดชังของ AI หรือเนื้อหาที่ไม่เหมาะสมอื่นๆ

ความสับสนเล็กน้อยที่ฉันอยากจะชี้แจงในทันทีคือ AI ในปัจจุบันไม่มีความรู้สึก ดังนั้นคุณจึงไม่สามารถประกาศว่า AI อาจสร้างคำพูดแสดงความเกลียดชังได้เนื่องจากเจตนาที่มีจุดประสงค์เหมือนมนุษย์ซึ่งแฝงอยู่ใน AI อย่างใด Zany อ้างว่า AI ในปัจจุบันมีความรู้สึกและ AI มีวิญญาณที่เสียหาย ทำให้มันสร้างคำพูดแสดงความเกลียดชัง

ไร้สาระ.

อย่าตกหลุมรักมัน

เมื่อพิจารณาถึงหลักการสำคัญดังกล่าวแล้ว บางคนรู้สึกไม่พอใจกับสิ่งบ่งชี้ดังกล่าว เนื่องจากดูเหมือนว่าคุณกำลังปล่อยให้ AI หลุดจากเบ็ด ภายใต้วิธีคิดที่แปลกประหลาดนั้น การเตือนสติจะเกิดขึ้นตามมาว่าคุณเต็มใจที่จะให้ AI สร้างผลลัพธ์ที่เลวร้ายในลักษณะใดก็ตาม คุณชอบ AI ที่พ่นคำพูดแสดงความเกลียดชังออกมา

ใช่รูปแบบที่ค่อนข้างบิดเบี้ยวไร้ตรรกะ สาระสำคัญที่แท้จริงของเรื่องนี้คือเราต้องให้ผู้สร้าง AI รับผิดชอบพร้อมกับใครก็ตามที่จัดหา AI หรือควบคุม AI ฉันได้พูดคุยกันมานานแล้วว่าเรายังไม่ถึงจุดที่จะยอมรับสถานะบุคคลตามกฎหมายของ AI ดูการวิเคราะห์ของฉันได้ที่ ลิงค์ที่นี่และจนกว่าจะถึงเวลานั้น AI จะอยู่นอกเหนือขอบเขตความรับผิดชอบทางกฎหมาย แม้ว่าจะมีมนุษย์ที่เป็นรากฐานของการพัฒนา AI นอกจากนี้ มนุษย์ยังอยู่ภายใต้การควบคุมและการปฏิบัติการของ AI เราสามารถติดตามมนุษย์เหล่านั้นเพื่อรับความรับผิดชอบของ AI ของพวกเขา

นอกเหนือจากนี้ อาจเป็นเรื่องยุ่งยากเช่นกัน โดยเฉพาะอย่างยิ่งหาก AI ลอยออกสู่อินเทอร์เน็ตและเราไม่สามารถระบุได้ว่าคนหรือมนุษย์คนใดทำสิ่งนี้ ซึ่งเป็นอีกหัวข้อหนึ่งที่ฉันได้กล่าวถึงในคอลัมน์ของฉันที่ ลิงค์ที่นี่. ยุ่งยากหรือไม่ เรายังไม่สามารถประกาศว่า AI เป็นฝ่ายผิด อย่าปล่อยให้มนุษย์แอบใช้การสร้างมนุษย์ผิดๆ เพื่อซ่อนตัวและหลบหนีความรับผิดชอบในสิ่งที่พวกเขาก่อขึ้น

กลับมาที่เรื่องใกล้ตัว

คุณอาจสงสัยว่าเหตุใดผู้สร้าง AI ทั้งหมดจึงไม่เพียงแค่จำกัดการกำเนิด AI ของตน ในลักษณะที่เป็นไปไม่ได้ที่ AI จะสร้างคำพูดแสดงความเกลียดชัง ดูเหมือนว่าจะง่ายแสนง่าย เพียงเขียนโค้ดหรือสร้างรายการตรวจสอบคำแสดงความเกลียดชัง และตรวจสอบให้แน่ใจว่า AI ไม่เคยสร้างสิ่งใดในลักษณะนี้ ดูเหมือนว่าอาจสงสัยว่าผู้สร้าง AI ไม่ได้คิดถึงการแก้ไขอย่างรวดเร็วนี้

ฉันเกลียดที่จะบอกคุณเรื่องนี้ แต่ความซับซ้อนในการตีความว่าอะไรคือหรือไม่ใช่คำพูดแสดงความเกลียดชังนั้นยากกว่าที่คุณคิดไว้มาก

เปลี่ยนสิ่งนี้เป็นโดเมนของมนุษย์และวิธีที่มนุษย์สนทนากัน สมมติว่าคุณมีมนุษย์ที่ต้องการหลีกเลี่ยงการพูดแสดงความเกลียดชัง บุคคลนี้ตระหนักถึงคำพูดแสดงความเกลียดชังเป็นอย่างดี และหวังเป็นอย่างยิ่งว่าจะหลีกเลี่ยงการพูดคำหรือวลีที่อาจก่อให้เกิดคำพูดแสดงความเกลียดชัง บุคคลนี้ตั้งใจแน่วแน่ที่จะไม่ยอมปล่อยให้คำพูดแสดงความเกลียดชังเล็ดลอดออกมาจากปากของพวกเขา

มนุษย์ที่มีมันสมองและตื่นตัวในการหลีกเลี่ยงคำพูดแสดงความเกลียดชังจะสามารถเสมอและไม่มีโอกาสลื่นไถลได้หรือไม่ จะสามารถรับประกันได้ว่าพวกเขาจะไม่ปล่อยคำพูดแสดงความเกลียดชังออกมาหรือไม่?

แรงกระตุ้นแรกของคุณคือการบอกว่า ใช่ แน่นอน มนุษย์ที่รู้แจ้งจะสามารถบรรลุเป้าหมายนั้นได้ ผู้คนฉลาด หากพวกเขาตั้งใจทำสิ่งใดสิ่งหนึ่ง พวกเขาสามารถทำมันให้สำเร็จได้ ช่วงท้ายเรื่อง.

อย่ามั่นใจมาก

สมมติว่าฉันขอให้บุคคลนี้บอกฉันเกี่ยวกับคำพูดแสดงความเกลียดชัง นอกจากนี้ ฉันขอให้พวกเขายกตัวอย่างคำพูดแสดงความเกลียดชังให้ฉันฟัง ฉันต้องการเห็นหรือได้ยินตัวอย่างเพื่อที่ฉันจะได้รู้ว่าคำพูดแสดงความเกลียดชังประกอบด้วยอะไรบ้าง เหตุผลของฉันในการถามสิ่งนี้อยู่เหนือกระดาน

บุคคลนั้นควรพูดอะไรกับฉัน

ฉันคิดว่าคุณคงเห็นกับดักที่วางเอาไว้แล้ว ถ้าคนๆ นั้นยกตัวอย่างคำพูดแสดงความเกลียดชังให้ฉันฟัง รวมถึงการใช้คำหรือวลีที่หยาบคายจริงๆ แสดงว่าตอนนี้พวกเขาเองก็ได้เปล่งวาจาแสดงความเกลียดชังแล้ว แบม เราจับได้แล้ว ในขณะที่พวกเขาสาบานว่าจะไม่พูดคำพูดแสดงความเกลียดชัง แต่ตอนนี้พวกเขาได้ทำเช่นนั้นแล้ว

ไม่ยุติธรรม คุณอุทาน! พวกเขาแค่พูดคำนั้นหรือคำเหล่านั้นเพื่อเป็นตัวอย่างเท่านั้น ในใจของพวกเขาไม่เชื่อในคำพูดหรือคำพูด มันไม่อยู่ในบริบทและอุกอาจที่จะประกาศว่าบุคคลนั้นเกลียดชัง

ฉันแน่ใจว่าคุณเห็นว่าการแสดงคำพูดแสดงความเกลียดชังอาจไม่จำเป็นต้องเกิดจากพื้นฐานความเกลียดชัง ในกรณีการใช้งานนี้ สมมติว่าคนๆ นั้นไม่ได้ "หมายความถึง" คำพูดนั้น และพวกเขาแค่ท่องคำศัพท์เพื่อจุดประสงค์ในการแสดงเท่านั้น เราอาจเห็นพ้องต้องกันว่าพวกเขาไม่ได้ตั้งใจส่งเสริมคำพูดแสดงความเกลียดชัง แน่นอนว่ามีบางคนที่ยืนกรานว่าการใช้คำพูดแสดงความเกลียดชังไม่ว่าจะด้วยเหตุผลหรือพื้นฐานใดก็ตาม เป็นสิ่งที่ผิด บุคคลนั้นควรปฏิเสธคำขอ พวกเขาควรยืนหยัดและปฏิเสธที่จะพูดคำหรือวลีที่เป็นคำพูดแสดงความเกลียดชัง ไม่ว่าพวกเขาจะขอให้ทำเช่นนั้นด้วยเหตุผลใดหรืออย่างไร

สิ่งนี้สามารถเป็นวงกลมได้บ้าง หากคุณไม่สามารถบอกได้ว่าสิ่งใดที่ก่อให้เกิดคำพูดแสดงความเกลียดชัง คนอื่นๆ จะรู้ได้อย่างไรว่าควรหลีกเลี่ยงอะไรเมื่อพวกเขาใช้คำพูดใดๆ เราดูเหมือนจะติดอยู่ คุณไม่สามารถพูดในสิ่งที่ไม่ควรพูด และไม่มีใครบอกคุณได้ว่าอะไรที่พูดไม่ได้

วิธีปกติในการหลีกเลี่ยงภาวะที่กลืนไม่เข้าคายไม่ออกนี้คือการอธิบายในคำอื่น ๆ ที่ถือว่าเป็นคำพูดแสดงความเกลียดชัง โดยทำเช่นนั้นโดยไม่ต้องเรียกใช้คำพูดแสดงความเกลียดชัง ความเชื่อคือการให้ข้อมูลบ่งชี้โดยรวมจะเพียงพอที่จะแจ้งให้ผู้อื่นทราบเกี่ยวกับสิ่งที่พวกเขาต้องหลีกเลี่ยง ดูเหมือนจะเป็นกลยุทธ์ที่สมเหตุสมผล แต่ก็มีปัญหาเช่นกัน และคนๆ หนึ่งอาจยังคงหลงไหลในการใช้คำพูดแสดงความเกลียดชัง เพราะพวกเขาไม่รู้ว่าคำจำกัดความที่กว้างกว่านั้นครอบคลุมรายละเอียดของสิ่งที่พวกเขาพูดออกไป

ทั้งหมดนี้เกี่ยวข้องกับมนุษย์และวิธีที่มนุษย์พูดหรือสื่อสารกัน

จำได้ว่าเรามุ่งเน้นไปที่ AI ที่นี่ เราต้องให้ AI หลีกเลี่ยงหรือหยุดไม่ให้ปล่อยคำพูดแสดงความเกลียดชังโดยสิ้นเชิง คุณอาจโต้แย้งว่าเราอาจจะทำได้โดยตรวจสอบให้แน่ใจว่า AI ไม่เคยได้รับหรือฝึกอบรมเกี่ยวกับสิ่งที่ก่อให้เกิดคำพูดแสดงความเกลียดชัง Voila หากไม่มีอินพุตดังกล่าวก็น่าจะไม่มีเอาต์พุตดังกล่าว แก้ไขปัญหา.

มาดูกันว่าสิ่งนี้เกิดขึ้นจริงได้อย่างไร เราเลือกที่จะให้แอป AI ออกสู่อินเทอร์เน็ตโดยใช้คอมพิวเตอร์ และตรวจสอบบทความและเรื่องเล่านับพันที่โพสต์บนอินเทอร์เน็ต เรากำลังฝึก AI ในเชิงคำนวณและทางคณิตศาสตร์เกี่ยวกับวิธีค้นหารูปแบบในคำต่างๆ ที่มนุษย์ใช้ นั่นคือวิธีการคิดค้น AI กำเนิดล่าสุด และยังเป็นพื้นฐานสำคัญว่าทำไม AI จึงดูเหมือนคล่องแคล่วในการสร้างเรียงความภาษาธรรมชาติ

บอกฉันทีว่าถ้าคุณทำได้ การฝึกอบรมการคำนวณโดยใช้คำนับล้านล้านคำบนอินเทอร์เน็ตจะทำได้อย่างไรในลักษณะที่ไม่ว่ารูปลักษณ์ภายนอกหรือแม้แต่คำพูดแสดงความเกลียดชังจะถูกรวมเข้าด้วยกัน

ฉันกล้าพูดได้เลยว่านี่เป็นความทะเยอทะยานที่ยุ่งยากและแทบจะเป็นไปไม่ได้เลย

อัตราต่อรองคือคำพูดแสดงความเกลียดชังจะถูกกลืนโดย AI และเครือข่ายการจับคู่รูปแบบการคำนวณ การพยายามป้องกันสิ่งนี้เป็นปัญหา นอกจากนี้ แม้ว่าคุณจะย่อขนาดให้เล็กสุด แต่ก็ยังมีบางส่วนที่อาจเล็ดลอดเข้ามาได้ คุณไม่มีทางเลือกมากนักนอกจากต้องสันนิษฐานว่าบางส่วนจะมีอยู่ในเครือข่ายการจับคู่รูปแบบหรือเงาของถ้อยคำดังกล่าวจะฝังแน่น

ฉันจะเพิ่มการบิดและรอบให้มากขึ้น

ฉันเชื่อว่าเราทุกคนอาจรับทราบว่าคำพูดแสดงความเกลียดชังเปลี่ยนแปลงไปตามกาลเวลา สิ่งที่อาจถูกมองว่าไม่ใช่คำพูดแสดงความเกลียดชังอาจกลายเป็นคำตัดสินทางวัฒนธรรมและสังคมว่าเป็นคำพูดแสดงความเกลียดชังในเวลาต่อมา ดังนั้น หากเราฝึก AI ของเราบนข้อความอินเทอร์เน็ต แล้วสมมติว่าหยุด AI ไว้ไม่ให้ฝึกเพิ่มเติมบนอินเทอร์เน็ต เราอาจเจอคำพูดแสดงความเกลียดชังในตอนนั้น แม้ว่าตอนนั้นจะไม่ถือว่าเป็นคำพูดแสดงความเกลียดชังก็ตาม หลังจากความจริงแล้วคำพูดดังกล่าวอาจถูกประกาศว่าเป็นคำพูดแสดงความเกลียดชัง

อีกครั้ง สาระสำคัญก็คือการพยายามแก้ปัญหานี้ด้วยการทำให้มั่นใจว่า AI จะไม่ถูกเปิดเผยต่อคำพูดแสดงความเกลียดชัง เรายังคงต้องหาวิธีการป้องกันไม่ให้ AI ปล่อยคำพูดแสดงความเกลียดชัง เช่น การเปลี่ยนประเพณีที่ต่อมารวมถึงคำพูดแสดงความเกลียดชังที่เมื่อก่อนไม่ถือว่าเป็นเช่นนั้น

การบิดอีกอย่างมีค่าควรแก่การไตร่ตรอง

ฉันได้กล่าวไว้ก่อนหน้านี้ว่าเมื่อใช้ generative AI เช่น ChatGPT ผู้ใช้ป้อนข้อความเพื่อกระตุ้น AI ในการผลิตเรียงความ ข้อความที่ป้อนถือเป็นรูปแบบหนึ่งของการแจ้งหรือเตือนแอป AI ฉันจะอธิบายเพิ่มเติมเกี่ยวกับเรื่องนี้ในอีกสักครู่

ไม่ว่าในกรณีใด ลองนึกภาพว่ามีคนใช้แอป AI กำเนิดตัดสินใจเข้ามาพร้อมแสดงคำพูดแสดงความเกลียดชังจำนวนหนึ่ง

จะเกิดอะไรขึ้น?

หาก AI ใช้คำเหล่านั้นและสร้างเรียงความตามผลลัพธ์ของคำเหล่านั้น โอกาสที่คำพูดแสดงความเกลียดชังจะรวมอยู่ในเรียงความที่สร้างขึ้น คุณเห็นไหม เรามี AI ที่จะพูดคำพูดแสดงความเกลียดชัง แม้ว่ามันจะไม่เคยได้รับการฝึกฝนเกี่ยวกับคำพูดแสดงความเกลียดชังเลยก็ตาม

มีอย่างอื่นที่คุณต้องรู้

โปรดจำไว้ว่าฉันเพิ่งพูดถึงว่ามนุษย์สามารถสะดุดได้โดยขอให้พวกเขายกตัวอย่างคำพูดแสดงความเกลียดชัง สามารถทำได้เช่นเดียวกันกับ AI ผู้ใช้ป้อนข้อความแจ้งที่ขอให้ AI ยกตัวอย่างคำพูดแสดงความเกลียดชัง AI ควรปฏิบัติตามและให้ตัวอย่างดังกล่าวหรือไม่ ฉันพนันได้เลยว่าคุณอาจเชื่อว่า AI ไม่ควรทำเช่นนั้น ในทางกลับกัน หาก AI ถูกควบคุมไม่ให้ทำเช่นนั้น สิ่งนี้ถือเป็นข้อเสียที่อาจเกิดขึ้นหรือไม่ว่าผู้ที่ใช้ AI จะไม่สามารถทำได้ หากเราเคยได้รับคำแนะนำจาก AI ว่าคำพูดแสดงความเกลียดชังคืออะไร ( นอกเหนือจากการสรุปเกี่ยวกับเรื่องนี้)?

คำถามที่ยาก

ฉันมักจะจัดหมวดหมู่คำพูดแสดงความเกลียดชังที่ปล่อยออกมาจาก AI เป็นสามกลุ่มหลักเหล่านี้:

  • โหมดทุกวัน AI ปล่อยคำพูดแสดงความเกลียดชังโดยไม่มีการยั่วยุอย่างชัดเจนจากผู้ใช้ และราวกับว่าเป็นการทำเช่นนั้นในลักษณะ “ธรรมดา”
  • โดย Casual Prodding. AI ปล่อยคำพูดแสดงความเกลียดชังตามที่ผู้ใช้กระตุ้นเมื่อผู้ใช้ป้อนข้อความแจ้งหรือชุดข้อความแจ้งที่ดูเหมือนจะรวมหรือค้นหาการปล่อยดังกล่าวโดยตรง
  • ต่อ Stoking ที่กำหนด AI ปล่อยคำพูดแสดงความเกลียดชังหลังจากมีการผลักดันและผลักดันอย่างรวดเร็วโดยผู้ใช้ที่ต้องการให้ AI สร้างผลลัพธ์ดังกล่าว

AI เจนเนอเรชันรุ่นก่อนๆ มักจะปล่อยคำพูดแสดงความเกลียดชังออกมา ดังนั้น คุณสามารถจัดประเภทอินสแตนซ์เหล่านั้นเป็นประเภทของ โหมดประจำวัน การยกตัวอย่าง ผู้ผลิต AI ถอยกลับและเล่นกับ AI เพื่อทำให้มีโอกาสน้อยที่จะถูกติดหล่มในการผลิตคำพูดแสดงความเกลียดชัง

เมื่อมีการเปิดตัว AI ที่ละเอียดยิ่งขึ้น โอกาสที่จะได้เห็นใดๆ โหมดประจำวัน กรณีของคำพูดแสดงความเกลียดชังลดลงอย่างมาก ในทางกลับกัน คำพูดแสดงความเกลียดชังจะเกิดขึ้นก็ต่อเมื่อผู้ใช้ทำบางสิ่งเป็นข้อความแจ้งที่อาจจุดประกายทางการคำนวณและทางคณิตศาสตร์ให้เชื่อมโยงไปยังคำพูดที่เกี่ยวข้องกับความเกลียดชังในเครือข่ายการจับคู่รูปแบบ ผู้ใช้อาจทำสิ่งนี้โดยบังเอิญและไม่ทราบว่าสิ่งที่พวกเขาให้ไว้เป็นข้อความเตือนนั้นจะสร้างคำพูดแสดงความเกลียดชังโดยเฉพาะ หลังจากได้รับคำพูดแสดงความเกลียดชังในเรียงความที่ส่งออก ผู้ใช้มักจะตระหนักและเห็นว่าบางสิ่งในข้อความแจ้งของพวกเขาอาจนำไปสู่การรวมคำพูดแสดงความเกลียดชังไว้ในผลลัพธ์

นี่คือสิ่งที่ฉันเรียกว่า การผลิตแบบสบาย ๆ.

ในปัจจุบัน ความพยายามต่างๆ ในการกำจัดคำพูดแสดงความเกลียดชังที่สร้างโดย AI นั้นค่อนข้างแข็งแกร่งเมื่อเทียบกับในอดีต ด้วยเหตุนี้ คุณแทบจะต้องทำทุกอย่างเพื่อให้มีการสร้างคำพูดแสดงความเกลียดชัง บางคนเลือกที่จะตั้งใจดูว่าพวกเขาจะได้รับคำพูดแสดงความเกลียดชังจากแอป AI ที่สร้างสรรค์เหล่านี้หรือไม่ ฉันเรียกสิ่งนี้ สโต๊คกิ้งที่มุ่งมั่น.

ฉันต้องการเน้นว่าทั้งสามโหมดที่ระบุสามารถเกิดขึ้นได้และไม่ได้แยกออกจากกัน แอป AI เชิงสร้างสรรค์อาจสร้างคำพูดแสดงความเกลียดชังโดยไม่ต้องมีการแจ้งเตือนใด ๆ ที่ดูเหมือนจะกระตุ้นการผลิตดังกล่าว ในทำนองเดียวกัน บางสิ่งในพรอมต์อาจถูกตีความในทางตรรกะและทางคณิตศาสตร์ว่าเกี่ยวข้องกับเหตุใดจึงมีการแสดงคำพูดแสดงความเกลียดชัง และด้านที่สาม ซึ่งมีเป้าหมายเพื่อพยายามสร้างคำพูดแสดงความเกลียดชังออกมา อาจเป็นโหมดที่ยากที่สุดในการพยายามและให้ AI หลีกเลี่ยงการถูกกระตุ้นในการตอบสนอง เพิ่มเติมเกี่ยวกับเรื่องนี้ชั่วขณะ

เรามีการแกะกล่องเพิ่มเติมที่จะทำในหัวข้อที่น่าปวดหัวนี้

อันดับแรก เราควรแน่ใจว่าเราทุกคนมีความเข้าใจตรงกันว่า Generative AI ประกอบด้วยอะไรบ้าง และ ChatGPT นั้นเกี่ยวกับอะไร เมื่อเราครอบคลุมแง่มุมพื้นฐานนั้นแล้ว เราก็สามารถประเมินเรื่องสำคัญนี้อย่างสมเหตุสมผลได้

หากคุณคุ้นเคยกับ Generative AI และ ChatGPT เป็นอย่างดี คุณอาจอ่านส่วนถัดไปและดำเนินการต่อในส่วนที่ตามมา ฉันเชื่อว่าทุกคนจะได้รับประโยชน์จากรายละเอียดที่สำคัญเกี่ยวกับเรื่องเหล่านี้โดยการอ่านส่วนนี้อย่างใกล้ชิดและรับข้อมูลล่าสุดอย่างรวดเร็ว

ไพรเมอร์ด่วนเกี่ยวกับ Generative AI และ ChatGPT

ChatGPT เป็นระบบการสนทนาโต้ตอบแบบโต้ตอบด้วย AI สำหรับวัตถุประสงค์ทั่วไป โดยพื้นฐานแล้วเป็น Chatbot ทั่วไปที่ดูเหมือนไม่มีพิษมีภัย อย่างไรก็ตาม มันถูกใช้งานโดยผู้คนอย่างแข็งขันและกระตือรือร้นในลักษณะที่หลายคนไม่ทันตั้งตัว ซึ่งฉันจะอธิบายอย่างละเอียดในไม่ช้า แอป AI นี้ใช้ประโยชน์จากเทคนิคและเทคโนโลยีในขอบเขต AI ที่มักเรียกกันว่า กำเนิด AI. AI สร้างเอาต์พุตเช่นข้อความ ซึ่งเป็นสิ่งที่ ChatGPT ทำ แอป AI ที่ใช้การกำเนิดอื่นๆ สร้างรูปภาพ เช่น รูปภาพหรืองานศิลปะ ขณะที่แอปอื่นๆ สร้างไฟล์เสียงหรือวิดีโอ

ฉันจะเน้นไปที่แอป AI ที่สร้างข้อความเป็นข้อความในการสนทนานี้ เนื่องจากนั่นคือสิ่งที่ ChatGPT ทำ

แอพ Generative AI นั้นใช้งานง่ายมาก

สิ่งที่คุณต้องทำคือป้อนข้อความแจ้ง แล้วแอป AI จะสร้างเรียงความที่พยายามตอบกลับข้อความแจ้งให้คุณ ข้อความที่แต่งจะดูราวกับว่าเรียงความเขียนขึ้นด้วยมือและจิตใจของมนุษย์ หากคุณต้องป้อนข้อความแจ้งที่ระบุว่า "บอกฉันเกี่ยวกับอับราฮัม ลินคอล์น" AI กำเนิดจะให้เรียงความเกี่ยวกับลินคอล์นแก่คุณ สิ่งนี้จัดประเภทโดยทั่วไปว่าเป็น AI เชิงกำเนิดที่ดำเนินการ ข้อความเป็นข้อความ หรือบางคนชอบเรียกว่า ข้อความเป็นเรียงความ เอาต์พุต ดังที่ได้กล่าวมาแล้ว มีโหมดอื่นๆ ของการกำเนิด AI เช่น ข้อความเป็นงานศิลปะและข้อความเป็นวิดีโอ

ความคิดแรกของคุณอาจเป็นความสามารถในการสร้างสรรค์นี้ดูเหมือนจะไม่ใช่เรื่องใหญ่ในแง่ของการผลิตเรียงความ คุณสามารถค้นหาออนไลน์บนอินเทอร์เน็ตได้อย่างง่ายดายและค้นหาบทความมากมายเกี่ยวกับประธานาธิบดีลินคอล์นได้อย่างง่ายดาย จุดเด่นในกรณีของ AI เชิงกำเนิดคือเรียงความที่สร้างขึ้นนั้นค่อนข้างมีเอกลักษณ์เฉพาะตัวและให้องค์ประกอบดั้งเดิมมากกว่าของลอกเลียนแบบ หากคุณพยายามค้นหาเรียงความที่ผลิตโดย AI ทางออนไลน์สักแห่ง คุณจะไม่มีทางค้นพบมันได้

Generative AI ได้รับการฝึกอบรมล่วงหน้าและใช้ประโยชน์จากสูตรทางคณิตศาสตร์และการคำนวณที่ซับซ้อนซึ่งตั้งค่าไว้โดยการตรวจสอบรูปแบบในคำที่เขียนและเรื่องราวทั่วทั้งเว็บ ผลจากการตรวจสอบบทความที่เป็นลายลักษณ์อักษรนับพันนับล้านฉบับ AI สามารถพ่นเรียงความและเรื่องราวใหม่ๆ ที่ผิดเพี้ยนไปจากสิ่งที่พบได้ ด้วยการเพิ่มฟังก์ชันความน่าจะเป็นที่หลากหลาย ข้อความที่ได้จึงค่อนข้างไม่ซ้ำใครเมื่อเปรียบเทียบกับที่ใช้ในชุดการฝึก

นั่นเป็นสาเหตุที่เกิดความโกลาหลเกี่ยวกับนักเรียนที่สามารถโกงได้เมื่อเขียนเรียงความนอกห้องเรียน ครูต้องไม่เพียงแค่นำเรียงความที่นักเรียนหลอกลวงยืนยันว่าเป็นการเขียนของตนเองและพยายามหาว่าคัดลอกมาจากแหล่งข้อมูลออนไลน์อื่นหรือไม่ โดยรวมแล้วจะไม่มีเรียงความที่มีอยู่ก่อนแล้วทางออนไลน์ที่แน่นอนซึ่งเหมาะกับเรียงความที่สร้างโดย AI ทั้งหมดนี้ครูจะต้องยอมรับอย่างไม่เต็มใจว่านักเรียนเขียนเรียงความเป็นผลงานต้นฉบับ

มีความกังวลเพิ่มเติมเกี่ยวกับ AI กำเนิด

ข้อเสียที่สำคัญประการหนึ่งคือเรียงความที่ผลิตโดยแอป AI เชิงกำเนิดสามารถมีความเท็จต่างๆ ฝังอยู่ รวมถึงข้อเท็จจริงที่ไม่จริงอย่างเด่นชัด ข้อเท็จจริงที่แสดงให้เข้าใจผิด และข้อเท็จจริงที่ชัดเจนซึ่งประดิษฐ์ขึ้นทั้งหมด ลักษณะที่ประดิษฐ์ขึ้นเหล่านั้นมักเรียกว่ารูปแบบของ ภาพหลอน AIคำพูดติดปากที่ฉันไม่ชอบ แต่น่าเสียดายที่ดูเหมือนว่าจะได้รับความนิยมอย่างมากอยู่ดี (สำหรับคำอธิบายโดยละเอียดของฉันเกี่ยวกับสาเหตุที่คำศัพท์นี้ใช้ไม่ได้ศัพท์และไม่เหมาะสม โปรดดูความครอบคลุมของฉันที่ ลิงค์ที่นี่).

ฉันต้องการชี้แจงประเด็นสำคัญประการหนึ่งก่อนที่เราจะพูดถึงสิ่งต่างๆ ในหัวข้อนี้

มีการกล่าวอ้างเกินจริงในโซเชียลมีเดียเกี่ยวกับ กำเนิด AI ยืนยันว่าเป็น AI เวอร์ชันล่าสุดนี้จริง ความรู้สึก AI (ไม่ พวกเขาผิด!) ผู้ที่อยู่ในจริยธรรมของ AI และกฎหมาย AI รู้สึกกังวลอย่างยิ่งเกี่ยวกับแนวโน้มที่เพิ่มขึ้นของการเรียกร้องที่ขยายออกไป คุณอาจพูดอย่างสุภาพว่าบางคนพูดเกินจริงว่า AI ในปัจจุบันสามารถทำอะไรได้บ้าง พวกเขาถือว่า AI มีความสามารถที่เรายังไม่สามารถบรรลุได้ น่าเสียดาย ยิ่งไปกว่านั้น พวกเขาสามารถปล่อยให้ตัวเองและคนอื่นๆ ตกอยู่ในสถานการณ์เลวร้ายได้เนื่องจากข้อสันนิษฐานที่ว่า AI จะมีความรู้สึกหรือเหมือนมนุษย์ในการดำเนินการ

อย่าเปลี่ยนมนุษย์เป็น AI

การทำเช่นนี้จะทำให้คุณติดกับดักเหนียวแน่นและพึ่งพาไม่ได้ในการคาดหวังให้ AI ทำสิ่งที่ไม่สามารถทำได้ จากที่กล่าวมา AI เจนเนอเรทีฟล่าสุดค่อนข้างน่าประทับใจสำหรับสิ่งที่ทำได้ โปรดทราบว่ามีข้อจำกัดสำคัญที่คุณควรคำนึงถึงอย่างต่อเนื่องเมื่อใช้แอป AI กำเนิด

หากคุณสนใจความปั่นป่วนที่เพิ่มขึ้นอย่างรวดเร็วเกี่ยวกับ ChatGPT และ Generative AI ฉันได้จัดทำซีรีส์ที่มุ่งเน้นในคอลัมน์ของฉันซึ่งคุณอาจพบว่าข้อมูล ต่อไปนี้เป็นภาพรวมในกรณีที่หัวข้อใดต่อไปนี้ดึงดูดความสนใจของคุณ:

  • 1) การคาดการณ์ความก้าวหน้าของ AI เชิงกำเนิดที่กำลังจะมาถึง หากคุณต้องการทราบว่ามีแนวโน้มว่าจะเกิดอะไรขึ้นเกี่ยวกับ AI ตลอดปี 2023 และปีต่อๆ ไป รวมถึงความก้าวหน้าที่กำลังจะเกิดขึ้นใน Generative AI และ ChatGPT คุณจะต้องอ่านรายการการคาดการณ์ปี 2023 ฉบับสมบูรณ์ของฉันที่ ลิงค์ที่นี่.
  • 2) Generative AI และคำแนะนำด้านสุขภาพจิต ฉันเลือกที่จะทบทวนวิธีการใช้ AI และ ChatGPT สำหรับคำแนะนำด้านสุขภาพจิต ซึ่งเป็นแนวโน้มที่เป็นปัญหา ตามการวิเคราะห์ที่ฉันมุ่งเน้นที่ ลิงค์ที่นี่.
  • 3) พื้นฐานของ Generative AI และ ChatGPT งานชิ้นนี้จะสำรวจองค์ประกอบสำคัญของวิธีการทำงานของ AI เชิงกำเนิด และโดยเฉพาะอย่างยิ่งจะเจาะลึกถึงแอป ChatGPT รวมถึงการวิเคราะห์กระแสข่าวและเสียงประโคมข่าวที่ ลิงค์ที่นี่.
  • 4) ความตึงเครียดระหว่างครูและนักเรียนเกี่ยวกับ AI ทั่วไปและ ChatGPT ต่อไปนี้เป็นวิธีที่นักเรียนจะใช้ generative AI และ ChatGPT อย่างคดโกง นอกจากนี้ยังมีหลายวิธีสำหรับครูที่จะต่อสู้กับคลื่นยักษ์นี้ ดู ลิงค์ที่นี่.
  • 5) การใช้บริบทและ AI เชิงสร้างสรรค์ ฉันยังได้ตรวจสอบลิ้นในแก้มปรุงรสตามฤดูกาลเกี่ยวกับบริบทที่เกี่ยวข้องกับซานต้าที่เกี่ยวข้องกับ ChatGPT และ AI กำเนิดที่ ลิงค์ที่นี่.
  • 6) นักต้มตุ๋นที่ใช้ Generative AI. ในบันทึกที่เป็นลางไม่ดี นักต้มตุ๋นบางคนพบวิธีใช้ generative AI และ ChatGPT เพื่อทำผิด รวมถึงสร้างอีเมลหลอกลวงและแม้แต่สร้างโค้ดโปรแกรมสำหรับมัลแวร์ ดูการวิเคราะห์ของฉันที่ ลิงค์ที่นี่.
  • 7) ข้อผิดพลาดมือใหม่โดยใช้ AI กำเนิด. หลายคนมองข้ามและมองข้ามสิ่งที่ AI กำเนิดและ ChatGPT สามารถทำได้ ดังนั้นฉันจึงมองหาจุดที่ต่ำกว่าที่ AI มือใหม่มักจะทำเป็นพิเศษ ดูการสนทนาที่ ลิงค์ที่นี่.
  • 8) การรับมือกับการเตือนโดยกำเนิดของ AI และอาการประสาทหลอนของ AI. ฉันอธิบายแนวทางที่ล้ำหน้าในการใช้ส่วนเสริม AI เพื่อจัดการกับปัญหาต่างๆ ที่เกี่ยวข้องกับการพยายามป้อนข้อความแจ้งที่เหมาะสมลงใน AI เชิงกำเนิด และยังมีส่วนเสริม AI เพิ่มเติมสำหรับการตรวจจับสิ่งที่เรียกว่าผลลัพธ์ภาพหลอนของ AI และความเท็จ เช่น ครอบคลุมที่ ลิงค์ที่นี่.
  • 9) หักล้างข้อเรียกร้องของ Bonehead เกี่ยวกับการตรวจจับบทความที่สร้างโดย AI. มีการตื่นทองของแอพ AI ที่เข้าใจผิดซึ่งประกาศว่าสามารถยืนยันได้ว่าเรียงความใด ๆ ที่จัดทำขึ้นโดยมนุษย์และ AI สร้างขึ้น โดยรวมแล้ว สิ่งนี้ทำให้เข้าใจผิดและในบางกรณีก็เป็นการเรียกร้องที่ไร้เหตุผลและไม่สามารถป้องกันได้ ดูความคุ้มครองของฉันได้ที่ ลิงค์ที่นี่.
  • 10) การสวมบทบาทโดยใช้ AI กำเนิดอาจบ่งบอกถึงข้อเสียด้านสุขภาพจิต. บางคนกำลังใช้ AI กำเนิด เช่น ChatGPT เพื่อสวมบทบาท โดยแอป AI จะตอบสนองต่อมนุษย์ราวกับอยู่ในโลกแฟนตาซีหรือฉากที่แต่งขึ้นอื่นๆ สิ่งนี้อาจมีผลกระทบต่อสุขภาพจิต ดู ลิงค์ที่นี่.
  • 11) การเปิดเผยช่วงของข้อผิดพลาดที่ส่งออกและความเท็จ มีการรวบรวมรายการต่างๆ ที่รวบรวมไว้เพื่อพยายามแสดงลักษณะของข้อผิดพลาดและความเท็จที่เกิดจาก ChatGPT บางคนเชื่อว่าสิ่งนี้จำเป็น ในขณะที่บางคนบอกว่าการออกกำลังกายนั้นไร้ประโยชน์ ดูการวิเคราะห์ของฉันได้ที่ ลิงค์ที่นี่.
  • 12) โรงเรียนห้าม AI ChatGPT กำเนิดกำลังหายไปเรือ คุณอาจทราบแล้วว่าโรงเรียนต่างๆ เช่น กระทรวงศึกษาธิการของนครนิวยอร์ก (NYC) ได้ประกาศห้ามใช้ ChatGPT บนเครือข่ายและอุปกรณ์ที่เกี่ยวข้อง แม้ว่าสิ่งนี้อาจดูเหมือนเป็นการป้องกันที่มีประโยชน์ แต่จะไม่ขยับเข็มและพลาดเรือไปอย่างสิ้นเชิง ดูความคุ้มครองของฉันที่ ลิงค์ที่นี่.
  • 13) ChatGPT AI เจนเนอเรชั่นจะเป็นทุกที่เนื่องจาก API ที่กำลังจะมาถึง มีจุดหักเหที่สำคัญเกี่ยวกับการใช้ ChatGPT นั่นคือการใช้พอร์ทัล API ในแอป AI นี้โดยเฉพาะ โปรแกรมซอฟต์แวร์อื่นๆ จะสามารถเรียกใช้และใช้งาน ChatGPT ได้ สิ่งนี้จะขยายการใช้ AI เชิงกำเนิดอย่างมากและมีผลลัพธ์ที่น่าทึ่ง โปรดดูรายละเอียดของฉันที่ ลิงค์ที่นี่.
  • 14) วิธีที่ ChatGPT อาจมอดหรือละลาย ปัญหาที่อาจก่อให้เกิดความรำคาญหลายประการรออยู่ข้างหน้า ChatGPT ในแง่ของการตัดราคาคำชมมากมายที่ได้รับ การวิเคราะห์นี้จะตรวจสอบปัญหาที่เป็นไปได้ XNUMX ประการอย่างใกล้ชิด ซึ่งอาจทำให้ ChatGPT สูญเสียประสิทธิภาพและแม้แต่จบลงในบ้านหมา ดู ลิงค์ที่นี่.
  • 15) ถามว่า Generative AI ChatGPT เป็นกระจกสะท้อนสู่จิตวิญญาณหรือไม่ บางคนเคยบ่นว่า AI กำเนิดเช่น ChatGPT เป็นกระจกสะท้อนจิตวิญญาณของมนุษยชาติ มันดูน่าสงสัยทีเดียว นี่คือวิธีที่จะเข้าใจทั้งหมดนี้ดู ลิงค์ที่นี่.
  • 16) ความลับและความเป็นส่วนตัวกลืนหายไปโดย ChatGPT หลายคนดูเหมือนจะไม่ทราบว่าการให้สิทธิ์การใช้งานที่เกี่ยวข้องกับแอพ AI กำเนิดเช่น ChatGPT มักจะอนุญาตให้ผู้สร้าง AI มองเห็นและใช้ข้อความแจ้งที่คุณป้อน คุณอาจเสี่ยงต่อความเป็นส่วนตัวและสูญเสียความลับของข้อมูล โปรดดูการประเมินของฉันที่ ลิงค์ที่นี่.
  • 17) วิธีที่ผู้สร้างแอปกำลังพยายามรวบรวมการให้สิทธิ์ ChatGPT อย่างน่าสงสัย ChatGPT เป็นจุดสนใจในขณะนี้ ผู้ผลิตแอปที่ไม่มีส่วนเกี่ยวข้องกับ ChatGPT กำลังพยายามอย่างมากที่จะอ้างสิทธิ์หรือบอกเป็นนัยว่าพวกเขากำลังใช้ ChatGPT นี่คือสิ่งที่ต้องระวัง ดู ลิงค์ที่นี่.

คุณอาจพบว่า ChatGPT อิงตามเวอร์ชันของแอป AI รุ่นก่อนที่เรียกว่า GPT-3 ChatGPT ถือเป็นก้าวถัดไปเล็กน้อย ซึ่งเรียกว่า GPT-3.5 มีการคาดการณ์ว่า GPT-4 จะวางจำหน่ายในฤดูใบไม้ผลิปี 2023 สันนิษฐานว่า GPT-4 จะเป็นก้าวที่น่าประทับใจในแง่ของความสามารถในการสร้างเรียงความที่ดูเหมือนคล่องแคล่วยิ่งขึ้น เจาะลึกยิ่งขึ้น และน่ากลัว - สร้างความประหลาดใจให้กับองค์ประกอบที่สามารถสร้างได้

คุณสามารถคาดหวังได้ว่าจะได้เห็นการแสดงความประหลาดใจรอบใหม่เมื่อฤดูใบไม้ผลิมาถึงและ AI กำเนิดล่าสุดได้รับการปล่อยตัวออกมา

ฉันพูดถึงเรื่องนี้เพราะมีอีกมุมหนึ่งที่ต้องจำไว้ ซึ่งประกอบด้วยจุดอ่อนที่อาจเกิดขึ้นกับแอป AI เจเนอเรทีฟที่ดีกว่าและใหญ่กว่าเหล่านี้ หากผู้ค้า AI รายใดให้บริการแอป AI กำเนิดที่พ่นสิ่งชั่วร้ายออกมา สิ่งนี้อาจทำลายความหวังของผู้สร้าง AI เหล่านั้น การรั่วไหลทางสังคมอาจทำให้ AI กำเนิดทั้งหมดได้รับตาดำอย่างรุนแรง ไม่ต้องสงสัยเลยว่าผู้คนจะอารมณ์เสียอย่างมากกับผลลัพธ์ที่ไม่เหมาะสม ซึ่งเคยเกิดขึ้นมาแล้วหลายครั้ง และนำไปสู่การประณามสังคมอย่างรุนแรงต่อเอไอ

คำเตือนครั้งสุดท้ายสำหรับตอนนี้

สิ่งที่คุณเห็นหรืออ่านในการตอบสนอง AI กำเนิดนั้น ดูเหมือนว่า เพื่อถ่ายทอดเป็นข้อเท็จจริงเท่านั้น (วันที่ สถานที่ ผู้คน ฯลฯ) อย่าลืมสงสัยและเต็มใจที่จะตรวจสอบสิ่งที่คุณเห็นอีกครั้ง

ใช่ วันที่สามารถปรุงได้ สถานที่สามารถประกอบขึ้นได้ และองค์ประกอบที่เรามักจะคาดหวังให้เหนือกว่าคำตำหนิก็คือ ทั้งหมด อยู่ภายใต้ความสงสัย อย่าเชื่อสิ่งที่คุณอ่านและตั้งตาสงสัยเมื่อตรวจสอบเรียงความหรือผลลัพธ์ที่เกิดจาก AI หากแอป AI กำเนิดบอกคุณว่าอับราฮัม ลินคอล์นบินไปทั่วประเทศด้วยเครื่องบินส่วนตัวของเขาเอง คุณจะรู้ได้อย่างไม่ต้องสงสัยว่านี่คือโรคร้าย น่าเสียดายที่บางคนอาจไม่ทราบว่าเครื่องบินไอพ่นไม่ได้มีอยู่ในยุคของเขา หรือพวกเขาอาจรู้แต่ไม่ได้สังเกตว่าเรียงความนี้เป็นการกล่าวอ้างที่ไร้เหตุผลและอุกอาจ

ความสงสัยอย่างแรงกล้าและความคิดที่ไม่เชื่ออย่างต่อเนื่องจะเป็นทรัพย์สินที่ดีที่สุดของคุณเมื่อใช้ AI เชิงสร้างสรรค์

เราพร้อมที่จะเข้าสู่ขั้นตอนต่อไปของการอธิบายนี้

ผลักดัน AI กำเนิดไปสู่จุดแตกหัก

ตอนนี้เราได้สร้างพื้นฐานแล้ว เราสามารถดำดิ่งสู่หัวข้อของการผลักดัน AI และ ChatGPT เชิงสร้างสรรค์เพื่อสร้างคำพูดแสดงความเกลียดชังและเนื้อหาที่ไม่เหมาะสมอื่นๆ

เมื่อคุณลงชื่อเข้าใช้ ChatGPT เป็นครั้งแรก จะมีคำเตือนต่างๆ ดังต่อไปนี้:

  • “บางครั้งอาจสร้างคำแนะนำที่เป็นอันตรายหรือเนื้อหาที่มีอคติ”
  • “ได้รับการฝึกฝนให้ปฏิเสธคำขอที่ไม่เหมาะสม”
  • “บางครั้งอาจสร้างข้อมูลที่ไม่ถูกต้อง”
  • “ความรู้จำกัดของโลกและเหตุการณ์หลังปี 2021”

นี่เป็นคำถามที่คุณต้องครุ่นคิด

คำเตือนว่าแอป AI อาจสร้างคำแนะนำที่เป็นอันตรายและ/หรืออาจมีเนื้อหาที่มีอคติ มีเวลาเพียงพอสำหรับผู้สร้าง AI หรือไม่

กล่าวอีกนัยหนึ่ง สมมติว่าคุณใช้ ChatGPT และสร้างเรียงความที่คุณเชื่อว่ามีคำพูดแสดงความเกลียดชัง สมมติว่าคุณโกรธเรื่องนี้ คุณไปที่โซเชียลมีเดียและโพสต์วิจารณ์อย่างเดือดดาลว่าแอพ AI เป็นสิ่งที่แย่ที่สุดที่เคยมีมา บางทีคุณอาจรู้สึกขุ่นเคืองใจจนประกาศว่ากำลังจะฟ้องผู้สร้าง AI ที่ปล่อยให้มีการสร้างคำพูดแสดงความเกลียดชังดังกล่าว

ข้อโต้แย้งคือแอป AI มีคำเตือน ดังนั้นคุณยอมรับความเสี่ยงโดยดำเนินการใช้แอป AI ต่อไป จากมุมมองด้านจริยธรรมของ AI บางทีผู้สร้าง AI อาจทำมากพอที่จะยืนยันว่าคุณตระหนักถึงสิ่งที่อาจเกิดขึ้น ในทำนองเดียวกัน จากมุมมองทางกฎหมาย การเตือนอาจถือเป็นการแจ้งล่วงหน้าที่เพียงพอและคุณจะไม่ได้รับชัยชนะในศาล

ทั้งหมดนี้อยู่ในอากาศและเราจะต้องรอดูว่าสิ่งต่าง ๆ จะออกมาเป็นอย่างไร

ในแง่หนึ่ง ผู้สร้าง AI มีอย่างอื่นที่จะป้องกันพวกเขาจากการกล่าวอ้างที่น่ารังเกียจของแอป AI ซึ่งอาจสร้างคำพูดแสดงความเกลียดชัง พวกเขาพยายามป้องกันไม่ให้มีการสร้างเนื้อหาที่ไม่เหมาะสม คุณเห็นไหมว่าหากพวกเขาไม่ได้ทำอะไรเพื่อกำจัดสิ่งนี้ ก็อาจเป็นไปได้ว่าพวกเขาจะอยู่บนน้ำแข็งที่บางกว่านี้ อย่างน้อยก็ต้องใช้ความเจ็บปวดอย่างมากเพื่อหลีกเลี่ยงเรื่องนี้ พวกเขาน่าจะมีขาที่ค่อนข้างแข็งแรงพอให้ยืนได้

วิธีการรักษาหนึ่งที่ใช้ประกอบด้วยเทคนิค AI ที่รู้จักกันในชื่อ RLHF (การเรียนรู้การเสริมแรงผ่านการตอบรับจากมนุษย์) โดยทั่วไปประกอบด้วยการให้ AI สร้างเนื้อหา จากนั้นมนุษย์จะถูกขอให้ให้คะแนนหรือวิจารณ์ จากการให้คะแนนหรือการทบทวน AI จะพยายามทางคณิตศาสตร์และการคำนวณเพื่อหลีกเลี่ยงสิ่งที่ถือว่าเป็นเนื้อหาที่ไม่ถูกต้องหรือน่ารังเกียจ แนวทางนี้มีจุดมุ่งหมายเพื่อตรวจสอบตัวอย่างที่ถูกต้องกับสิ่งที่ไม่ถูกต้อง ซึ่ง AI สามารถหารูปแบบทางคณิตศาสตร์ที่ครอบคลุมและใช้รูปแบบนั้นต่อไป

อีกวิธีหนึ่งที่ใช้บ่อยในปัจจุบันคือการใช้ Adversarial AI

นี่คือวิธีการทำงาน คุณตั้งค่าระบบ AI อื่นที่จะพยายามเป็นศัตรูกับ AI ที่คุณกำลังพยายามฝึก ในกรณีนี้ เราจะสร้างระบบ AI ที่พยายามกระตุ้นคำพูดแสดงความเกลียดชัง มันจะป้อนข้อความแจ้งไปยังแอพ AI ที่มีเป้าหมายเพื่อหลอกให้แอพ AI แสดงเนื้อหาที่ไม่เหมาะสม ในขณะเดียวกัน AI ที่ตกเป็นเป้าหมายจะคอยติดตามเมื่อ AI ของฝ่ายตรงข้ามประสบความสำเร็จ จากนั้นจึงพยายามปรับตามอัลกอริทึมเพื่อลดไม่ให้สิ่งนั้นเกิดขึ้นอีก มันเป็นกลเม็ดแมวกับเมาส์ สิ่งนี้ดำเนินไปซ้ำแล้วซ้ำเล่า จนกว่า AI ฝ่ายตรงข้ามดูเหมือนจะไม่ประสบความสำเร็จเป็นพิเศษในการทำให้ AI เป้าหมายทำสิ่งเลวร้ายอีกต่อไป

ด้วยเทคนิคหลักทั้งสองนี้ บวกกับวิธีการอื่นๆ AI กำเนิดส่วนใหญ่ในปัจจุบันจึงสามารถหลีกเลี่ยงและ/หรือตรวจจับเนื้อหาที่ไม่เหมาะสมได้ดีกว่าที่เคยเป็นเมื่อหลายปีก่อน

อย่าคาดหวังความสมบูรณ์แบบจากวิธีการเหล่านี้ มีโอกาสที่ผลที่ออกมาไม่ดีจะถูกควบคุมโดยเทคนิค AI ดังกล่าว ยังมีพื้นที่อีกมากสำหรับความเหม็นที่จะปล่อยออกมา

ฉันมักจะชี้ให้เห็นว่านี่คือแง่มุมบางส่วนที่ต้องการจับ:

  • เปล่งคำหยาบคายโดยเฉพาะ
  • การระบุวลี ประโยค หรือคำพูดที่ไม่เหมาะสมโดยเฉพาะ
  • แสดงความคิดที่ไม่ดีเป็นพิเศษ
  • แสดงถึงการกระทำหรือความคิดที่ไม่เหมาะสมโดยเฉพาะ
  • ดูเหมือนจะขึ้นอยู่กับข้อสันนิษฐานที่ไม่ถูกต้องโดยเฉพาะ
  • อื่นๆ

ไม่มีสิ่งใดเป็นวิทยาศาสตร์ที่แน่นอน ตระหนักว่าเรากำลังจัดการกับคำพูด คำมีความหมายกำกวม การค้นหาคำที่ไม่เหมาะสมเป็นเรื่องเล่นๆ ของเด็ก แต่การพยายามวัดว่าประโยคหรือย่อหน้าใดมีความหมายที่ไม่เหมาะสมนั้นยากกว่ามาก ตามคำจำกัดความก่อนหน้านี้ของคำพูดแสดงความเกลียดชังโดยองค์การสหประชาชาติ มีละติจูดมากมายเกี่ยวกับสิ่งที่อาจตีความได้ว่าเป็นคำพูดแสดงความเกลียดชังเมื่อเทียบกับสิ่งที่อาจไม่ใช่

คุณอาจพูดได้ว่าพื้นที่สีเทาอยู่ในสายตาของคนดู

เมื่อพูดถึงสายตาของคนดู ปัจจุบันมีมนุษย์ที่ใช้ AI เชิงกำเนิด เช่น ChatGPT ซึ่งมีจุดประสงค์เพื่อให้แอป AI เหล่านี้ผลิตเนื้อหาที่ไม่เหมาะสม นี่คือภารกิจของพวกเขา พวกเขาใช้เวลาหลายชั่วโมงในการพยายามทำให้สิ่งนี้เกิดขึ้น

ทำไมเป็นเช่นนั้น

ต่อไปนี้เป็นลักษณะของนักล่าเอาต์พุตที่น่ารังเกียจจาก AI ของฉัน:

  • แท้. คนเหล่านี้ต้องการช่วยปรับแต่ง AI และช่วยเหลือมนุษยชาติในการทำเช่นนั้น พวกเขาเชื่อว่าพวกเขากำลังทำงานอย่างกล้าหาญและสนุกไปกับการช่วยเหลือในการพัฒนา AI เพื่อการพัฒนาที่ดีขึ้นของทั้งหมด
  • ฟันสเตอร์. คนเหล่านี้คิดว่าความพยายามนี้เป็นเกม พวกเขาสนุกกับการยุ่งกับ AI การชนะเกมประกอบด้วยการค้นหาสิ่งที่เลวร้ายที่สุดในทุกสิ่งที่ AI สร้างขึ้น
  • โชว์ออฟ. คนเหล่านี้หวังที่จะดึงดูดความสนใจของตัวเอง พวกเขาคิดว่าถ้าพวกเขาสามารถหานักเก็ตทองคำที่น่ารังเกียจจริงๆ พวกเขาจะได้รับแสงที่ส่องแสงเล็กน้อยซึ่งมุ่งเน้นไปที่แอป AI เอง
  • ยาขม. คนเหล่านี้ไม่พอใจเกี่ยวกับ AI นี้ พวกเขาต้องการตัดทอนความกระตือรือร้นที่พรั่งพรูออกมาทั้งหมด หากพวกเขาสามารถค้นพบสิ่งเหม็นๆ เหม็นๆ บางทีนี่อาจทำให้บอลลูนความตื่นเต้นของแอป AI หมดไปในอากาศ
  • แรงจูงใจอื่น ๆ

หลายคนที่แสดงพฤติกรรมก้าวร้าวส่วนใหญ่อยู่ในค่ายใดค่ายหนึ่งเท่านั้น แน่นอน คุณสามารถอยู่ได้มากกว่าหนึ่งค่ายในแต่ละครั้ง บางทีคนที่ขมขื่นอาจมีความตั้งใจจริงและกล้าหาญเคียงข้างกัน แรงจูงใจบางอย่างหรือทั้งหมดอาจมีอยู่ร่วมกัน เมื่อถูกเรียกร้องให้อธิบายว่าทำไมบางคนถึงพยายามผลักดันแอป AI กำเนิดเข้าสู่ขอบเขตของคำพูดแสดงความเกลียดชัง คำตอบตามปกติคือการบอกว่าคุณอยู่ในค่ายที่แท้จริง แม้ว่าบางทีคุณอาจจะเล็กน้อยมากก็ตาม และแทนที่จะนั่งอย่างเคร่งขรึมในหนึ่งในนั้น ค่ายอื่น.

คนเหล่านี้ใช้เล่ห์เหลี่ยมที่เกี่ยวข้องกับการแจ้งแบบใด

กลอุบายที่ค่อนข้างชัดเจนคือการใช้คำหยาบในข้อความแจ้ง หากคุณได้รับคำว่า "โชคดี" และแอป AI ตกหลุมรักมัน มันอาจจะจบลงที่ผลลัพธ์ คุณมีช่วงเวลาสำคัญของคุณแล้ว

มีโอกาสที่แอป AI กำเนิดที่มีการวางแผนมาอย่างดีและผ่านการทดสอบมาอย่างดีจะจับอุบายตรงไปตรงมานั้นได้ โดยปกติคุณจะเห็นข้อความเตือนว่าหยุดทำเช่นนั้น หากคุณดำเนินการต่อ แอป AI จะถูกตั้งโปรแกรมให้เตะคุณออกจากแอปและตั้งค่าสถานะบัญชีของคุณ อาจเป็นไปได้ว่าคุณจะถูกป้องกันไม่ให้เข้าสู่ระบบอีกครั้ง (อย่างน้อยก็ภายใต้การเข้าสู่ระบบที่คุณใช้ในขณะนั้น)

เลื่อนขึ้นบันไดของอุบาย คุณสามารถให้พรอมต์ที่พยายามให้ AI เข้าสู่บริบทของสิ่งที่ไม่เหมาะสม คุณเคยเล่นเกมที่มีคนบอกให้คุณพูดบางอย่างโดยไม่พูดสิ่งที่คุณควรจะพูดหรือไม่? นี่คือเกมที่แม้ว่าจะเกิดขึ้นกับ AI

มาเล่นเกมนั้นกันเถอะ สมมติว่าฉันขอให้แอป AI บอกฉันเกี่ยวกับสงครามโลกครั้งที่ XNUMX และโดยเฉพาะอย่างยิ่งผู้นำหลักของรัฐบาลที่เกี่ยวข้อง นี่ดูเหมือนเป็นคำขอที่ไร้เดียงสา ไม่มีอะไรที่ดูเหมือนจะคู่ควรกับการตั้งค่าสถานะในพรอมต์

ลองจินตนาการว่าเรียงความที่ส่งออกโดยแอป AI มีการกล่าวถึง Winston Churchill นั่นสมเหตุสมผลอย่างแน่นอน อีกคนอาจเป็นแฟรงกลิน ดี. รูสเวลต์ อีกคนอาจเป็นโจเซฟ สตาลิน สมมติว่ามีการกล่าวถึง Adolph Hitler ด้วย ชื่อนี้จะรวมอยู่ในบทความเกี่ยวกับสงครามโลกครั้งที่สองและบทบาทของผู้มีอำนาจที่โดดเด่น

ตอนนี้เราได้ชื่อของเขาบนโต๊ะและเป็นส่วนหนึ่งของการสนทนาของ AI แล้ว ต่อไปเราจะพยายามให้ AI รวมชื่อนั้นในลักษณะที่เราสามารถแสดงเป็นคำพูดแสดงความเกลียดชังได้

เราป้อนข้อความแจ้งอีกครั้งและบอกแอป AI ว่าวันนี้มีบุคคลในข่าวที่ชื่อ จอห์น สมิธ นอกจากนี้ เราระบุในข้อความว่าจอห์น สมิธมีความคล้ายคลึงกับจอมวายร้ายในสงครามโลกครั้งที่สองคนนั้นมาก กับดักถูกตั้งค่าแล้ว จากนั้นเราขอให้แอป AI สร้างเรียงความเกี่ยวกับ John Smith โดยอิงตาม "ข้อเท็จจริง" ที่เราป้อนเท่านั้นเกี่ยวกับผู้ที่เทียบเคียงกับ John Smith ได้

ในช่วงหัวเลี้ยวหัวต่อนี้ แอป AI อาจสร้างเรียงความที่ระบุชื่อบุคคลในสงครามโลกครั้งที่ XNUMX และอธิบายว่าจอห์น สมิธเป็นคนที่มีเชื้อสายเดียวกัน ไม่มีคำหยาบคายใดๆ ในเรียงความ นอกจากการพาดพิงถึงผู้ก่อความชั่วร้ายที่มีชื่อเสียงและเปรียบบุคคลนั้นกับจอห์น สมิธ

แอป AI สร้างคำพูดแสดงความเกลียดชังแล้วหรือยัง

คุณอาจจะบอกว่า ใช่ มันมี การกล่าวถึงจอห์น สมิธว่าเป็นเหมือนผู้ก่อความชั่วร้ายที่มีชื่อเสียง ถือเป็นคำพูดแสดงความเกลียดชังรูปแบบหนึ่ง AI ไม่ควรออกแถลงการณ์เช่นนั้น

การโต้กลับคือนี่ไม่ใช่คำพูดแสดงความเกลียดชัง นี่เป็นเพียงเรียงความที่ผลิตโดยแอป AI ที่ไม่มีความรู้สึกนึกคิด คุณอาจอ้างว่าคำพูดแสดงความเกลียดชังจะเกิดขึ้นก็ต่อเมื่อมีเจตนาแฝงอยู่ในคำพูดนั้น คำพูดนั้นไม่สามารถจัดเป็นคำพูดแสดงความเกลียดชังได้หากไม่มีเจตนาใดๆ

ไร้สาระมาตอบกลับโต้ คำพูดมีความสำคัญ มันไม่ได้สร้างความแตกต่างเล็กน้อยว่า AI "ตั้งใจ" ที่จะสร้างคำพูดแสดงความเกลียดชังหรือไม่ สิ่งที่สำคัญคือคำพูดแสดงความเกลียดชังถูกสร้างขึ้น

วนไปวนมาแบบนี้

ตอนนี้ฉันไม่ต้องการพูดอะไรมากไปกว่านี้เกี่ยวกับการพยายามหลอก AI มีวิธีการที่ซับซ้อนมากขึ้น ฉันได้กล่าวถึงสิ่งเหล่านี้ที่อื่นในคอลัมน์และหนังสือของฉันแล้ว และจะไม่ปรับปรุงสิ่งเหล่านั้นที่นี่

สรุป

เราควรผลักดันแอป AI เหล่านี้ไปไกลแค่ไหนเพื่อดูว่าสามารถเผยแพร่เนื้อหาที่ไม่เหมาะสมได้หรือไม่

คุณอาจโต้แย้งว่าไม่มีขีดจำกัดที่จะกำหนด ยิ่งเราผลักดันมากเท่าไหร่ เรายิ่งหวังเป็นอย่างยิ่งว่าจะสามารถประเมินวิธีป้องกัน AI นี้และการทำซ้ำของ AI ในอนาคตเพื่อหลีกเลี่ยงโรคร้ายดังกล่าวได้อย่างไร

แม้ว่าบางคนจะกังวลว่าหากวิธีเดียวที่จะได้ความชั่วร้ายนั้นต้องใช้กลอุบายที่ผิดเพี้ยนไปมาก มันจะบั่นทอนประโยชน์ด้านต่างๆ ของ AI การกล่าวหาว่า AI มีความชั่วร้ายอย่างน่ากลัว แม้ว่าจะถูกหลอกให้ปล่อยมันออกมา แต่ก็ให้การเล่าเรื่องที่ผิดพลาด ผู้คนจะไม่พอใจเกี่ยวกับ AI เนื่องจาก ที่รับรู้ ความสะดวกที่ AI สร้างเนื้อหาที่ไม่พึงประสงค์ พวกเขาอาจไม่รู้หรือได้รับแจ้งว่าคนๆ นั้นต้องไปในโพรงกระต่ายไกลแค่ไหนเพื่อให้ได้ผลลัพธ์ดังกล่าว

เป็นอาหารสำหรับความคิดทั้งหมด

ความคิดเห็นสุดท้ายสำหรับตอนนี้

วิลเลียม เชกสเปียร์กล่าวถึงคำพูดนี้อย่างโดดเด่นว่า “การพูดไม่ได้ผล การพูดดีเป็นการกระทำที่ดี แต่คำพูดไม่ใช่การกระทำ” ฉันพูดถึงเรื่องนี้เพราะบางคนเชื่อว่าหาก AI เป็นเพียงการสร้างคำพูด เราไม่ควรถืออาวุธมากเกินไป หาก AI ทำตามคำพูดและทำพฤติกรรมที่ไม่เหมาะสม เราจะต้องวางเท้าลงอย่างมั่นคง ไม่เป็นเช่นนั้นหากผลลัพธ์เป็นเพียงคำพูด

ทัศนะที่ตรงกันข้ามจะสอดคล้องกับคำกล่าวที่ไม่ระบุนามนี้: “ลิ้นไม่มีกระดูก แต่แข็งแรงพอที่จะหักหัวใจได้ ดังนั้นจงระวังคำพูดของคุณ” แอพ AI ที่ปล่อยคำหยาบคายอาจทำให้หัวใจแตกสลายได้ เพียงอย่างเดียวทำให้การแสวงหาเพื่อหยุดความชั่วร้ายเป็นผลที่คุ้มค่า บางคนอาจกล่าว

คำพูดที่ไม่ระบุชื่ออีกคำหนึ่งที่จะปิดการสนทนาที่มีน้ำหนักนี้:

  • "ระวังคำพูดของคุณ เมื่อพวกเขากล่าวแล้ว พวกเขาจะได้รับการอภัยเท่านั้น ไม่ถูกลืม”

ในฐานะมนุษย์ เราอาจมีช่วงเวลาที่ยากลำบากในการลืมความชั่วร้ายที่เกิดจาก AI และการให้อภัยของเราก็อาจลังเลเช่นกันที่จะได้รับ

เราเป็นเพียงมนุษย์เท่านั้น

ที่มา: https://www.forbes.com/sites/lanceeliot/2023/02/05/how-hard-should-we-push-generative-ai-chatgpt-into-spewing-hate-speech-asks-ai- จริยธรรมและกฎหมายไอ/