MacWhisper เป็นซอฟต์แวร์ถอดความฟรีที่ฉันรอคอย

คุณกำลังมองหาซอฟต์แวร์ Mac เพื่อแปลงไฟล์เสียงเป็นไฟล์ข้อความที่เขียนหรือไม่? มีเครื่องมือแบบเสียเงินมากมาย เช่น Otter.ai และ Trint ที่อาจเสียเงินจริงเมื่อคุณเริ่มใช้มากเกินไป แต่ แมควิสเปอร์ เป็นโซลูชั่นฟรีที่อินเทอร์เน็ตรอคอย หรืออย่างน้อยคนที่ฉันรอคอย

OpenAI เปิดตัวโปรแกรมฟรีที่ทรงพลังอย่างเหลือเชื่อในเดือนกันยายน 2022 ซึ่งช่วยให้ผู้ที่มีความชำนาญด้านเทคโนโลยีสามารถแปลงไฟล์เสียงและวิดีโอเป็นข้อความถอดเสียงที่แม่นยำอย่างไม่น่าเชื่อ ปัญหาคือผู้ใช้ทั่วไปไม่สามารถเข้าถึงได้เนื่องจากคุณจำเป็นต้องคุ้นเคยกับการใช้คำสั่งในแอป Terminal

แต่ด้วย MacWhisper ซึ่งถูกพบเป็นครั้งแรก 9to5Macในที่สุดก็มีคนพัฒนา GUI หรือส่วนต่อประสานกราฟิกกับผู้ใช้ ซึ่งสร้างขึ้นจาก Whisper ของ OpenAI และปล่อยให้เทคโนโลยีที่น่าสับสนทั้งหมดอยู่ภายใต้ประทุน ให้คุณเพียงแค่ลากและวางไฟล์เสียงของคุณและรับการถอดเสียงอย่างรวดเร็ว และ MacWhisper ก็มีความแม่นยำอย่างมาก เพราะ Whisper ของ OpenAI ได้รับการฝึกฝนมา ชั่วโมง 680,000 ของข้อมูลเสียงบนเว็บ

ข้อดีอย่างหนึ่งเกี่ยวกับ MacWhisper คือคุณไม่ได้อัปโหลดไฟล์เสียงหรือวิดีโอที่คุณต้องการคัดลอกไปยังอินเทอร์เน็ต นั่นเป็นสิ่งสำคัญสำหรับนักข่าวที่อาจทำงานเกี่ยวกับเรื่องราวที่ละเอียดอ่อน หรือใครก็ตามที่มักไม่ค่อยระมัดระวังในการอัปโหลดไฟล์ส่วนตัวไปยังระบบคลาวด์ ไฟล์จะอยู่บนเดสก์ท็อปของคุณ หมายความว่าไม่มีโอกาสที่ใครจะสามารถดักฟังเสียงของคุณได้

อีกครั้ง MacWhisper เป็นเพียงส่วนต่อประสานผู้ใช้ใหม่สำหรับโปรแกรมฟรีที่เปิดตัวโดย OpenAI เมื่อปลายปีที่แล้ว แต่มันจะทำให้การถอดเสียงเป็นเรื่องง่ายสำหรับทุกคน เพราะฉันใช้ Whisper และพบว่ามันมีประโยชน์อย่างมากตั้งแต่เปิดตัว และถึงแม้ตอนนี้ฉันจะใช้ MacWhsiper เพราะมันจะทำให้เวิร์กโฟลว์ของฉันเร็วขึ้นอย่างแน่นอน

เป็นเพียงตัวอย่างหนึ่ง หลังจากข่าวการล่มสลายของบริษัทคริปโต FTX ฉันใช้ Whisper เพื่อคัดลอกบทสัมภาษณ์ YouTube เก่าหลายสิบชั่วโมงกับผู้ก่อตั้งบริษัท Sam Bankman-Fried จากที่นั่น ฉันสามารถค้นหาข้อความถอดเสียงและพบแนวคิดแปลก ๆ และน่าสนใจสำหรับบทความที่จะเขียน เช่น เมื่อ SBF กล่าวในเดือนมิถุนายน 2021 ว่า blockchain จะแก้ไข Enron. การเปรียบเทียบระหว่าง SBF กับ Enron เป็นเรื่องบังเอิญที่แปลกประหลาด เนื่องจากทุกสิ่งที่เรารู้ในตอนนี้เกี่ยวกับการที่ FTX ล่มสลาย แต่ฉันจะไม่มีวันพบช่วงเวลานั้นในการสัมภาษณ์เก่าๆ ที่คลุมเครือ โดยไม่ต้องมีบทถอดเสียงมากมายที่ฉันสามารถค้นหาได้ และกระบวนการนั้น แม้จะง่ายกว่าการฟังเทปเป็นชั่วโมงๆ แต่ก็ยังคงยุ่งยากและไม่เป็นอัตโนมัติมากนัก

หลังจากติดตั้ง Whisper ลงในเครื่องแล้ว ฉันเคยพิมพ์ “whisper audiofilename.mp3 —model tiny.en” ลงในแอป Terminal ของ Mac ทุกครั้งที่ต้องการถอดเสียงไฟล์ ด้วย WhisperMac ฉันสามารถลากและวางไฟล์เสียงของฉันได้ และมันก็ทำได้อย่างมหัศจรรย์โดยไม่ต้องพิมพ์อะไรเพิ่มเติม

ฉันทดสอบ MacWhisper ด้วยตอนหนึ่งของ NBC Nightly News ที่ฉันดาวน์โหลดจาก YouTube และนอกเหนือจากข้อผิดพลาดเล็กน้อย เช่น การตีความคำว่า "windchills" เป็น "windshills" และการได้ยิน Lester Holt เป็น "Lester Hold" การถอดเสียงก็แม่นยำมาก MacWhisper เป็นซอฟต์แวร์ฟรี แต่มีระดับซอฟต์แวร์ที่ต้องชำระเงินซึ่งอาจแม่นยำกว่าเล็กน้อยเนื่องจากใช้โมเดลการฝึกอบรมที่เข้มข้นกว่าของ OpenAI แต่เวอร์ชันฟรีจะใช้งานได้ดีสำหรับคนส่วนใหญ่

MacWhisper ช่วยให้คุณสามารถส่งออกคำที่ถอดความในรูปแบบที่แตกต่างกันไม่กี่รูปแบบ รวมถึงข้อความล้วน, CSV หรือแม้แต่รูปแบบไฟล์คำบรรยาย เช่น SRT และ VTT

และ MacWhisper ไม่ได้มีไว้สำหรับภาษาอังกฤษเท่านั้น คุณสามารถถอดเสียงในภาษาต่างๆ ได้ถึง 100 ภาษา ซึ่งสะดวกมาก ฟีเจอร์เดียวที่ MacWhisper ไม่มี ซึ่งฉันสนุกกับการเล่นกับ Whisper ในแอพ Terminal คือการแปลภาษา ฉันได้แปลไวรัลวิดีโอเป็นภาษารัสเซียและจีน และได้รับการบอกกล่าวจากผู้ที่พูดภาษาดังกล่าวบน Twitter ว่าการแปลนั้น ถูกต้อง.

คุณสมบัติอื่น ๆ ที่ MacWhisper ไม่มีแม้ว่าจะไม่สามารถใช้งานได้จาก Whisper ของ OpenAI ก็คือความสามารถในการแยกความแตกต่างของลำโพง ตัวอย่างเช่น หากคุณกำลังถ่ายทอดบทสัมภาษณ์ของผู้พูดสองคน จะไม่มีเครื่องหมายที่ชัดเจนเมื่อผู้พูดคนหนึ่งหยุดและผู้พูดอีกคนเริ่ม แต่ฉันสงสัยว่าใครบางคนจะสร้างความสามารถนั้นในที่สุด บริการแบบชำระเงินอย่าง Trint จะทำสิ่งนี้โดยอัตโนมัติ และในที่สุดมันก็ดีที่จะให้บริการฟรี แต่คุณจะได้ในสิ่งที่คุณจ่ายไป

นอกจากนี้ยังมีคุณลักษณะของ MacWhisper ที่คุณสามารถแปลงเสียงพูดจากไมโครโฟนของคอมพิวเตอร์เป็นข้อความได้ ซึ่งอาจมีประโยชน์หากคุณต้องการถอดเสียงบางอย่างในทันที

ฉันใช้เวลาหลายเดือนในการสงสัยว่าเมื่อไหร่จะมีใครพัฒนา GUI สำหรับ Whisper เนื่องจากมีคนไม่กี่คนที่ลองใช้งาน แต่ไม่ได้สร้างสิ่งที่เป็นมิตรกับผู้ใช้มากนัก แต่ MacWhisper ซึ่งพัฒนาโดย Jordi Bruin เป็นซอฟต์แวร์ที่ฉันรอคอย Bruin ยังได้พัฒนาซอฟต์แวร์เช่น แมคจีพีทีซึ่งอนุญาตให้ผู้ใช้เข้าถึง ChatGPT จากแถบเมนู

คุณสามารถดาวน์โหลด MacWhisper ฟรีด้วยการลงทะเบียนอีเมลที่เว็บไซต์ของ Bruin

ที่มา: https://www.forbes.com/sites/mattnovak/2023/02/04/macwhisper-is-the-free-transcription-software-ive-been-waiting-for/