- เข้าร่วม
- 1 มิถุนายน 2011
- ข้อความ
- 15,229
- คะแนนปฏิกิริยา
- 0
- คะแนน
- 36
OpenAI ปล่อยโมเดลแปลงเสียงเป็นข้อความ
หลังจากปรับย่อลงแล้ว ทีมงานนำข้อมูลฝึกของโมเดล
แนวทางการพัฒนา
ตอนนี้
ที่มา - OpenAI/Whisper

Topics:
OpenAI
Artificial Intelligence
Continue reading...
whisper-large-v3-turbo ปรับย่อโมเดลโดยลดชั้น decoder ลงจาก 32 ชั้นเหลือ 8 ชั้น ทำให้พารามิเตอร์เดิม 1,550 ล้านพารามิเตอร์เหลือเพียง 809 ล้านพารามิเตอร์เท่านั้นหลังจากปรับย่อลงแล้ว ทีมงานนำข้อมูลฝึกของโมเดล
large-v3 เดิมมาฝึกซ้ำอีกสองรอบแล้ววัดประสิทธิภาพรวม พบว่าโมเดลกลับไปมีคุณภาพค่อนข้างดีใกล้เคียงกับโมเดลต้นทาง ยกเว้นภาษาไทยและกวางตุ้งเท่านั้นที่ประสิทธิภาพลดลงชัดเจน ในกรณีชุดข้อมูล Common Voice นั้นอัตราคำผิดภาษาไทยสูงขึ้นเกือบ 4 เท่าตัวแนวทางการพัฒนา
whisper-large-v3-turbo ปรับมาจากงานวิจัย Distil-Whisper ที่นำเอาท์พุตจากโมเดลขนาดใหญ่มาฝึกโมเดลขนาดเล็กกว่า แต่ทาง OpenAI อาศัยการฝึกด้วยข้อมูลเต็มแทนตอนนี้
whisper-large-v3-turbo เป็นโมเดลเริ่มต้นในแพ็กเกจ openai-whisper เวอร์ชั่นล่าสุด หากใครใช้งานภาษาไทยอาจจะต้องระวังปรับไปใช้โมเดลอื่นที่มา - OpenAI/Whisper
Topics:
OpenAI
Artificial Intelligence
Continue reading...