- เข้าร่วม
- 1 มิถุนายน 2011
- ข้อความ
- 15,229
- คะแนนปฏิกิริยา
- 0
- คะแนน
- 36
MyShell ผู้ให้บริการปัญญาประดิษฐ์สร้างตัวตนออนไลน์ ปล่อยโมเดล OpenVoice สำหรับการเลียนแบบเสียงพูดโดยอาศัยตัวอย่างเสียงไม่มากนัก
โมเดลปัญญาประดิษฐ์เลียนเสียงพูดมีงานวิจัยออกมาเรื่อยๆ จำนวนมาก OpenVoice ชูจุดเด่นว่าสามารถควบคุมน้ำเสียง, จังหวะพูด ได้ละเอียดกว่า ทำให้มีความเป็นไปได้ที่จะสร้างเสียงที่สมจริงขึ้น
โมเดลแยกออกเป็นสองส่วน คือการแปลงข้อความเป็นเสียงพูด จากนั้นค่อยแปลงเสียงที่ได้ให้น้ำเสียงเหมือนกันเสียงพูดของบุคคลเป้าหมายอีกที เรียกว่า Tone Color Converter
ตัวโมเดลพร้อมค่า weight เปิดให้ดาวน์โหลดไปใช้งานได้แต่จำกัดห้ามใช้งานเชิงการค้า และทาง MyShell ระบุว่าอาจจะมีแนวทางในการตรวจจับว่าเสียงสร้างขึ้นมาจากโมเดล OpenVoice อยู่
ที่มา - ArXiV, GitHub

Topics:
Artificial Intelligence
Text-to-Speech
อ่านต่อ...
โมเดลปัญญาประดิษฐ์เลียนเสียงพูดมีงานวิจัยออกมาเรื่อยๆ จำนวนมาก OpenVoice ชูจุดเด่นว่าสามารถควบคุมน้ำเสียง, จังหวะพูด ได้ละเอียดกว่า ทำให้มีความเป็นไปได้ที่จะสร้างเสียงที่สมจริงขึ้น
โมเดลแยกออกเป็นสองส่วน คือการแปลงข้อความเป็นเสียงพูด จากนั้นค่อยแปลงเสียงที่ได้ให้น้ำเสียงเหมือนกันเสียงพูดของบุคคลเป้าหมายอีกที เรียกว่า Tone Color Converter
ตัวโมเดลพร้อมค่า weight เปิดให้ดาวน์โหลดไปใช้งานได้แต่จำกัดห้ามใช้งานเชิงการค้า และทาง MyShell ระบุว่าอาจจะมีแนวทางในการตรวจจับว่าเสียงสร้างขึ้นมาจากโมเดล OpenVoice อยู่
ที่มา - ArXiV, GitHub
Topics:
Artificial Intelligence
Text-to-Speech
อ่านต่อ...
ไฟล์แนบ