กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว SCB 10X เปิดตัวโมเดล Typhoon Isan เทรนมาเพื่อถอดเสียงภาษาอีสาน

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Moderator

สมาชิกทีมงาน
Moderator
Verify member
เข้าร่วม
1 มิถุนายน 2011
ข้อความ
15,228
คะแนนปฏิกิริยา
0
คะแนน
36
SCB 10X เปิดตัวโมเดล Typhoon Isan เทรนมาเพื่อถอดเสียงภาษาอีสาน
Body

SCB 10X เปิดตัวโมเดลภาษาตระกูล Typhoon Isan ที่ออกแบบมาเพื่อถอดเสียงพูดภาษาอีสานโดยเฉพาะ

Typhoon Isan ASR เป็นโมเดลถอดเสียงเป็นตัวอักษร (Automatic Speech Recognition) ที่พยายามแก้ปัญหาเรื่องภาษาถิ่นของประเทศไทย ซึ่งยังไม่มีการจัดเก็บข้อมูลในระบบดิจิทัลมากนัก เมื่อผู้พูดใช้ภาษาถิ่น โมเดลในปัจจุบันจึงถอดเสียงผิดเพี้ยน ทำให้ทีมพัฒนาของ SCB 10X เลือกภาษาอีสานที่มีคนพูด 20 ล้านคน คิดเป็น 1/3 ของประชากร มาเป็นภาษาแรก

ทีมพัฒนายังเตรียมออก Typhoon Isan TTS (Text-to-Speech) โมเดลแปลงข้อความเป็นเสียงพูดภาษาอีสาน และปล่อยชุดข้อมูลภาษาอีสานเป็นข้อมูลเปิด (open data) ต่อสาธารณะ

  • Isan Speech Transcription Convention แนวทางการถอดเสียงภาษาอีสานเป็นข้อความสำหรับการสร้างชุดข้อมูลเพื่องานด้านเทคโนโลยีทางเสียง
  • Isan Spelling Standard อักขรวิธีการสะกดคำภาษาอีสานด้วยอักษรไทย
  • Isan Speech Corpus ชุดข้อมูลเสียงพูดภาษาอีสานจากหลายจังหวัดในภาคตะวันออกเฉียงเหนือ
  • Isan Phonetic Dictionary พจนานุกรมคำอ่านที่เชื่อมโยงคำกับการออกเสียงในภาษาอีสาน

ที่มา - SCB 10X Typhoon


alt


mk Fri, 28/11/2025 - 21:38

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม