กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว Alibaba Cloud เปิดโมเดล Qwen2.5 ฝึกด้วยข้อมูลขนาดใหญ่มาก รองรับภาษาไทย

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Moderator

สมาชิกทีมงาน
Moderator
Verify member
เข้าร่วม
1 มิถุนายน 2011
ข้อความ
15,229
คะแนนปฏิกิริยา
0
คะแนน
36
Alibaba Cloud เปิดตัวโมเดลปัญญาประดิษฐ์ Qwen เวอร์ชั่น 2.5 จุดเด่นของโมเดลเวอร์ชั่นนี้คือฝึกด้วยข้อมูลขนาดถึง 18 ล้านล้านโทเค็น รองรับ 29 ภาษารวมภาษาไทย โดยเปิดให้ใช้งานได้อิสระแทบทุกรุ่น

ตัวโมเดลรองรับอินพุต 128K token และตอบข้อมูลได้ 8K token ยกเว้นรุ่น 3B ลงไปจะรองรับอินพุต 32K token เท่านั้น

รุ่นใหญ่สุด Qwen2.5-72B ได้ผลทดสอบชนะ Llama3.1-70B แทบทุกการทดสอบขึ้นไปใกล้เคียง Llama3.1-405B แต่เวอร์ชั่น 72B แจกแบบ Qwen License ซึ่งจำกัดการใช้งานกับบริการที่ผู้ใช้เกิน 100 ล้านคนต่อเดือน

สำหรับโมเดลขนาดเล็กทีมงาน Qwen ชูจุดตัดว่าโมเดลใดได้คะแนน MMLU มากกว่า 65 คะแนนซึ่งโมเดลขนาดเล็กลงก็เก่งขึ้นเรื่อยๆ ในช่วงหลัง และ Qwen2.5-3B ก็เป็นโมเดลเล็กที่สุดที่ได้คะนนเกิน 65 แต่รุ่น 3B แจกเพื่อการวิจัยเท่านั้น

เวอร์ชั่นเฉพาะทาง Qwen2.5-Coder-7B ทำคะแนนชนะโมเดลขนาดใหญ่กว่าหลายตัวแทบทุกการทดอบ มีเพียงชุดทดสอบ BigCodeBench ที่แพ้ CodeStral-22B ไป

สามารถดาวน์โหลด Qwen2.5 มาใช้งานได้ทั้ง vllm และ ollama และทั้งสองแพลตฟอร์มยังใช้งานฟีเจอร์ tool calling ได้ด้วย

ที่มา - QwenLM

No Description


No Description


No Description


Topics:
Alibaba Cloud
LLM

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม