กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see


News

ข่าว JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด

  • ผู้เริ่มหัวข้อ ผู้เริ่มหัวข้อ News 
  • วันที่เริ่มต้น วันที่เริ่มต้น

News 

Moderator

สมาชิกทีมงาน
Moderator
Verify member
เข้าร่วม
1 มิถุนายน 2011
ข้อความ
15,311
คะแนนปฏิกิริยา
0
คะแนน
36
JetBrains ประกาศโอเพนซอร์ส Mellum โมเดลช่วยเติมโค้ดที่เปิดตัวในปี 2024 และใช้กับ IDE ในตระกูล JetBrains โดยมีจุดเด่นเรื่องความเร็วกว่าการใช้โมเดลภาษา LLM ตัวใหญ่

JetBrains เรียก Mellum ว่าเป็น "focal model" สร้างมาเพื่อเขียนโค้ดโดยเฉพาะ ไม่ใช่โมเดลภาษา LLM ที่ปรับมาใช้เขียนโค้ด และแผนการของบริษัทคือการสร้างโมเดล Mellum หลายๆ ตัวที่ทำงานเฉพาะทางต่างกันไป เช่น ช่วยเติมโค้ด (code completion) หรือช่วยพยากรณ์ diff ของโค้ดแต่ละเวอร์ชัน

ตัวโมเดลหลักมีขนาดพารามิเตอร์ 4B และทำผลงานการเติมโค้ดได้ดีใกล้เคียงกับโมเดลที่ขนาดพารามิเตอร์ใหญ่กว่า ตอนนี้ Mellum รองรับการเติมโค้ดภาษา Java, Kotlin, Python, Go, PHP, C, C++, C#, JavaScript, TypeScript, CSS, HTML, Rust, Ruby

ส่วนเหตุผลที่ตัดสินใจโอเพนซอร์ส JetBrains บอกว่าเชื่อในความโปร่งใส และมองว่าการโอเพนซอร์สจะเปิดให้เกิดความร่วมมือกันพัฒนาซอฟต์แวร์ต่อไป ตอนนี้โค้ดอยู่บน Hugging Face แล้ว สามารถนำมาใช้งานได้ทั้งบนคลาวด์ (ผ่าน vLLM) และรันแบบโลคัล (ผ่าน llama.cpp หรือ Ollama) แต่ JetBrains ก็ใส่หมายเหตุไว้ว่า Mellum อาจไม่เหมาะกับนักพัฒนาซอฟต์แวร์ทั่วๆ ไปนำไปใช้งานโดยตรง แต่เหมาะกับนักวิจัยสาย AI/ML นำไปศึกษาหรือต่อยอดมากกว่า

ที่มา - JetBrains

JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด-1.jpg


JetBrains โอเพนซอร์ส Mellum โมเดลขนาดเล็กเน้นงานเฉพาะทาง เชี่ยวชาญด้านเติมโค้ด-2.png


Topics:
JetBrains
Programming
Open Source
LLM

Continue reading...
 

กรุณาปิด โปรแกรมบล๊อกโฆษณา เพราะเราอยู่ได้ด้วยโฆษณาที่ท่านเห็น
Please close the adblock program. Because we can live with the ads you see
กลับ
ยอดนิยม