การใช้งานใหม่ กับ 17 โมเดลใหม่ใน Workers AI

Workers AI

การใช้งานใหม่ กับ 17 โมเดลใหม่ใน Workers AI

ปลดล็อกการใช้งานใหม่ ๆ กับ 17 โมเดลใหม่ใน Workers AI ครอบคลุมทั้งโมเดลภาษาขนาดใหญ่ โมเดลสร้างภาพ และอื่นๆ อีกมากมาย

เมื่อวันที่ 6 กุมภาพันธ์ 2024 ที่ผ่านมา เราได้ประกาศเปิดตัวโมเดลใหม่ 8 แบบ ในแค็ตตาล็อกของเราสำหรับการสร้างข้อความ การจัดประเภท และการสร้างโค้ด วันนี้ เราพร้อมแล้วกับโมเดลใหม่เพิ่มอีก 17 แบบ (ใช่! 17 แบบเลย!) มุ่งเน้นไปที่การเปิดใช้งานประเภทงานและกรณีการใช้งานใหม่ๆ ด้วย Workers AI ตอนนี้แค็ตตาล็อกของเรามีโมเดลเกือบ 40 แบบแล้ว ดังนั้น เราจึงตัดสินใจปรับปรุงเอกสารสำหรับนักพัฒนาใหม่ เพื่อให้ผู้ใช้สามารถค้นหาและค้นพบโมเดลใหม่ๆ ได้ง่ายขึ้น

การสร้างข้อความ

  • @cf/deepseek-ai/deepseek-math-7b-instruct
  • @cf/openchat/openchat-3.5-0106
  • @cf/microsoft/phi-2
  • @cf/tinyllama/tinyllama-1.1b-chat-v1.0
  • @cf/thebloke/discolm-german-7b-v1-awq
  • @cf/qwen/qwen1.5-0.5b-chat
  • @cf/qwen/qwen1.5-1.8b-chat
  • @cf/qwen/qwen1.5-7b-chat-awq
  • @cf/qwen/qwen1.5-14b-chat-awq
  • @cf/tiiuae/falcon-7b-instruct
  • @cf/defog/sqlcoder-7b-2

Summarization

  • @cf/facebook/bart-large-cnn

Text-to-image

  • @cf/lykon/dreamshaper-8-lcm
  • @cf/runwayml/stable-diffusion-v1-5-inpainting
  • @cf/runwayml/stable-diffusion-v1-5-img2img
  • @cf/bytedance/stable-diffusion-xl-lightning

Image-to-text

  • @cf/unum/uform-gen2-qwen-500m

โมเดลภาษาใหม่ การปรับแต่งอย่างละเอียด และการหาปริมาณ

การอัปเดตแค็ตตาล็อกวันนี้ ประกอบด้วยโมเดลภาษาใหม่จำนวนมาก เพื่อให้นักพัฒนาสามารถเลือก LLMs (Large Language Models) ที่ดีที่สุดสำหรับกรณีการใช้งานของตนเอง แม้ว่า LLM ส่วนใหญ่สามารถปรับให้ใช้งานได้ในทุกกรณี แต่การเลือกโมเดลที่ออกแบบมาสำหรับกรณีการใช้งานเฉพาะนั้นมีข้อดีหลายประการ เรามีความตื่นเต้นที่จะนำเสนอโมเดลภาษาขนาดใหญ่ (LLMs) โมเดลภาษาขนาดเล็ก (SLMs) และการรองรับหลายภาษา รวมถึงโมเดลที่ผ่านการปรับแต่งและทำให้เป็นปริมาณมาให้คุณ

การเพิ่ม LLM ล่าสุดของเรารวมถึง falcon-7b-instruct ซึ่งน่าตื่นเต้นอย่างยิ่งเนื่องจากการใช้ multi-query attention (ความสนใจหลายแบบสอบถาม) ที่สร้างสรรค์เพื่อสร้างการตอบสนองที่มีความแม่นยำสูง เรายังมีการรองรับภาษาที่ดีขึ้นด้วย discolm_german_7b และ qwen1.5 ซึ่งเป็นโมเดลที่ได้รับการฝึกฝนบนข้อมูลหลายภาษา และมีผลลัพธ์ LLM ที่น่าประทับใจไม่เพียงแต่ในภาษาอังกฤษเท่านั้น แต่ยังรวมถึงภาษาเยอรมัน (discolm) และภาษาจีน (qwen1.5) อีกด้วย โมเดล Qwen มีขนาดตั้งแต่ 0.5B ถึง 14B พารามิเตอร์ และได้แสดงความแม่นยำที่น่าประทับใจเป็นพิเศษในการทดสอบของเรา นอกจากนี้ เรายังปล่อย SLM ใหม่ออกมาอีกสองสามตัว ซึ่งกำลังได้รับความนิยมเพิ่มขึ้นเนื่องจากความสามารถในการทำการอนุมานได้เร็วขึ้นและราคาถูกลงโดยไม่ลดทอนความแม่นยำ สำหรับ SLM เรากำลังแนะนำโมเดลขนาดเล็กแต่มีประสิทธิภาพอย่าง Llama รุ่นพารามิเตอร์ 1.1B (tinyllama-1.1b-chat-v1.0) และโมเดลพารามิเตอร์ 1.3B จาก Microsoft (phi-2)

เนื่องจากอุตสาหกรรม AI ยังคงเติบโตอย่างรวดเร็ว บุคลากรที่มีความสามารถได้คิดค้นวิธีการปรับปรุงและเพิ่มประสิทธิภาพของโมเดล เราได้เพิ่มโมเดลที่ผ่านการปรับแต่ง (openchat-3.5) ซึ่งใช้เทคนิค Conditioned Reinforcement Learning Fine-Tuning (C-RLFT) เทคนิคนี้ช่วยให้สามารถพัฒนโมเดลภาษาแบบโอเพ่นซอร์สได้โดยใช้วิธีการรวบรวมข้อมูลคุณภาพผสมที่ง่ายดายเราตื่นเต้นอย่างยิ่งที่ได้นำเสนอโมเดลสร้างข้อความใหม่ทั้งหมดเหล่านี้บนแพลตฟอร์มของเราในวันนี้ ชุมชนโอเพ่นซอร์สมีบทบาทสำคัญในการพัฒนาเทคโนโลยี AI ใหม่ๆ เราขอขอบคุณทุกคนสำหรับการมีส่วนร่วมในการฝึกอบรม การปรับแต่ง และการทำให้เป็นปริมาณของโมเดลเหล่านี้ เรารู้สึกยินดีที่ได้โฮสต์โมเดลเหล่านี้และทำให้ทุกคนสามารถเข้าถึงได้ เพื่อให้นักพัฒนาสามารถสร้างแอปพลิเคชันใหม่ด้วย AI ได้อย่างรวดเร็วและง่ายดาย คุณสามารถดูโมเดลใหม่และสเปค API ของพวกเขาได้ที่เอกสารสำหรับนักพัฒนาของเรา

โมเดลการสร้างภาพใหม่

นอกเหนือจากโมเดลภาษาแล้ว เรายังเพิ่มไปป์ไลน์และการปรับแต่ง Stable Diffusion ใหม่ เพื่อเปิดใช้งานกรณีการใช้งานการแก้ไขและสร้างภาพอันทรงพลัง เราได้เพิ่มการรองรับ Stable Diffusion XL Lightning ซึ่งสร้างภาพคุณภาพสูงได้ในขั้นตอนการอนุมานเพียงสองขั้นตอน การแปลงข้อความเป็นภาพเป็นงานยอดนิยมสำหรับผู้ที่ต้องการนำข้อความป้อนเข้าไปและให้โมเดลสร้างภาพขึ้นมาจากข้อมูลป้อนนั้น แต่ Stable Diffusion จริงๆ แล้วยังทำได้มากกว่านั้นอีก ด้วยการเปิดตัว Workers AI ใหม่นี้ เราได้ปลดล็อคไปป์ไลน์ใหม่ เพื่อให้คุณสามารถทดลองใช้อินพุตและงานในรูปแบบต่างๆ กับ Stable Diffusion ได้

ตอนนี้คุณสามารถใช้ Stable Diffusion บน Workers AI สำหรับกรณีใช้การแปลงภาพเป็นภาพ (image-to-image) และการ inpainting (การเติม/ระบายสีลงในรูป) ได้แล้ว ฟีเจอร์ image-to-image ช่วยให้คุณเปลี่ยนรูปภาพต้นฉบับเป็นรูปภาพอื่นได้ ตัวอย่างเช่น คุณสามารถสั่ง Stable Diffusion ให้สร้างภาพการ์ตูนจากภาพถ่ายบุคคลได้ ส่วนฟีเจอร์ Inpainting ช่วยให้ผู้ใช้สามารถอัปโหลดรูปภาพและเปลี่ยนรูปภาพเดิมเป็นรูปภาพใหม่ ตัวอย่างของการ inpainting รวมถึงการ “ขยาย” พื้นหลังของภาพถ่ายหรือการลงสีภาพถ่ายขาวดำ

กรณีการใช้งานใหม่

นอกจากนี้เรายังได้เพิ่มโมเดลใหม่ให้กับ Workers AI ที่อนุญาตให้มีงานพิเศษและกรณีการใช้งานต่างๆ เช่น LLM ที่เชี่ยวชาญในการแก้ปัญหาทางคณิตศาสตร์ (deepseek-math-7b-instruct) การสร้างโค้ด SQL (sqlcoder-7b-2) การสรุปข้อความ (bart-large-cnn) และคําบรรยายภาพ (uform-gen2-qwen-500m)เราต้องการเผยแพร่สิ่งเหล่านี้สู่สาธารณะ เพื่อให้คุณสามารถเริ่มสร้างกับสิ่งเหล่านี้ได้ แต่เราจะปล่อยการสาธิตและเนื้อหาบทช่วยสอนเพิ่มเติมในอีกไม่กี่สัปดาห์ข้างหน้า คอยติดตามบัญชี X และเอกสารสําหรับนักพัฒนาซอฟต์แวร์ของเราสําหรับข้อมูลเพิ่มเติมเกี่ยวกับวิธีใช้รุ่นใหม่เหล่านี้

การเพิ่มประสิทธิภาพ model catalog ของเรา

นวัตกรรมโมเดล AI กําลังก้าวหน้าอย่างรวดเร็ว และเครื่องมือและเทคนิคสําหรับการอนุมานที่รวดเร็วและมีประสิทธิภาพก็เช่นกัน เรารู้สึกตื่นเต้นที่จะได้รวมเครื่องมือใหม่ๆ ที่ช่วยให้เราเพิ่มประสิทธิภาพโมเดลของเรา เพื่อให้เราสามารถนําเสนอแพลตฟอร์มการอนุมานที่ดีที่สุดสําหรับทุกคน โดยทั่วไป เมื่อเพิ่มประสิทธิภาพการอนุมาน AI จะเป็นประโยชน์ในการจัดลําดับโมเดลให้อยู่ในรูปแบบ เช่น ONNX ซึ่งเป็นหนึ่งในตัวเลือกที่ใช้ได้โดยทั่วไปมากที่สุดสําหรับกรณีการใช้งานนี้ด้วยการสนับสนุนฮาร์ดแวร์และสถาปัตยกรรมโมเดลในวงกว้างโมเดล ONNX สามารถปรับให้เหมาะสมเพิ่มเติมได้โดยการแปลงเป็นเอ็นจิ้น TensorRT รูปแบบนี้ออกแบบมาโดยเฉพาะสําหรับ Nvidia GPU อาจส่งผลให้เวลาแฝงในการอนุมานเร็วขึ้นและปริมาณงานรวมที่สูงขึ้นจาก LLM การเลือกรูปแบบที่เหมาะสมมักจะขึ้นอยู่กับสิ่งที่สถาปัตยกรรมโมเดลเฉพาะและฮาร์ดแวร์ที่รองรับได้ดีที่สุด เราตัดสินใจที่จะใช้ประโยชน์จากทั้งรูปแบบ TensorRT และ ONNX สําหรับไปป์ไลน์ Stable Diffusion ใหม่ของเรา ซึ่งแสดงถึงชุดของโมเดลที่ใช้สําหรับงานเฉพาะ

สํารวจเพิ่มเติมเกี่ยวกับเอกสารสําหรับนักพัฒนาซอฟต์แวร์ฉบับใหม่ของเรา

คุณสามารถสํารวจโมเดลใหม่เหล่านี้ได้ในเอกสารสําหรับนักพัฒนาซอฟต์แวร์ใหม่ของเรา ซึ่งคุณสามารถเรียนรู้เพิ่มเติมเกี่ยวกับโมเดลแต่ละรุ่น เทมเพลตพร้อมท์ ตลอดจนคุณสมบัติต่างๆ เช่น ขีดจํากัดโทเค็นบริบท เราได้ออกแบบหน้าโมเดลใหม่เพื่อให้นักพัฒนาสํารวจโมเดลใหม่ๆ และเรียนรู้วิธีใช้งานได้ง่ายขึ้น ตอนนี้คุณจะเห็นโมเดลทั้งหมดในหน้าเดียวสําหรับความสามารถในการค้นหาโดยมีประเภทงานอยู่ทางด้านขวามือ จากนั้น คุณสามารถคลิกไปที่หน้าโมเดลแต่ละหน้าเพื่อดูตัวอย่างโค้ดเกี่ยวกับวิธีใช้โมเดลเหล่านั้น

เราหวังว่าคุณจะลองใช้โมเดลใหม่เหล่านี้และสร้างสิ่งใหม่บน Workers AI! เรามีการอัปเดตเพิ่มเติมในเร็วๆ นี้ รวมถึงการสาธิต บทช่วยสอน และราคา AI สําหรับผู้ปฏิบัติงานเพิ่มเติม แจ้งให้เราทราบว่าคุณกําลังทําอะไรอยู่และรุ่นอื่นๆ ที่คุณต้องการเห็นใน Discord ของเรา

ข้อมูลจาก : blog.cloudflare.com

Naruemon Paengjaem
Naruemon Paengjaem