การถ่ายโอนเพื่อลดขนาดข้อมูลของ Amazon Bedrock

ภาพรวม

เมื่อใช้การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลของ Amazon Bedrock คุณจึงสามารถใช้โมเดลที่มีขนาดเล็กลง แต่ทำงานได้รวดเร็วและคุ้มค่ายิ่งขึ้น ซึ่งจะให้ความถูกต้องแม่นยำตามกรณีใช้งานและมีประสิทธิภาพทัดเทียมโมเดลขั้นสูงสุดใน Amazon Bedrock โมเดลที่มีขนาดเล็กลงใน Amazon Bedrock นั้นเร็วกว่า 500% และราคาถูกกว่าโมเดลดั้งเดิมถึง 75% โดยมีการสูญเสียความถูกต้องแม่นยำน้อยกว่า 2% สำหรับกรณีการใช้งานอย่าง RAG

ใช้โมเดลขนาดเล็กและคุ้มค่ามากขึ้น

เมื่อใช้การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดล ลูกค้าจึงสามารถเลือกโมเดล “การสอน” ซึ่งต้องการบรรลุความถูกต้องตามกรณีการใช้งาน จากนั้นเลือกโมเดล “การเรียนรู้” ที่ต้องการปรับแต่ง นอกจากนี้ ลูกค้ายังระบุพร้อมท์สำหรับกรณีการใช้งานได้อีกด้วย การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลทำให้กระบวนการสร้างการตอบสนองจากการสอนเป็นไปโดยอัตโนมัติและใช้การตอบสนองเหล่านั้นเพื่อปรับแต่งโมเดลการเรียนรู้อย่างละเอียด จากนั้นโมเดลการเรียนรู้จะทำตามโมเดลการสอนที่มีความถูกต้องแม่นยำเหมือนกันโดยมีต้นทุนที่ลดลง Model Distillation รองรับโมเดลหลากหลายจากผู้ให้บริการโมเดลต่างๆ รวมถึง Amazon Nova Premier (โมเดลขนาดใหญ่) และ Nova Pro (โมเดลขนาดเล็ก), Claude 3.5 Sonnet v2 (โมเดลขนาดใหญ่), Llama 3.3 70B (โมเดลขนาดใหญ่) และ Llama 3.2 1B/3B (โมเดลขนาดเล็ก)

ภาพหน้าจอ UI

เพิ่มประสิทธิภาพของโมเดลที่มีขนาดเล็กลงด้วยการสังเคราะห์ข้อมูลที่เป็นกรรมสิทธิ์เฉพาะ

การปรับแต่งโมเดลขนาดเล็กและประหยัดค่าใช้จ่ายเพื่อให้ได้ความแม่นยำคล้ายกับโมเดลขนาดใหญ่กว่าสำหรับกรณีการใช้งานเฉพาะเป็นกระบวนการทำซ้ำ การถ่ายโอนเพื่อลดขนาดข้อมูลโมเดลอาจเลือกใช้วิธีการสังเคราะห์ข้อมูลที่แตกต่างกันที่เหมาะสมที่สุดสำหรับกรณีการใช้งานของคุณเพื่อขจัดภาระของการทำซ้ำที่จำเป็นเพื่อให้ได้ผลลัพธ์ที่ดีขึ้น ตัวอย่างเช่น Bedrock อาจขยายชุดข้อมูลการฝึกโดยสร้างพร้อมท์ที่คล้ายกันหรือสร้างการตอบกลับสังเคราะห์คุณภาพสูงโดยใช้คู่พร้อมท์และการตอบกลับที่ลูกค้าระบุไว้เป็นตัวอย่างชั้นดี

ภาพหน้าจอ UI

ลดต้นทุนด้วยการนำข้อมูลจากการใช้งานจริงของคุณมาใช้ได้อย่างง่ายดาย

ในการปรับแต่งแบบดั้งเดิม ลูกค้าจะต้องสร้างพร้อมท์และการตอบสนอง สำหรับ Model Distillation ลูกค้าแค่ระบุพร้อมท์เท่านั้น จากนั้น Model Distillation จะใช้เพื่อสร้างการตอบสนองแบบสังเคราะห์และปรับแต่งโมเดลนักเรียน ลูกค้าสามารถนำทางเราไปที่ข้อมูลบันทึกการเรียกดำเนินการของลูกค้า และกรองข้อมูลบันทึกตามฟิลด์ข้อมูลเมตาบางอย่างได้ Model Distillation สามารถอ่านทั้งพร้อมท์และการตอบสนองผ่านข้อมูลบันทึกการเรียกดำเนินการ รวมทั้งข้ามการสร้างการตอบสนองแบบสังเคราะห์ในเวิร์กโฟลว์ Model Distillation ซึ่งจะช่วยลดต้นทุนโดยไม่ต้องสร้างการตอบสนองจากแบบโมเดลผู้สอนอีกครั้ง เริ่มต้นด้วยตัวอย่างโค้ด

ภาพหน้าจอ UI

เพิ่มความแม่นยำในการคาดการณ์การเรียกใช้เรียกฟังก์ชันสำหรับเจ้าหน้าที่

การเรียกใช้ฟังก์ชันเจ้าหน้าที่แสดงถึงความสามารถที่สำคัญสำหรับแอปพลิเคชัน AI ที่ทันสมัย ทำให้โมเดลสามารถโต้ตอบกับเครื่องมือภายนอก ฐานข้อมูล และ API โดยกำหนดเวลาที่แม่นยำและวิธีการเรียกดำเนินการฟังก์ชันเฉพาะ แม้ว่าโมเดลขนาดใหญ่มักจะมีความโดดเด่นในการระบุฟังก์ชันที่เหมาะสมในการเรียกใช้และสร้างพารามิเตอร์ที่เหมาะสม แต่โดยทั่วไปแล้วจะมาพร้อมกับต้นทุนและความล่าช้าที่สูงขึ้น Amazon Bedrock Model Distillation ช่วยให้โมเดลขนาดเล็กสามารถคาดการณ์การเรียกใช้ฟังก์ชันได้อย่างแม่นยำ เพื่อเวลาตอบสนองที่เร็วขึ้นอย่างมากและลดต้นทุนการดำเนินงาน