Domain này chiếm 11% tổng điểm, tập trung vào evaluation systems, testing, và troubleshooting cho GenAI applications.
Trọng tâm ôn thi: Mặc dù tỷ trọng thấp nhất, domain này có nhiều câu hỏi thực tế về model evaluation, LLM-as-a-Judge, và troubleshooting common issues. Đừng bỏ qua.
| Task | Nội dung | Số Skills |
|---|---|---|
| Task 5.1 | Evaluation systems cho GenAI | 9 |
| Task 5.2 | Troubleshoot GenAI applications | 5 |
| Service | Vai trò trong Domain 5 |
|---|---|
| Amazon Bedrock Model Evaluations | Model evaluation, A/B testing |
| Amazon CloudWatch Logs | Log analysis, prompt debugging |
| AWS X-Ray | Distributed tracing, observability |
| Amazon SageMaker Clarify | Bias detection, model explainability |
| Amazon SageMaker Ground Truth | Human annotation, labeling |