Task 1.5: Retrieval Mechanisms (RAG)
Task 1.5: Thiết kế retrieval mechanisms cho FM augmentation
Skill 1.5.1: Document segmentation (Chunking)
Kiến thức cần nắm:
- Amazon Bedrock chunking capabilities (fixed-size, hierarchical, semantic)
- Fixed-size chunking với Lambda functions
- Hierarchical chunking dựa trên content structure
- Semantic chunking — chia theo ý nghĩa nội dung
Chunking strategies ảnh hưởng trực tiếp đến chất lượng retrieval. Fixed-size chunking đơn giản nhưng có thể cắt giữa câu. Semantic chunking giữ nguyên context nhưng phức tạp hơn. Hierarchical chunking kết hợp cả hai.
Skill 1.5.2: Embedding solutions
Kiến thức cần nắm:
- Amazon Titan Embeddings — Dimensionality và domain fit
- So sánh performance của các Bedrock embedding models
- Lambda functions để batch generate embeddings
- Embedding dimensions: trade-off giữa accuracy và storage/compute cost
Skill 1.5.3: Vector search solutions
Kiến thức cần nắm:
- OpenSearch Service với vector search capabilities
- Amazon Aurora với pgvector extension
- Amazon Bedrock Knowledge Bases với managed vector store
Skill 1.5.4: Advanced search architectures
Kiến thức cần nắm:
- Semantic search với OpenSearch
- Hybrid search — Kết hợp keyword search và vector search
- Amazon Bedrock reranker models — Rerank kết quả để cải thiện relevance
Exam Tip: Hybrid search (kết hợp keyword + semantic) thường là câu trả lời đúng khi đề hỏi về cách cải thiện search relevance. Reranker models giúp refine kết quả sau khi retrieval.
Skill 1.5.5: Query handling systems
Kiến thức cần nắm:
- Amazon Bedrock cho query expansion
- Lambda functions cho query decomposition
- Step Functions cho query transformation
- Multi-query strategies
Skill 1.5.6: Consistent access mechanisms
Kiến thức cần nắm:
- Function calling interfaces cho vector search
- Model Context Protocol (MCP) clients cho vector queries
- Standardized API patterns cho retrieval augmentation
Tài liệu tham khảo