Task 1.4: Vector Store Solutions
Task 1.4: Thiết kế và triển khai vector store solutions
Exam Tip: Vector stores và RAG là chủ đề cực kỳ quan trọng trong kỳ thi. Hãy hiểu rõ cách hoạt động của embeddings, vector search, và các loại vector databases trên AWS.
Skill 1.4.1: Kiến trúc vector database nâng cao
Kiến thức cần nắm:
- Amazon Bedrock Knowledge Bases — Managed RAG solution với built-in vector store
- Amazon OpenSearch Service với Neural plugin — Semantic search
- Amazon Aurora với pgvector extension — PostgreSQL-based vector store
- Amazon RDS với S3 document repositories
- Amazon DynamoDB với vector databases cho metadata và embeddings
| Vector Store | Ưu điểm | Use Case |
|---|
| Bedrock Knowledge Bases | Fully managed, easy setup | Quick RAG deployment |
| OpenSearch Service | Scalable, hybrid search | Large-scale semantic search |
| Aurora pgvector | SQL-compatible, ACID | Existing PostgreSQL workloads |
| DynamoDB + vector DB | Low latency, serverless | Real-time applications |
Kiến thức cần nắm:
- S3 object metadata cho document timestamps
- Custom attributes cho authorship information
- Tagging systems cho domain classification
- Metadata filtering trong vector search queries
Kiến thức cần nắm:
- OpenSearch sharding strategies
- Multi-index approaches cho specialized domains
- Hierarchical indexing techniques
- Index optimization cho query performance
Skill 1.4.4: Integration components
Kết nối với document management systems, knowledge bases, internal wikis.
Skill 1.4.5: Data maintenance systems
Kiến thức cần nắm:
- Incremental update mechanisms
- Real-time change detection systems
- Automated synchronization workflows
- Scheduled refresh pipelines
Tài liệu tham khảo