Task 1.4: Vector Store Solutions

Task 1.4: Thiết kế và triển khai vector store solutions

Exam Tip: Vector stores và RAG là chủ đề cực kỳ quan trọng trong kỳ thi. Hãy hiểu rõ cách hoạt động của embeddings, vector search, và các loại vector databases trên AWS.

Skill 1.4.1: Kiến trúc vector database nâng cao

Kiến thức cần nắm:

  • Amazon Bedrock Knowledge Bases — Managed RAG solution với built-in vector store
  • Amazon OpenSearch Service với Neural plugin — Semantic search
  • Amazon Aurora với pgvector extension — PostgreSQL-based vector store
  • Amazon RDS với S3 document repositories
  • Amazon DynamoDB với vector databases cho metadata và embeddings
Vector StoreƯu điểmUse Case
Bedrock Knowledge BasesFully managed, easy setupQuick RAG deployment
OpenSearch ServiceScalable, hybrid searchLarge-scale semantic search
Aurora pgvectorSQL-compatible, ACIDExisting PostgreSQL workloads
DynamoDB + vector DBLow latency, serverlessReal-time applications

Skill 1.4.2: Metadata frameworks

Kiến thức cần nắm:

  • S3 object metadata cho document timestamps
  • Custom attributes cho authorship information
  • Tagging systems cho domain classification
  • Metadata filtering trong vector search queries

Skill 1.4.3: High-performance vector database architectures

Kiến thức cần nắm:

  • OpenSearch sharding strategies
  • Multi-index approaches cho specialized domains
  • Hierarchical indexing techniques
  • Index optimization cho query performance

Skill 1.4.4: Integration components

Kết nối với document management systems, knowledge bases, internal wikis.

Skill 1.4.5: Data maintenance systems

Kiến thức cần nắm:

  • Incremental update mechanisms
  • Real-time change detection systems
  • Automated synchronization workflows
  • Scheduled refresh pipelines

Tài liệu tham khảo