Agentic AI on Allyson Oliveira

Playlist de AI e ML do AWS re:Invent 2025

Thu, 16 Apr 2026 12:00:00 +0000

O AWS re:Invent é a maior conferência anual da AWS, realizada em Las Vegas. Em 2025, o evento reuniu cerca de 60.000 participantes com mais de 2.000 sessões técnicas. O tema central foi IA agêntica — agentes de IA autônomos que planejam, executam e adaptam suas ações.

Abaixo está a playlist completa de Artificial Intelligence do re:Invent 2025, organizada por tema. São 67 sessões cobrindo desde infraestrutura de IA até agentes em produção.

Link da playlist completa no YouTube

Agentes de IA e Amazon Bedrock AgentCore

AIM422 - Agentic AI Meets Responsible AI: Strategy and best practices — Estratégias para construir agentes de IA responsáveis
AIM396 - Integrate any agent framework with Amazon Bedrock AgentCore — Como integrar qualquer framework de agentes com o AgentCore
AIM3310 - Agents in the enterprise: Best practices with Amazon Bedrock AgentCore — Melhores práticas para agentes em ambientes enterprise
AIM390 - Building autonomous AI at scale with Amazon Bedrock — Construindo IA autônoma em escala com Bedrock
AIM3330 - Keep Your Agents Out of Trouble with Amazon Bedrock AgentCore — Guardrails e segurança para agentes
AIM431 - Architecting scalable and secure agentic AI with Bedrock AgentCore — Arquitetura escalável e segura para IA agêntica
AIM2204 - Bridging from POC to production: An intro to Amazon Bedrock AgentCore — Do POC à produção com AgentCore
AIM3348 - Improve agent quality in production with Bedrock AgentCore Evaluations — Avaliação de qualidade de agentes em produção
AIM331 - Make agents remember with Amazon Bedrock AgentCore Memory — Memória persistente para agentes
AIM3313 - Scale agent tools with Amazon Bedrock AgentCore Gateway — Escalando ferramentas de agentes com o Gateway
AIM395 - Concept to campaign: Marketing agents on Amazon Bedrock AgentCore — Agentes de marketing com AgentCore
AIM340 - AI agents for cloud ops: Automating infrastructure management — Agentes para automação de operações cloud

Amazon Nova

AIM3324 - [NEW LAUNCH] Amazon Nova 2 Omni: A new frontier in multimodal AI — Lançamento do Nova 2 Omni, modelo multimodal
AIM3342 - Nova 2: Enterprise intelligence optimized for the real world — Nova 2 otimizado para cenários enterprise
AIM3325 - Amazon Nova Forge: Build your own frontier models using Amazon Nova — Treine seus próprios modelos frontier com Nova Forge
AIM380 - Customize Amazon Nova models for enhanced tool calling — Customização de modelos Nova para tool calling
AIM373 - From prompt to production: On-brand marketing images with Amazon Nova — Geração de imagens de marketing com Nova
AIM374 - Create hyper-personalized voice interactions with Amazon Nova Sonic — Interações de voz personalizadas com Nova Sonic
AIM372 - Build useful, reliable agents with Amazon Nova — Construindo agentes confiáveis com Nova
AIM382 - Build AI your way with Amazon Nova customization — Customização flexível do Amazon Nova
AIM384 - Delighting Slack users safely and quickly with Amazon Nova and Bedrock — Slack + Nova + Bedrock
AIM429 - Build autonomous code improvement agents with Amazon Nova 2 Lite — Agentes autônomos de melhoria de código com Nova 2 Lite
AIM3334 - Beyond web browsers: HITL and tool integration for Nova Act — Human-in-the-loop e integração de ferramentas com Nova Act

Strands Agents SDK

AIM3331 - Build production AI agents with the Strands Agents SDK for TypeScript — SDK Strands para agentes em TypeScript
AIM426 - Using Strands Agents to build autonomous, self-improving AI agents — Agentes autônomos e auto-aprimoráveis com Strands
AIM3309 - Slack securely powers internal AI dev tools with Bedrock and Strands — Slack + Bedrock + Strands

Amazon SageMaker AI

AIM272 - Master AI model development with Amazon SageMaker AI — Desenvolvimento de modelos com SageMaker
AIM363 - Customize and scale foundation models using Amazon SageMaker AI — Customização e escala de foundation models
AIM364 - Streamline AI model development lifecycle with Amazon SageMaker AI — Ciclo de vida de desenvolvimento de modelos
AIM424 - Scaling foundation model inference on Amazon SageMaker AI — Escalando inferência de foundation models
AIM387 - Scale AI agents with custom models using Amazon SageMaker AI and SGLang — Agentes com modelos customizados via SageMaker e SGLang
AIM381 - Customize models for agentic AI at scale with SageMaker AI and Bedrock — Customização de modelos para IA agêntica
AIM388 - Develop AI Agents faster with Amazon SageMaker Studio and Bedrock AgentCore — Desenvolvimento acelerado de agentes
AIM3340 - SageMaker and MLflow: Innovate faster with no infrastructure management — SageMaker + MLflow sem gerenciar infra

SageMaker HyperPod e Treinamento

AIM3338 - SageMaker HyperPod: Checkpointless and elastic training for AI models — Treinamento elástico sem checkpoints
AIM362 - Accelerate AI workloads with UltraServers on Amazon SageMaker HyperPod — UltraServers para workloads de IA
AIM371 - Build, fine-tune and deploy AI models with SageMaker HyperPod CLI and SDK — CLI e SDK do HyperPod
AIM365 - Train high-performing AI models at scale on AWS — Treinamento de modelos em escala
AIM3327 - Unlock Advanced Model Training: Reinforcement Fine-tuning on Bedrock — Fine-tuning com reinforcement learning no Bedrock
AIM383 - Build more effective agents through model customization — Agentes mais eficazes via customização de modelos

Infraestrutura de IA (Trainium e NVIDIA)

AIM201 - Break through AI performance and cost barriers with AWS Trainium — Performance e custo com Trainium
AIM3335 - AWS Trn3 UltraServers: Power next-generation enterprise AI performance — Trn3 UltraServers para IA enterprise
AIM351 - End-to-end foundation model lifecycle on AWS Trainium — Ciclo completo de foundation models no Trainium
AIM414 - Performance engineering on Neuron: How to optimize your LLM with NKI — Otimização de LLMs com Neuron e NKI
AIM251 - Accelerating AI innovation with NVIDIA GPUs on AWS — Inovação em IA com GPUs NVIDIA na AWS
AIM252 - How customers build AI at scale with AWS AI infrastructure — Clientes construindo IA em escala

RAG, Knowledge Bases e Dados

AIM425 - Advanced agentic RAG Systems: Deep dive with Amazon Bedrock — Deep dive em sistemas RAG agênticos
AIM338 - Unified knowledge access: Bridging data with generative AI agents — Acesso unificado a conhecimento com agentes
AIM339 - Data protection strategies for AI data foundation — Estratégias de proteção de dados para IA
AIM375 - Building scalable applications with text and multimodal understanding — Aplicações escaláveis com compreensão multimodal

Amazon Bedrock (Geral)

AIM391 - Mastering model choice: The 3-step Amazon Bedrock advantage — Como escolher o modelo certo no Bedrock
AIM3304 - Balance cost, performance and reliability for AI at enterprise scale — Equilíbrio entre custo, performance e confiabilidade
AIM3341 - Build Enterprise AI Apps Faster: Amazon Bedrock Multimodal Solutions — Apps enterprise com soluções multimodais do Bedrock
AIM3311 - Build agentic workflows on AWS with third-party agents and tools — Workflows agênticos com agentes e ferramentas de terceiros
AIM3318 - From idea to impact: Harness AI agents and tools in AWS Marketplace — Agentes e ferramentas no AWS Marketplace

IA Responsável e Sustentabilidade

AIM3323 - From principles to practice: Scaling AI responsibly with Indeed — IA responsável em escala com Indeed
AIM417 - Sustainable computing for climate solutions — Computação sustentável para soluções climáticas
AIM253 - Optimizing generative AI workloads for sustainability and cost — Otimização de workloads de IA generativa
AIM255 - Architecting for sustainable IT at scale — Arquitetura sustentável em escala
AIM332 - How Adobe and Salesforce enable sustainability initiatives with AWS CCFT — Adobe e Salesforce com AWS CCFT
AIM333 - Sustainable and cost-efficient generative AI with agentic workflows — IA generativa sustentável com workflows agênticos
AIM237 - Accelerating sustainability compliance with AI-powered document review — Compliance de sustentabilidade com IA

Casos de Uso

AIM256 - Building an AI-powered waste classification using Amazon Nova and IoT — Classificação de resíduos com Nova e IoT
AIM336 - Using AI to improve humanitarian workload resilience — IA para resiliência em workloads humanitários
AIM337 - Agentic AI for member-owned financials: Systems that serve — IA agêntica para cooperativas financeiras

Well-Architected para IA

AIM (sem código) - Build a well-architected foundation for scaling generative AI and agentic apps — Fundação Well-Architected para escalar apps de IA generativa e agêntica
AIM (sem código) - Customize AI models and accelerate time to production with Amazon SageMaker AI — Customização e aceleração com SageMaker

Bons estudos!

Embeddings, Vector Database, RAG e MCP: Como os sistemas modernos de IA realmente funcionam

Thu, 16 Apr 2026 10:00:00 +0000

Recentemente assisti a um vídeo muito bom do canal ByteMonk chamado “Embeddings, Vector database, Agent, RAG & MCP: How Modern AI Systems Actually Work” (link aqui) e resolvi trazer um resumo dos conceitos abordados, porque são peças fundamentais para entender como os sistemas de IA modernos funcionam na prática.

Embeddings: como a IA entende significado

Embeddings são representações numéricas (vetores) que capturam o significado semântico de palavras, frases ou documentos. Em vez de tratar texto como simples sequências de caracteres, os modelos de IA transformam o conteúdo em listas de números onde conceitos similares ficam próximos no espaço vetorial.

Na prática, isso significa que uma busca por “aumentar receita” pode encontrar documentos sobre “crescimento de vendas”, mesmo sem ter palavras em comum. É isso que permite a busca semântica — ir além do match exato de palavras-chave.

Vector Databases: onde os vetores moram

Se embeddings são os vetores, as Vector Databases são os sistemas de armazenamento otimizados para buscas por similaridade. Diferente de bancos de dados tradicionais que fazem buscas exatas, um vector database encontra os “vizinhos mais próximos” entre milhões de vetores em milissegundos.

Exemplos populares: Pinecone, Weaviate, Chroma, Qdrant e pgvector (extensão do PostgreSQL).

O caso de uso clássico é armazenar chunks de documentos como vetores pesquisáveis, servindo de base para sistemas de RAG.

RAG (Retrieval-Augmented Generation): dando contexto ao LLM

RAG é a técnica que conecta tudo isso. O fluxo é elegante:

O usuário faz uma pergunta
A pergunta é convertida em um embedding
O sistema busca documentos relevantes no vector database
Esse contexto é injetado no prompt do LLM
O modelo gera uma resposta baseada tanto no seu treinamento quanto nas informações recuperadas

O grande benefício do RAG é que o LLM consegue responder com informações atualizadas e específicas do seu domínio, sem precisar ser retreinado. Isso resolve um dos maiores problemas dos modelos de linguagem: o conhecimento limitado à data de corte do treinamento.

MCP (Model Context Protocol): padronizando o acesso a dados

O MCP (Model Context Protocol) é um protocolo que padroniza como aplicações de IA acessam fontes de dados externas. Em vez de cada integração precisar de código customizado, o MCP oferece interfaces padronizadas para que agentes de IA se conectem a bancos de dados, APIs e ferramentas de forma segura e consistente.

Enquanto o RAG foca em recuperar informações não-estruturadas para enriquecer prompts, o MCP trata o contexto como entradas dinâmicas, estruturadas e compostas, passadas via um protocolo formal. Na prática, RAG e MCP são complementares: o RAG busca o conhecimento relevante e o MCP padroniza como esse conhecimento (e outras ferramentas) chegam até o modelo.

Mão na massa: exemplos de código

Gerando um embedding com a API da OpenAI:

from openai import OpenAI

client = OpenAI()

response = client.embeddings.create(
 model="text-embedding-3-small",
 input="Como funcionam os sistemas modernos de IA?"
)

vetor = response.data[0].embedding
print(f"Dimensões do vetor: {len(vetor)}")
# Dimensões do vetor: 1536

Fazendo uma busca por similaridade com ChromaDB:

import chromadb

client = chromadb.Client()
collection = client.create_collection("meus_docs")

# Inserindo documentos (o Chroma gera os embeddings automaticamente)
collection.add(
 documents=["RAG conecta LLMs a bases de conhecimento",
 "Docker isola aplicações em containers",
 "Embeddings capturam significado semântico"],
 ids=["doc1", "doc2", "doc3"]
)

# Buscando por similaridade
resultados = collection.query(
 query_texts=["como dar contexto para uma IA?"],
 n_results=2
)
print(resultados["documents"])
# [['RAG conecta LLMs a bases de conhecimento',
# 'Embeddings capturam significado semântico']]

Note que a busca retornou os documentos semanticamente relevantes, mesmo sem palavras em comum com a query.

Como tudo se conecta

┌──────────┐ ┌──────────────┐ ┌───────────┐ ┌─────────┐ ┌──────────┐
│ │ │ │ │ │ │ │ │ │
│ Dados ├───►│ Embeddings ├───►│ Vector DB ├───►│ RAG ├───►│ LLM │
│ │ │ │ │ │ │ │ │ │
└──────────┘ └──────────────┘ └───────────┘ └────┬────┘ └─────┬────┘
│ │
┌────▼────┐ │
│ │ │
│ MCP ◄─────────┘
│ │
└────┬────┘
│
┌─────▼──────┐
│ │
│ AI Agent │
│ │
└────────────┘

Resumindo a stack:

Embeddings transformam dados em vetores com significado semântico
Vector Databases armazenam e buscam esses vetores de forma eficiente
RAG usa essa infraestrutura para dar contexto relevante ao LLM em tempo de consulta
MCP padroniza a comunicação entre o agente de IA e todas essas fontes de dados e ferramentas
AI Agents orquestram tudo isso, planejando consultas em múltiplos passos e adaptando a estratégia conforme os resultados

Para ir além

OpenAI Embeddings Guide — documentação oficial sobre embeddings
ChromaDB — vector database open-source, ótimo para começar
Pinecone Learning Center — tutoriais sobre vector databases e busca semântica
LangChain RAG Tutorial — tutorial prático de RAG com Python
Model Context Protocol (MCP) — especificação oficial do protocolo
Vídeo original do ByteMonk — o vídeo que inspirou este post

Nos vemos por aí!