Sobre a Marisa.Care
Somos uma healthtech que está revolucionando a forma como hospitais usam Inteligência Artificial para salvar vidas. Crescemos 5,5x em 2024 e já temos parceiros como Rede D’Or e DASA. Fomos acelerados pela Microsoft for Startups, fazemos parte do NVIDIA Inception e ficamos em 2º lugar no HackBrazil. Além disso, nossa história foi destaque no Brazil Journal link
Descrição da Vaga
Procuramos um(a) engenheiro(a) de IA com experiência em levar modelos do protótipo à produção. A base da carreira é engenharia de software robusta (back-end resiliente e microserviços) aplicada à arquitetura e escala de soluções com LLMs, RAG e APIs inteligentes. A missão do papel é integrar engenharia sólida e o estado-da-arte em IA para criar produtos que aprendem, interagem e resolvem problemas de maneiras novas, com foco em agentes conversacionais.
Atuação prática
Arquitetar, desenvolver e escalar serviços e microserviços para inferência de LLMs e agentes conversacionais (texto/voz).
Projetar e operar pipelines RAG (ingestão, chunking, indexação, embeddings, buscas híbridas) com vetores/KBs.
Implementar tool/function calling, planners, memória de longo prazo e orquestração multi-agente.
Desenvolver APIs e integrações para múltiplos canais (web, mobile, WhatsApp, voz) e sistemas de terceiros.
Estabelecer observabilidade (tracing, logs, métricas), avaliações (A/B, offline evals) e guardrails (segurança, toxicidade, PII).
Otimizar performance e custo (latência, throughput, caching, batching, quantização/streaming quando aplicável).
Colaborar com produto e dados para transformar problemas reais em soluções de IA confiáveis em produção.
Escrever testes automatizados, revisar código e contribuir para padrões de qualidade e CI/CD.
Requisitos
Sólida experiência em engenharia de software back-end (Node.js e/ou Python), APIs REST/gRPC e microsserviços.
Vivência em cloud (Azure/AWS/GCP), Docker/Kubernetes, versionamento (Git) e pipelines CI/CD.
Experiência prática com LLMs em produção e RAG (ex.: LangChain/LangGraph).
Conhecimento de mensageria/eventos (ex.: Kafka/RabbitMQ), cache e bancos (SQL/NoSQL).
Noções de segurança/privacidade (mascaramento de dados, PII) e conformidade (ex.: LGPD).
Boa comunicação, mentalidade colaborativa e foco em entrega sustentável.
Diferenciais
Experiência com agentes conversacionais em produção (WhatsApp, voice bots, contact center) em startups brasileiras.
Tracing/evals de LLM (ex.: Langfuse, Promptfoo, Ragas, DeepEval) e guardrails (políticas/safety).
Fine-tuning/LoRA, embeddings proprietários, re-rankers e busca híbrida (BM25+densa).
Contribuições open source e participação em comunidades de IA/engenharia.
Informações da Posição
Contratação via PJ
Modelo Híbrido – Belo Horizonte