Mô tả công việc
Tham gia phát triển dự án AI với vai trò Fullstack Engineer, trong đó thiên về hạ tầng và vận hành hệ thống AI.
Phát triển backend bằng Python cho các hệ thống AI: LLM inference; RAG pipelines; Internal AI services
Phát triển frontend bằng Next.js cho các AI-powered web applications (dashboard, admin, internal tools).
Triển khai và vận hành LLM inference services sử dụng vLLM trên môi trường local / private.
Làm việc với các hệ thống dữ liệu: PostgreSQL; Vector database (Qdrant)
Đóng gói và triển khai hệ thống bằng Docker / Podman.
Triển khai, vận hành và tối ưu hệ thống trên Kubernetes.
Tối ưu: GPU utilization; Latency và throughput của LLM inference; Resource usage (CPU, RAM, GPU)
Xây dựng và duy trì CI/CD pipelines cho toàn bộ hệ thống (frontend, backend, AI services).
Thiết lập monitoring \& observability cho hệ thống: Application metrics; GPU metrics; Service health
Phối hợp với team AI để: Tích hợp LLM, embedding models; Triển khai RAG và các AI workflows
Đảm bảo hệ thống ổn định, bảo mật và có khả năng mở rộng cho nhiều người dùng.
Yêu cầu công việc
Tối thiểu 2 năm kinh nghiệm với vai trò Fullstack / Backend / Platform Engineer.
Có kinh nghiệm thực tế với cả backend và frontend.
Thành thạo backend bằng Python (FastAPI, Flask hoặc tương đương).
Có kinh nghiệm frontend với Next.js (React).
Đã từng làm việc với cơ sở dữ liệu: PostgreSQL; Vector database (Qdrant hoặc tương đương).
Có kinh nghiệm triển khai AI/ML workloads, ưu tiên: vLLM; AI local / self-hosted.
Thành thạo Linux, hiểu system troubleshooting và networking cơ bản.
Kinh nghiệm containerization: Docker hoặc Podman.
Kinh nghiệm triển khai và vận hành Kubernetes.
Kinh nghiệm CI/CD (GitLab CI, Jenkins, GitHub Actions).
Ưu tiên:
Kinh nghiệm build các dự án AI
Monitoring: Prometheus, Grafana, GPU metrics exporter.
Triển khai hệ thống AI trong môi trường on-prem / offline / air-gapped.
Đã từng sử dụng AI coding tools (Cursor AI, Claude Code).
Kỹ năng \& tư duy:
Tư duy Fullstack nhưng hiểu sâu về DevOps / MLOps cho hệ thống AI.
Không ngại làm cả code ứng dụng lẫn hạ tầng.
Có khả năng debug các vấn đề liên quan đến GPU, latency, memory.
Hiểu trade-off giữa performance, cost và độ ổn định.
Chủ động học công nghệ mới trong lĩnh vực AI/LLM.
Giao tiếp tốt, phối hợp hiệu quả với team
Quyền lợi
Tham gia trực tiếp các dự án AI thực tế, không phải demo.
Làm việc với AI local / private LLM infrastructure.
Được sử dụng AI tools trong quá trình phát triển (Cursor AI, Claude Code…).
Môi trường kỹ thuật mở, khuyến khích thử nghiệm và tối ưu hệ thống.
Lộ trình phát triển:
Senior Fullstack AI Engineer
AI Team Leader
Lương tháng 13. Đánh giá xét tăng lương và điều chỉnh cấp bậc 2 lần/ năm.
Phụ cấp hấp dẫn: Ăn trưa, đi lại, tiếng Nhật, thâm niên..
Nghỉ thứ 7, chủ nhật
Tham gia lớp tiếng Nhật chuyên môn với giáo viên Nhật. Hỗ trợ lệ phí thi tuyển các chứng chỉ như: BJT, JLPT…
Đóng các loại bảo hiểm theo quy định (Full 100% lương), tham gia Bảo hiểm sức khỏe
Khám sức khỏe định kỳ hằng năm.
Hoạt động nội bộ đa dạng: Happy hours hằng tháng. Team building hằng quý. Du lịch công ty hằng năm…Tổ chức nhiều hoạt động thể thao thú vị như: bóng bàn, bóng đá, cầu lông, marathon…
Cơ hội được làm việc và công tác tại Nhật Bản.
Môi trường làm việc trẻ trung, chuyên nghiệp và năng động.