👨🏻‍💻 postech.work

FULLSTACK AI ENGINEER (DEVOPS/MLOPS)

Cube System Vietnam • 🌐 In Person

In Person Posted 3 days, 20 hours ago

Job Description

Mô tả công việc

Tham gia phát triển dự án AI với vai trò Fullstack Engineer, trong đó thiên về hạ tầng và vận hành hệ thống AI.

Phát triển backend bằng Python cho các hệ thống AI: LLM inference; RAG pipelines; Internal AI services

Phát triển frontend bằng Next.js cho các AI-powered web applications (dashboard, admin, internal tools).

Triển khai và vận hành LLM inference services sử dụng vLLM trên môi trường local / private.

Làm việc với các hệ thống dữ liệu: PostgreSQL; Vector database (Qdrant)

Đóng gói và triển khai hệ thống bằng Docker / Podman.

Triển khai, vận hành và tối ưu hệ thống trên Kubernetes.

Tối ưu: GPU utilization; Latency và throughput của LLM inference; Resource usage (CPU, RAM, GPU)

Xây dựng và duy trì CI/CD pipelines cho toàn bộ hệ thống (frontend, backend, AI services).

Thiết lập monitoring \& observability cho hệ thống: Application metrics; GPU metrics; Service health

Phối hợp với team AI để: Tích hợp LLM, embedding models; Triển khai RAG và các AI workflows

Đảm bảo hệ thống ổn định, bảo mật và có khả năng mở rộng cho nhiều người dùng.

Yêu cầu công việc

Tối thiểu 2 năm kinh nghiệm với vai trò Fullstack / Backend / Platform Engineer.

Có kinh nghiệm thực tế với cả backend và frontend.

Thành thạo backend bằng Python (FastAPI, Flask hoặc tương đương).

Có kinh nghiệm frontend với Next.js (React).

Đã từng làm việc với cơ sở dữ liệu: PostgreSQL; Vector database (Qdrant hoặc tương đương).

Có kinh nghiệm triển khai AI/ML workloads, ưu tiên: vLLM; AI local / self-hosted.

Thành thạo Linux, hiểu system troubleshooting và networking cơ bản.

Kinh nghiệm containerization: Docker hoặc Podman.

Kinh nghiệm triển khai và vận hành Kubernetes.

Kinh nghiệm CI/CD (GitLab CI, Jenkins, GitHub Actions).

Ưu tiên:

Kinh nghiệm build các dự án AI

Monitoring: Prometheus, Grafana, GPU metrics exporter.

Triển khai hệ thống AI trong môi trường on-prem / offline / air-gapped.

Đã từng sử dụng AI coding tools (Cursor AI, Claude Code).

Kỹ năng \& tư duy:

Tư duy Fullstack nhưng hiểu sâu về DevOps / MLOps cho hệ thống AI.

Không ngại làm cả code ứng dụng lẫn hạ tầng.

Có khả năng debug các vấn đề liên quan đến GPU, latency, memory.

Hiểu trade-off giữa performance, cost và độ ổn định.

Chủ động học công nghệ mới trong lĩnh vực AI/LLM.

Giao tiếp tốt, phối hợp hiệu quả với team

Quyền lợi

Tham gia trực tiếp các dự án AI thực tế, không phải demo.

Làm việc với AI local / private LLM infrastructure.

Được sử dụng AI tools trong quá trình phát triển (Cursor AI, Claude Code…).

Môi trường kỹ thuật mở, khuyến khích thử nghiệm và tối ưu hệ thống.

Lộ trình phát triển:

Senior Fullstack AI Engineer

AI Team Leader

Lương tháng 13. Đánh giá xét tăng lương và điều chỉnh cấp bậc 2 lần/ năm.

Phụ cấp hấp dẫn: Ăn trưa, đi lại, tiếng Nhật, thâm niên..

Nghỉ thứ 7, chủ nhật

Tham gia lớp tiếng Nhật chuyên môn với giáo viên Nhật. Hỗ trợ lệ phí thi tuyển các chứng chỉ như: BJT, JLPT…

Đóng các loại bảo hiểm theo quy định (Full 100% lương), tham gia Bảo hiểm sức khỏe

Khám sức khỏe định kỳ hằng năm.

Hoạt động nội bộ đa dạng: Happy hours hằng tháng. Team building hằng quý. Du lịch công ty hằng năm…Tổ chức nhiều hoạt động thể thao thú vị như: bóng bàn, bóng đá, cầu lông, marathon…

Cơ hội được làm việc và công tác tại Nhật Bản.

Môi trường làm việc trẻ trung, chuyên nghiệp và năng động.

Get job updates in your inbox

Subscribe to our newsletter and stay updated with the best job opportunities.