Mô tả công việc
Xây dựng \& quản lý hạ tầng dữ liệu
Thiết kế, phát triển và bảo trì pipeline ETL/ELT để thu thập, xử lý và lưu trữ dữ liệu.
Quản lý dữ liệu trên các nền tảng Cloud (AWS) Tối ưu hóa hệ thống dữ liệu
Đảm bảo dữ liệu được lưu trữ và truy xuất hiệu quả (Data Warehouse, Data Lake, Lakehouse).
Tối ưu hiệu suất query, giảm chi phí vận hành, tăng tốc độ xử lý. Quản lý chất lượng \& bảo mật dữ liệu
Đảm bảo dữ liệu đầy đủ, chính xác và nhất quán giữa các hệ thống.
Thiết lập quyền truy cập, bảo mật, và tuân thủ các chính sách dữ liệu. Hỗ trợ Data Analyst
Cung cấp dữ liệu sạch, đúng cấu trúc để phục vụ phân tích, báo cáo, AI/ML.
Làm việc chặt chẽ với BI/DA để hiểu nhu cầu dữ liệu từ business. Giám sát \& tự động hóa
Xây dựng hệ thống giám sát pipeline (monitoring, alerting).
Tự động hóa quy trình xử lý dữ liệu để giảm lỗi thủ công. Hỗ trợ Risk/Analytics:
Phối hợp chặt chẽ với bộ phận trong việc triển khai, theo dõi và đánh giá hiệu quả của các mô hình Credit Risk Scorecard
Yêu cầu công việc
Có nền tảng vững về Cloud Services: AWS (EMR, DMS, Lambda, S3, …)
Thành thạo ngôn ngữ lập trình: Python, SQL, R
Hiểu biết sâu về Data Modeling và Lakehouse Architecture
Kinh nghiệm xây dựng và vận hành ETL pipeline
Sử dụng thành thạo Docker, Azure DevOps và môi trường Linux
Hệ thống Data Warehouse: ClickHouse
Cơ sở dữ liệu: RDS, MySQL
Tham gia thiết kế data model cho các hệ thống Credit Risk Scorecard (Application/Behavior/Collection) là một điểm cộng.