Nếu bạn mong muốn khai phá làm chủ công nghệ, tạo ra
sản phẩm phục vụ hàng triệu người dùng, cùng tổ chức định hình tương lai, từ đó phát triển bản thân
để chinh phục các cột mốc xa hơn.
Xây dựng pipeline CI/CD cho sản phẩm, dịch vụ, model artifact và infrastructure; áp dụng GitOps và Infrastructure as Code khi cần.
Thiết kế, triển khai và vận hành hạ tầng Cloud/Kubernetes phục vụ training, inference và các workload AI/ML/GenAI.
Triển khai model serving bằng các nền tảng như Triton Inference Server, vLLM, Ray Serve hoặc các framework tương đương.
Cấu hình autoscaling, request batching, GPU sharing, resource quota và scheduling để tối ưu chi phí, độ trễ và hiệu suất sử dụng tài nguyên.
Thiết lập monitoring, logging, tracing, alerting và dashboard giám sát cho production system, bao gồm latency, throughput, error rate, GPU utilization, CPU/RAM usage, queue time và cost.
Triển khai ứng dụng trên Docker/Kubernetes, đảm bảo tính ổn định, bảo mật và khả năng mở rộng của hệ thống.
Xây dựng và vận hành ML pipeline :
Thiết kế và triển khai pipeline ML end-to-end, bao gồm: data ingestion, data preprocessing, training, evaluation, model registry, deployment và monitoring.
Quản lý vòng đời mô hình AI/ML, tự động hóa training/retraining bằng các công cụ như Kubeflow, Airflow, MLflow, Argo Workflows hoặc nền tảng tương đương.
Xây dựng dashboard giám sát hiệu năng inference, training job, pipeline execution và tình trạng hạ tầng phục vụ AI/ML.
Phối hợp với Backend, Data Engineering, Data Science, Security để triển khai, tích hợp và vận hành các hệ thống AI.
Thực hiện các nhiệm vụ khác trong phạm vi chức năng theo phân công.
Yêu cầu
Yêu cầu bắt buộc: Ứng viên gửi kèm bằng tốt nghiệp và bảng điểm trong đơn ứng tuyển.
Tốt nghiệp Đại học trở lên các ngành: Công nghệ thông tin, Khoa học máy tính, Kỹ thuật phần mềm, Khoa học dữ liệu, Hệ thống thông tin, Trí tuệ nhân tạo hoặc các ngành tương đương phù hợp với vị trí công việc.
Tối thiểu 01 năm kinh nghiệm MLOps/DevOps hoặc tương đương.
Thành thạo :
Python, Bash; Docker và Kubernetes ở mức triển khai workload
CI/CD: GitLab CI / Jenkins / GitHub Actions
Monitoring và logging stack: Prometheus, Grafana, ELK/Loki
Tư duy hệ thống, cẩn thận với môi trường production, sẵn sàng on-call.
Kỹ năng mềm :
Giao tiếp rõ ràng, phối hợp với Data Scientist, ML Engineer, BE
Chịu áp lực sự cố sản xuất, tinh thần cải tiến quy trình.
Ưu tiên :
Kinh nghiệm: MLflow, Kubeflow, DVC, Feature Store.
Kinh nghiệm Oracle, ClickHouse hoặc Apache Spark.
Model serving nâng cao: vLLM, Text Generation Inference, Ray Serve.
Biết dùng công cụ AI để:
Sinh code pipeline ML, gợi ý chiến lược deployment.
Debug nhanh model issue, tạo dashboard tự động.
Có khả năng đánh giá/kiểm chứng output của AI.
Quyền lợi
Thưởng các ngày lễ, thành lập ngành…
Phụ cấp ăn ca
Tham dự các chương trình đào tạo chuyên sâu trong và ngoài nước hàng năm theo chương trình đào tạo nhân lực CNTT do Tập đoàn tổ chức
Công ty hỗ trợ phương tiện đi lại và công tác phí khi đi công tác theo quy định.