Tuyển dụng LEAD AI ENGINEER (LLM Infrastructure & Orchestration)
Tuyển dụng Lead AI Engineer tại Trivita AI, phụ trách kiến trúc hệ thống, tối ưu hạ tầng và triển khai LLM ở quy mô production.

Mô tả công việc
- Định hướng kiến trúc kỹ thuật cho hệ thống AI, đảm bảo khả năng mở rộng, tối ưu chi phí và hiệu năng
- Thiết kế và triển khai hệ thống orchestration cho LLM, bao gồm quản lý prompt chain, streaming response và memory dài hạn
- Xây dựng và tối ưu hạ tầng phục vụ LLM, triển khai các framework như vLLM
- Quản lý và phân bổ tài nguyên GPU (NVIDIA MIG) để tối ưu throughput cho nhiều model
- Triển khai các kỹ thuật tối ưu inference như PagedAttention để giảm độ trễ
- Dẫn dắt và phát triển đội ngũ AI và backend thông qua code review và mentoring
- Phối hợp với Product và MLOps để đảm bảo chất lượng và tiến độ phát hành sản phẩm
Yêu cầu kỹ thuật
- Hiểu sâu về kiến trúc Transformer, fine-tuning LLM và các kỹ thuật tối ưu inference
- Thành thạo Python và Java/Kotlin
- Có kinh nghiệm xây dựng API phục vụ hệ thống AI
- Kinh nghiệm với Docker, Kubernetes
- Làm việc với hạ tầng GPU (NVIDIA, CUDA, MIG)
- Kinh nghiệm với vector database và tối ưu database quan hệ (PostgreSQL/MySQL)
Kỹ năng mềm
- Có khả năng dẫn dắt và phát triển đội ngũ kỹ thuật
- Chủ động trong việc giải quyết các vấn đề hệ thống phức tạp
Ưu tiên
- Kinh nghiệm xây dựng chatbot hoặc hệ thống automation sử dụng AI
- Có đóng góp cho các dự án open-source
- Hiểu về tối ưu hiệu năng web hoặc responsive design
Quyền lợi
- Làm việc cùng đội ngũ AI và kỹ sư giàu kinh nghiệm
- Được trang bị thiết bị làm việc (Mac)
- Tham gia bảo hiểm xã hội trên full lương
- Môi trường làm việc hiện đại
- Có các tiện ích như hồ bơi, phòng gym, bàn bóng bàn
Thông tin liên hệ
- Địa điểm: Số 01, đường số 104, khu phố 3, phường Bình Trưng, Thành phố Hồ Chí Minh
- Điện thoại: 0909797699
- Email: hr@trivita.ai