Trivita AI - ICLR 2026-thumb

Trivita AI đột phá về Efficent AI với 2 công trình tác giả chính tại ICLR 2026 

Trivita AI trân trọng công bố hai công trình nghiên cứu đột phá về Efficient AI (AI hiệu quả) với vị trí tác giả chính của Lê Đức Minh đã được chấp nhận tại International Conference on Learning Representations (ICLR) 2026. Đây là dấu ấn quan trọng khẳng định năng lực của đội ngũ Trivita AI trong việc tối ưu hóa hiệu suất mô hình trên nguồn lực tài nguyên hạn chế. 
Sự kiện này đánh dấu một bước tiến quan trọng trong chiến lược phát triển nghiên cứu nền tảng của Trivita AI, đồng thời khẳng định năng lực kết nối giữa lý thuyết học thuật và triển khai công nghệ thực tiễn, đặc biệt trong các lĩnh vực yêu cầu độ tin cậy cao như y tế. 

1. Revisit Visual Prompt Tuning: The Expressiveness of Prompt Experts 

Link công trình nghiên cứu: https://arxiv.org/pdf/2501.18936 

Trivita AI - ICLR 2026

Tái định nghĩa khả năng biểu diễn của Prompt trong mô hình thị giác nền tảng 

Các mô hình thị giác nền tảng (foundation vision models) được tiền huấn luyện trên tập dữ liệu lớn đã cho thấy khả năng khái quát hóa vượt trội. Tuy nhiên, việc tinh chỉnh toàn bộ mô hình (full fine-tuning) đòi hỏi chi phí tính toán lớn. 
Visual Prompt Tuning (VPT) là một phương pháp thích nghi hiệu quả tham số (parameter-efficient adaptation), bổ sung các token prompt có thể học được vào đầu vào. Dù đạt hiệu quả thực nghiệm cao, phân tích lý thuyết gần đây dựa trên Mixture of Experts (MoE – mô hình hỗn hợp chuyên gia) cho thấy mỗi prompt expert trong VPT hoạt động như một hàm hằng theo đầu vào, làm hạn chế khả năng biểu diễn (expressiveness). 

Đề xuất: Visual Adaptive Prompt Tuning (VAPT) 

Chúng tôi đề xuất Visual Adaptive Prompt Tuning (VAPT), tích hợp các prompt expert thích nghi theo đầu vào (input-adaptive prompt experts). 
Những điểm nổi bật: 

  • Cải thiện khả năng biểu diễn
  • Chỉ tăng 0.6% chi phí tính toán so với VPT
  • Sử dụng ít tham số huấn luyện hơn
  • Chứng minh đạt hiệu quả mẫu tối ưu (optimal sample efficiency)

Trong bối cảnh dữ liệu hạn chế, chỉ sử dụng 1% dữ liệu huấn luyện, VAPT vượt VPT tới 50% về hiệu năng. Đồng thời, VAPT vượt qua cả phương pháp tinh chỉnh toàn phần trên các bộ benchmark tiêu chuẩn. 

Ý nghĩa chiến lược 

VAPT có ý nghĩa chiến lược đối với: 

  • Hệ thống AI y khoa với dữ liệu gán nhãn hạn chế 
  • Triển khai mô hình trên hạ tầng tính toán giới hạn 
  • Cá nhân hóa mô hình nền tảng cho doanh nghiệp

Bằng việc kết hợp tính chặt chẽ về mặt lý thuyết với hiệu quả triển khai thực tiễn, VAPT góp phần thúc đẩy sứ mệnh của chúng tôi trong việc cung cấp các hệ thống AI hiệu năng cao trong những điều kiện vận hành thực tế. 

2. One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning 

Link công trình nghiên cứu: https://arxiv.org/pdf/2509.24483 

Trivita AI - ICLR 2026 (2)

Hướng tiếp cận mới cho Học liên tục (Continual Learning – CL) 

Học liên tục nhằm giúp mô hình học thêm nhiệm vụ mới mà không quên kiến thức cũ. Đây là yêu cầu thiết yếu trong môi trường dữ liệu phân tán và nhạy cảm như y tế. 
Các phương pháp dựa trên prompt gần đây đạt hiệu năng cao trong CL nhưng thường phân bổ prompt riêng cho từng nhiệm vụ, dẫn đến gia tăng tham số và chi phí tính toán. 

Đề xuất: SMoPE (Sparse Mixture of Prompt Experts) 

SMoPE là một khung MoE thưa (Sparse Mixture of Experts), duy trì một prompt dùng chung duy nhất nhưng cấu trúc thành nhiều expert. 
Đặc điểm chính: 

  • Kiến trúc prompt dùng chung 
  • Kích hoạt thưa (sparse activation) theo đầu vào 
  • Giảm đáng kể số tham số 
  • Giảm chi phí tính toán tới 50%

SMoPE vượt trội các phương pháp prompt theo từng nhiệm vụ dù chỉ sử dụng một prompt duy nhất và đạt hoặc vượt mức state-of-the-art hiện tại. 

Ý nghĩa chiến lược 

SMoPE mở ra khả năng: 

  • Xây dựng hệ thống AI học suốt đời 
  • Cập nhật mô hình liên tục trong môi trường bảo mật dữ liệu 
  • Triển khai nền tảng AI doanh nghiệp có khả năng thích nghi dài hạn

Hai công trình tại ICLR 2026 không chỉ thể hiện năng lực nghiên cứu nền tảng của Trivita AI mà còn cho thấy chiến lược phát triển công nghệ dựa trên chiều sâu lý thuyết và khả năng chuyển hóa vào sản phẩm.
Trivita AI tiếp tục theo đuổi định hướng xây dựng AI hiệu quả tham số, thích nghi linh hoạt và có khả năng triển khai thực tế trong các môi trường dữ liệu khắt khe nhất. 

Bài viết mới nhất