Trivita AI đột phá về Efficent AI với 2 công trình tác giả chính tại ICLR 2026

Tháng 2 27, 2026

Công trình nghiên cứu

Trivita AI trân trọng công bố hai công trình nghiên cứu đột phá về Efficient AI (AI hiệu quả) với vị trí tác giả chính của Lê Đức Minh đã được chấp nhận tại International Conference on Learning Representations (ICLR) 2026. Đây là dấu ấn quan trọng khẳng định năng lực của đội ngũ Trivita AI trong việc tối ưu hóa hiệu suất mô hình trên nguồn lực tài nguyên hạn chế.
Sự kiện này đánh dấu một bước tiến quan trọng trong chiến lược phát triển nghiên cứu nền tảng của Trivita AI, đồng thời khẳng định năng lực kết nối giữa lý thuyết học thuật và triển khai công nghệ thực tiễn, đặc biệt trong các lĩnh vực yêu cầu độ tin cậy cao như y tế.

1. Revisit Visual Prompt Tuning: The Expressiveness of Prompt Experts

Link công trình nghiên cứu: https://arxiv.org/pdf/2501.18936

Tái định nghĩa khả năng biểu diễn của Prompt trong mô hình thị giác nền tảng

Các mô hình thị giác nền tảng (foundation vision models) được tiền huấn luyện trên tập dữ liệu lớn đã cho thấy khả năng khái quát hóa vượt trội. Tuy nhiên, việc tinh chỉnh toàn bộ mô hình (full fine-tuning) đòi hỏi chi phí tính toán lớn.
Visual Prompt Tuning (VPT) là một phương pháp thích nghi hiệu quả tham số (parameter-efficient adaptation), bổ sung các token prompt có thể học được vào đầu vào. Dù đạt hiệu quả thực nghiệm cao, phân tích lý thuyết gần đây dựa trên Mixture of Experts (MoE – mô hình hỗn hợp chuyên gia) cho thấy mỗi prompt expert trong VPT hoạt động như một hàm hằng theo đầu vào, làm hạn chế khả năng biểu diễn (expressiveness).

Đề xuất: Visual Adaptive Prompt Tuning (VAPT)

Chúng tôi đề xuất Visual Adaptive Prompt Tuning (VAPT), tích hợp các prompt expert thích nghi theo đầu vào (input-adaptive prompt experts).
Những điểm nổi bật:

Cải thiện khả năng biểu diễn
Chỉ tăng 0.6% chi phí tính toán so với VPT
Sử dụng ít tham số huấn luyện hơn
Chứng minh đạt hiệu quả mẫu tối ưu (optimal sample efficiency)

Trong bối cảnh dữ liệu hạn chế, chỉ sử dụng 1% dữ liệu huấn luyện, VAPT vượt VPT tới 50% về hiệu năng. Đồng thời, VAPT vượt qua cả phương pháp tinh chỉnh toàn phần trên các bộ benchmark tiêu chuẩn.

Ý nghĩa chiến lược

VAPT có ý nghĩa chiến lược đối với:

Hệ thống AI y khoa với dữ liệu gán nhãn hạn chế
Triển khai mô hình trên hạ tầng tính toán giới hạn
Cá nhân hóa mô hình nền tảng cho doanh nghiệp

Bằng việc kết hợp tính chặt chẽ về mặt lý thuyết với hiệu quả triển khai thực tiễn, VAPT góp phần thúc đẩy sứ mệnh của chúng tôi trong việc cung cấp các hệ thống AI hiệu năng cao trong những điều kiện vận hành thực tế.

2. One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

Link công trình nghiên cứu: https://arxiv.org/pdf/2509.24483

Hướng tiếp cận mới cho Học liên tục (Continual Learning – CL)

Học liên tục nhằm giúp mô hình học thêm nhiệm vụ mới mà không quên kiến thức cũ. Đây là yêu cầu thiết yếu trong môi trường dữ liệu phân tán và nhạy cảm như y tế.
Các phương pháp dựa trên prompt gần đây đạt hiệu năng cao trong CL nhưng thường phân bổ prompt riêng cho từng nhiệm vụ, dẫn đến gia tăng tham số và chi phí tính toán.

Đề xuất: SMoPE (Sparse Mixture of Prompt Experts)

SMoPE là một khung MoE thưa (Sparse Mixture of Experts), duy trì một prompt dùng chung duy nhất nhưng cấu trúc thành nhiều expert.
Đặc điểm chính:

Kiến trúc prompt dùng chung
Kích hoạt thưa (sparse activation) theo đầu vào
Giảm đáng kể số tham số
Giảm chi phí tính toán tới 50%

SMoPE vượt trội các phương pháp prompt theo từng nhiệm vụ dù chỉ sử dụng một prompt duy nhất và đạt hoặc vượt mức state-of-the-art hiện tại.

Ý nghĩa chiến lược

SMoPE mở ra khả năng:

Xây dựng hệ thống AI học suốt đời
Cập nhật mô hình liên tục trong môi trường bảo mật dữ liệu
Triển khai nền tảng AI doanh nghiệp có khả năng thích nghi dài hạn

Hai công trình tại ICLR 2026 không chỉ thể hiện năng lực nghiên cứu nền tảng của Trivita AI mà còn cho thấy chiến lược phát triển công nghệ dựa trên chiều sâu lý thuyết và khả năng chuyển hóa vào sản phẩm.
Trivita AI tiếp tục theo đuổi định hướng xây dựng AI hiệu quả tham số, thích nghi linh hoạt và có khả năng triển khai thực tế trong các môi trường dữ liệu khắt khe nhất.

Trivita AI đột phá về Efficent AI với 2 công trình tác giả chính tại ICLR 2026

1. Revisit Visual Prompt Tuning: The Expressiveness of Prompt Experts

Tái định nghĩa khả năng biểu diễn của Prompt trong mô hình thị giác nền tảng

Đề xuất: Visual Adaptive Prompt Tuning (VAPT)

Ý nghĩa chiến lược

2. One-Prompt Strikes Back: Sparse Mixture of Experts for Prompt-based Continual Learning

Hướng tiếp cận mới cho Học liên tục (Continual Learning – CL)

Đề xuất: SMoPE (Sparse Mixture of Prompt Experts)

Ý nghĩa chiến lược

Xem thêm các bài viết