14/10/2025
Trước thực trạng chẩn đoán ung thư tuyến giáp còn phụ thuộc nhiều vào tính chủ quan và trình độ chuyên môn cao từ bác sĩ, VNPT AI đã phối hợp cùng Bệnh viện Nội tiết Trung ương phát triển ThyroidXL – bộ dữ liệu siêu âm công khai lớn nhất hiện nay. Đây là nền tảng vững chắc để phát triển các thuật toán học sâu (Deep Learning) hỗ trợ bác sĩ đưa ra quyết định lâm sàng chính xác hơn.

Chẩn đoán nhân tuyến giáp qua siêu âm là một quy trình mang tính chủ quan cao và đòi hỏi trình độ chuyên môn lớn từ bác sĩ chẩn đoán hình ảnh. Để hỗ trợ các bác sĩ, các hệ thống chẩn đoán hỗ trợ bằng máy tính (Computer-Aided Diagnosis – CAD) đã được phát triển nhằm cung cấp ý kiến tham khảo thứ hai. Mặc dù đạt được nhiều tiến bộ, việc thiếu các bộ dữ liệu y khoa công khai đã dẫn đến sự không thống nhất trong phương pháp đánh giá, gây khó khăn cho việc so sánh kết quả giữa các nghiên cứu. Nhằm giải quyết thách thức này, đội ngũ chuyên gia từ VNPT AI đã phối hợp cùng Bệnh viện Nội tiết Trung ương tiến hành nghiên cứu phát triển AI hỗ trợ chẩn đoán ung thư tuyến giáp dựa trên ThyroidXL – bộ dữ liệu công khai lớn nhất hiện nay phục vụ chẩn đoán nốt tuyến giáp xét trên cả số lượng bệnh nhân và khối lượng hình ảnh.
Ung thư tuyến giáp là vấn đề sức khỏe có tỷ lệ mắc ngày càng tăng, đòi hỏi quy trình chẩn đoán chính xác để tránh can thiệp quá mức đối với các trường hợp lành tính. Siêu âm (US) là phương pháp phổ biến nhất nhờ tính tiếp cận và chi phí thấp, nhưng việc diễn giải hình ảnh yêu cầu sự hiểu biết sâu sắc về giải phẫu, khiến quy trình này trở nên tốn thời gian và mang tính chủ quan.
Dù các hệ thống CAD hiện đại đã đạt được hiệu năng tiệm cận chuyên gia, việc phát triển các hệ thống này vẫn bị cản trở bởi số lượng hạn chế các bộ dữ liệu công khai do các yếu tố kỹ thuật, đạo đức và pháp lý. Sự thiếu hụt này dẫn đến các phương pháp xác thực không đồng nhất, gây khó khăn cho việc so sánh hiệu quả giữa các nghiên cứu.
ThyroidXL bao gồm 11.635 hình ảnh siêu âm B-mode từ 4.093 bệnh nhân, quy mô lớn nhất hiện nay so với các nguồn công khai như DDTI, TN3K hay TN-SCUI. Quy trình xây dựng bộ dữ liệu của đội ngũ VNPT AI tuân thủ các tiêu chuẩn lâm sàng nghiêm ngặt:

Quy trình xây dựng bộ dữ liệu ThyroidXL được thực hiện dựa trên việc tuân thủ nghiêm ngặt các tiêu chuẩn đạo đức và pháp lý trong nghiên cứu y sinh. Trước khi tiến hành ghi hình siêu âm, các bệnh nhân đáp ứng tiêu chuẩn lựa chọn lâm sàng đều được cung cấp thông tin chi tiết về mục đích nghiên cứu và thực hiện ký văn bản đồng thuận cho phép sử dụng dữ liệu vào mục đích khoa học. Nhằm bảo vệ quyền riêng tư, các vùng ảnh không phải siêu âm có chứa thông tin bệnh nhân được cắt bỏ trong giai đoạn tiền xử lý, đồng thời mã định danh bệnh nhân được ánh xạ lại (remapped) nhằm đảm bảo tính bảo mật dữ liệu. Tất cả các dữ liệu thu thập được đều được lưu trữ trong lãnh thổ Việt Nam, đảm bảo tuân thủ Luật dữ liệu.
Nghiên cứu triển khai thử nghiệm các thuật toán học sâu tiên tiến nhất trên ba tác vụ cốt lõi nhằm thiết lập hiệu năng cơ sở:
Thực nghiệm cho thấy việc áp dụng cơ chế bỏ phiếu đa số có trọng số (Weighted Majority Voting) giúp cải thiện đáng kể các chỉ số đánh giá ở cấp độ bệnh nhân. Tuy nhiên, các chuyên gia lưu ý rằng mô hình thường bộc lộ sự đánh đổi giữa độ nhạy và độ đặc hiệu; việc lựa chọn mô hình cần dựa trên ưu tiên lâm sàng để cân bằng giữa việc tránh bỏ sót ca bệnh và hạn chế chẩn đoán nhầm.

Với quy mô và chất lượng dán nhãn chuyên gia, ThyroidXL là đóng góp quan trọng của VNPT AItrong việc thúc đẩy nghiên cứu chẩn đoán hình ảnh y tế. Bộ dữ liệu này hiện đã được công khai nhằm hỗ trợ cộng đồng khoa học phát triển các giải pháp AI tin cậy, góp phần nâng cao hiệu quả điều trị bệnh lý tuyến giáp tại Việt Nam và quốc tế. Điều này cũng khẳng định tính hiệu quả, ứng dụng thực tiễn của AI trong Y tế, mang lại giá trị thiết thực cho cả bác sĩ và bệnh nhân.
Tin mới nhất
VNPT AI
Hãy trở thành đối tác của chúng tôi ngay hôm nay để được sử dụng những dịch vụ hàng đầu!
Gửi lời nhắnĐánh Giá