Đọc hồ sơ đa nguồn
Tiếp nhận PDF, ảnh scan, Excel, Word và dữ liệu từ bệnh viện.
Chuẩn hóa dữ liệu
Đưa kết quả khám về cùng một cấu trúc để quản lý lịch sử sức khỏe.
Cảnh báo kịp thời
Phát hiện chỉ số bất thường, hồ sơ thiếu, lịch tái khám và nhóm nguy cơ.
Quản trị an toàn
Phân quyền, nhật ký truy cập, mã hóa và tuân thủ yêu cầu dữ liệu nhạy cảm.
01
1. Yêu cầu nghiệp vụ
Một hãng hàng không tổ chức khám sức khỏe định kỳ cho nhân viên, nhưng mỗi đợt khám có thể được thực hiện tại các bệnh viện hoặc phòng khám khác nhau. Mỗi đơn vị y tế trả kết quả theo một biểu mẫu riêng: PDF, ảnh scan, Excel, Word, bản in quét lại hoặc tệp xuất từ hệ thống bệnh viện.
Điều này khiến việc quản lý lịch sử khám chữa bệnh, tiền sử bệnh, tình trạng sức khỏe hiện tại và nguy cơ sức khỏe của nhân viên trở nên khó khăn. Dữ liệu bị phân mảnh, khó tìm kiếm, khó thống kê, khó cảnh báo sớm và gần như không thể tạo báo cáo quản trị nhanh nếu không xử lý thủ công.
Giải pháp đề xuất là xây dựng một nền tảng phần mềm có khả năng:
- Đọc được nhiều loại tệp hồ sơ y tế từ nhiều bệnh viện khác nhau.
- Trích xuất thông tin quan trọng bằng OCR và AI.
- Chuẩn hóa dữ liệu về một mô hình hồ sơ sức khỏe thống nhất.
- Lưu lịch sử khám sức khỏe theo từng nhân viên.
- Tìm kiếm nhanh theo nhân viên, bệnh, chỉ số, phòng ban, kỳ khám.
- Thống kê tình hình sức khỏe toàn công ty.
- Tự động cảnh báo các trường hợp bất thường hoặc có nguy cơ.
- Hỗ trợ quản lý đưa ra quyết định về bố trí công việc, lịch làm việc, tái khám, tư vấn y tế hoặc kết nối chuyên gia.
02
2. Mục tiêu sản phẩm
2.1. Mục tiêu nghiệp vụ
- Tạo một kho dữ liệu sức khỏe tập trung cho toàn bộ nhân viên.
- Chuẩn hóa dữ liệu khám sức khỏe từ nhiều bệnh viện, nhiều định dạng, nhiều mẫu biểu.
- Giảm thời gian nhập liệu và tra cứu hồ sơ y tế.
- Giúp bộ phận quản lý, nhân sự và y tế nội bộ theo dõi sức khỏe nhân viên kịp thời.
- Phát hiện sớm các vấn đề sức khỏe có thể ảnh hưởng đến năng lực làm việc.
- Hỗ trợ lập báo cáo theo kỳ khám, phòng ban, chức danh, nhóm nguy cơ.
- Tạo nền tảng dữ liệu phục vụ phân tích dài hạn về sức khỏe lao động.
2.2. Mục tiêu kỹ thuật
- Xây dựng hệ thống nhập liệu linh hoạt cho PDF, ảnh, Excel, Word và dữ liệu API.
- Tạo pipeline xử lý gồm: tải lên, OCR, trích xuất tự động bằng AI, chuẩn hóa, kiểm duyệt, lưu trữ.
- Thiết kế cơ sở dữ liệu đủ chặt để lưu hồ sơ sức khỏe theo thời gian.
- Tối ưu tìm kiếm nhanh trên dữ liệu y tế có cấu trúc và văn bản gốc.
- Tích hợp bộ xử lý cảnh báo dựa trên quy tắc và có thể mở rộng sang chấm điểm rủi ro bằng AI.
- Bảo mật dữ liệu cá nhân và dữ liệu sức khỏe ở mức cao.
03
3. Đối tượng sử dụng
3.1. Quản trị hệ thống
- Quản lý người dùng.
- Phân quyền truy cập.
- Cấu hình danh mục bệnh, chỉ số xét nghiệm, ngưỡng cảnh báo.
- Theo dõi nhật ký hệ thống.
3.2. Bộ phận y tế nội bộ
- Kiểm tra dữ liệu do hệ thống trích xuất tự động.
- Xác nhận thông tin sức khỏe.
- Tạo cảnh báo y tế.
- Theo dõi các ca cần tái khám hoặc tư vấn chuyên khoa.
3.3. Bộ phận nhân sự/quản lý
- Xem bảng điều khiển tổng quan.
- Tra cứu tình trạng sức khỏe theo phạm vi được phân quyền.
- Nhận cảnh báo liên quan đến khả năng làm việc hoặc bố trí ca.
- Xuất báo cáo thống kê phục vụ quản trị.
3.4. Nhân viên
- Xem hồ sơ sức khỏe cá nhân.
- Tự cập nhật tình trạng sức khỏe, triệu chứng, nghỉ ốm.
- Nhận khuyến nghị tái khám hoặc tư vấn.
- Quản lý đồng ý xử lý dữ liệu cá nhân nếu hệ thống triển khai cơ chế đồng ý xử lý dữ liệu.
3.5. Chuyên gia/bác sĩ tư vấn
- Chỉ truy cập hồ sơ được phân quyền hoặc được nhân viên đồng ý.
- Đưa ra tư vấn ban đầu hoặc hướng khám chuyên sâu.
- Không thay thế quy trình khám, chẩn đoán chính thức tại cơ sở y tế.
04
4. Phạm vi chức năng chính
4.1. Module nhập hồ sơ
Chức năng:
- Tải lên hồ sơ theo từng nhân viên hoặc theo lô.
- Hỗ trợ các định dạng:
- PDF có text.
- PDF scan.
- Ảnh JPG/PNG.
- Excel.
- Word.
- Tệp dữ liệu chuẩn từ bệnh viện nếu có API.
- Tự động nhận diện loại hồ sơ:
- Phiếu khám tổng quát.
- Phiếu xét nghiệm máu.
- Phiếu xét nghiệm nước tiểu.
- Kết quả chẩn đoán hình ảnh.
- Kết luận sức khỏe.
- Giấy nghỉ ốm hoặc giấy xác nhận y tế.
- Gắn hồ sơ vào đúng nhân viên bằng mã nhân viên, họ tên, ngày sinh, số định danh hoặc thông tin đối chiếu.
Yêu cầu quan trọng:
- Luôn lưu tệp gốc để đối chiếu.
- Luôn có trạng thái xử lý: mới tải lên, đang OCR, đã trích xuất, cần kiểm duyệt, đã xác nhận, lỗi.
- Cần cơ chế phát hiện trùng hồ sơ.
4.2. Module OCR và trích xuất AI
Chức năng:
- OCR văn bản từ ảnh/PDF scan.
- Trích xuất dữ liệu có cấu trúc từ hồ sơ y tế.
- Nhận diện bảng xét nghiệm và các chỉ số trong bảng.
- Nhận diện đơn vị đo, khoảng tham chiếu, kết quả bất thường.
- Tóm tắt nội dung hồ sơ.
- Gán độ tin cậy cho từng trường dữ liệu được trích xuất.
Dữ liệu cần trích xuất:
- Thông tin nhân viên/bệnh nhân.
- Mã nhân viên nếu có.
- Họ tên, ngày sinh, giới tính.
- Ngày khám.
- Tên bệnh viện/phòng khám.
- Khoa/phòng thực hiện.
- Chẩn đoán hoặc kết luận.
- Tiền sử bệnh.
- Dị ứng.
- Thuốc đang dùng.
- Chỉ số sinh tồn: chiều cao, cân nặng, BMI, huyết áp, nhịp tim.
- Chỉ số xét nghiệm: đường huyết, mỡ máu, men gan, công thức máu, chức năng thận.
- Kết quả chẩn đoán hình ảnh.
- Kết luận đủ điều kiện/không đủ điều kiện làm việc nếu có.
- Khuyến nghị tái khám.
Nguyên tắc:
- AI không được tự ý sửa kết quả y tế.
- AI chỉ trích xuất, chuẩn hóa, tóm tắt và gợi ý.
- Các trường quan trọng cần có bước xác nhận bởi người có thẩm quyền.
4.3. Module kiểm duyệt dữ liệu
Sau khi công cụ trích xuất dữ liệu hoàn tất, hệ thống cần màn hình cho nhân viên y tế hoặc người được phân quyền kiểm tra:
- So sánh tệp gốc với dữ liệu đã trích xuất.
- Sửa các trường bị nhận diện sai.
- Xác nhận dữ liệu trước khi đưa vào hồ sơ chính thức.
- Gắn nhãn lỗi để cải thiện mô hình trích xuất.
- Ghi nhận người kiểm duyệt, thời điểm kiểm duyệt, nội dung thay đổi.
Đây là module rất quan trọng vì dữ liệu y tế có rủi ro cao. Không nên để dữ liệu trích xuất tự động đi thẳng vào hồ sơ chính thức mà không có kiểm soát.
4.4. Module hồ sơ sức khỏe nhân viên
Mỗi nhân viên có một hồ sơ sức khỏe thống nhất, gồm:
- Thông tin định danh nhân viên.
- Lịch sử khám theo thời gian.
- Tiền sử bệnh.
- Bệnh mạn tính.
- Dị ứng.
- Thuốc đang dùng.
- Chỉ số sức khỏe theo từng kỳ.
- Kết luận sức khỏe từng lần khám.
- Cảnh báo đang mở.
- Khuyến nghị tái khám.
- Tệp hồ sơ gốc liên quan.
Màn hình hồ sơ cần hỗ trợ:
- Timeline lịch sử khám.
- Biểu đồ diễn biến chỉ số theo thời gian.
- Bộ lọc theo kỳ khám, bệnh viện, loại xét nghiệm.
- Tóm tắt tự động theo từng giai đoạn.
- Nút xuất báo cáo cá nhân.
4.5. Module tìm kiếm và truy xuất nhanh
Người dùng có thể tìm kiếm theo:
- Mã nhân viên.
- Họ tên.
- Phòng ban.
- Chức danh.
- Nhóm công việc.
- Kỳ khám.
- Tên bệnh viện.
- Tên bệnh/chẩn đoán.
- Chỉ số xét nghiệm bất thường.
- Nhóm nguy cơ sức khỏe.
Ví dụ truy vấn:
- Danh sách nhân viên có huyết áp cao trong kỳ khám gần nhất.
- Nhân viên có men gan tăng trong 12 tháng gần đây.
- Tỷ lệ BMI thừa cân theo từng phòng ban.
- Những người chưa có kết quả khám năm nay.
- Nhân viên cần tái khám chuyên khoa tim mạch.
Nên hỗ trợ cả:
- Tìm kiếm có cấu trúc bằng bộ lọc.
- Tìm kiếm toàn văn trong hồ sơ gốc.
- Hỏi đáp ngôn ngữ tự nhiên bằng AI trong phạm vi được phân quyền.
4.6. Module thống kê và bảng điều khiển
Bảng điều khiển nên có:
- Tổng số nhân viên.
- Số nhân viên đã khám/chưa khám trong kỳ.
- Tỷ lệ hồ sơ đã xử lý/đang chờ kiểm duyệt/lỗi.
- Phân bố tình trạng sức khỏe: bình thường, cần theo dõi, nguy cơ cao.
- Top nhóm bệnh phổ biến.
- Top chỉ số bất thường.
- Thống kê theo phòng ban, chức danh, độ tuổi, giới tính.
- Xu hướng sức khỏe qua các kỳ khám.
- Danh sách cảnh báo ưu tiên cao.
Nhóm thống kê y tế gợi ý:
- Huyết áp.
- Tim mạch.
- Hô hấp.
- Gan mật.
- Thận tiết niệu.
- Chuyển hóa: đường huyết, mỡ máu, BMI.
- Thị lực.
- Thính lực.
- Cơ xương khớp.
- Tâm lý/căng thẳng nếu có dữ liệu.
- Bệnh truyền nhiễm hoặc dấu hiệu cần cách ly nếu có chính sách nội bộ.
4.7. Module cảnh báo sức khỏe
Hệ thống cần tạo cảnh báo dựa trên:
- Ngưỡng y tế cấu hình.
- Sự thay đổi bất thường so với lịch sử cá nhân.
- Kết luận từ bác sĩ/bệnh viện.
- Tình trạng tự cập nhật từ nhân viên.
- Hạn tái khám.
- Thiếu hồ sơ bắt buộc.
Các mức cảnh báo:
- Thấp: cần theo dõi.
- Trung bình: cần tái kiểm tra hoặc xác minh.
- Cao: cần xử lý sớm, thông báo bộ phận y tế/quản lý có thẩm quyền.
- Khẩn cấp: cần liên hệ y tế ngay theo quy trình nội bộ.
Ví dụ cảnh báo:
- Huyết áp vượt ngưỡng nhiều lần.
- Men gan tăng mạnh so với kỳ trước.
- Đường huyết bất thường.
- BMI tăng nhanh.
- Kết luận không đủ điều kiện sức khỏe tạm thời.
- Nhân viên tự báo triệu chứng kéo dài.
- Nhân viên chưa tái khám sau khuyến nghị.
Lưu ý: Cảnh báo nên được xem là công cụ hỗ trợ, không phải kết luận y khoa cuối cùng.
4.8. Module tự cập nhật sức khỏe của nhân viên
Nhân viên có tài khoản riêng để:
- Cập nhật tình trạng sức khỏe hiện tại.
- Khai báo triệu chứng.
- Gửi giấy nghỉ ốm hoặc kết quả khám ngoài hệ thống.
- Theo dõi khuyến nghị tái khám.
- Nhận nhắc lịch khám.
- Quản lý đồng ý xử lý dữ liệu nếu áp dụng.
Cần tránh biến module này thành công cụ giám sát quá mức. Chỉ nên thu thập dữ liệu cần thiết, có mục đích rõ ràng, có phân quyền và có thông báo minh bạch.
4.9. Module báo cáo thông minh
Công cụ phân tích có thể hỗ trợ tạo:
- Báo cáo sức khỏe tổng quan toàn công ty.
- Báo cáo theo phòng ban.
- Báo cáo theo kỳ khám.
- Báo cáo các nhóm nguy cơ.
- Tóm tắt hồ sơ cá nhân.
- Gợi ý danh sách nhân viên cần ưu tiên tái khám.
Ví dụ báo cáo:
- "Trong kỳ khám Q2/2026, nhóm kỹ thuật mặt đất có tỷ lệ BMI cao hơn trung bình công ty."
- "Có 18 nhân viên cần theo dõi huyết áp, trong đó 5 người có kết quả bất thường lặp lại từ 2 kỳ khám liên tiếp."
- "Có 12 hồ sơ cần kiểm duyệt do hệ thống trích xuất chỉ số xét nghiệm với độ tin cậy thấp."
4.10. Module kết nối chuyên gia
Với nhân viên có vấn đề sức khỏe, nền tảng có thể:
- Đề xuất chuyên khoa phù hợp.
- Gợi ý lịch tư vấn.
- Chuyển hồ sơ tóm tắt cho bác sĩ khi có sự đồng ý phù hợp.
- Ghi nhận kết quả tư vấn.
Không nên để hệ thống tự chẩn đoán hoặc tự chỉ định điều trị. Vai trò đúng của hệ thống là phân luồng, cảnh báo và hỗ trợ kết nối.
05
5. Kiến trúc tổng thể đề xuất
Người dùng
|-- Quản trị
|-- Y tế nội bộ
|-- Nhân sự/quản lý
|-- Nhân viên
|
v
Web/App giao diện
|
v
API Gateway / Backend
|
+-- Module Tải lên hồ sơ
+-- OCR Service
+-- AI Extraction Service
+-- Data Normalization Service
+-- Review & Approval Service
+-- Health Record Service
+-- Search Service
+-- Alert Bộ xử lý
+-- Reporting Service
+-- Notification Service
|
v
Cơ sở dữ liệu
|-- Relational DB cho dữ liệu có cấu trúc
|-- Object Storage cho tệp gốc
|-- Search Index cho tìm kiếm nhanh
|-- Audit Log cho nhật ký truy cập/thay đổi
06
6. Chuẩn hóa dữ liệu y tế
Để dữ liệu từ nhiều bệnh viện có thể dùng chung, cần chuẩn hóa các lớp dữ liệu sau:
- Tên xét nghiệm.
- Đơn vị đo.
- Khoảng tham chiếu.
- Tên bệnh/chẩn đoán.
- Nhóm bệnh.
- Mức độ bất thường.
- Kết luận đủ điều kiện/không đủ điều kiện làm việc.
- Tên bệnh viện, phòng khám.
Gợi ý chuẩn:
- ICD-10 hoặc ICD-11 cho mã bệnh/chẩn đoán.
- LOINC cho xét nghiệm nếu cần tương thích quốc tế.
- HL7 FHIR nếu cần tích hợp sâu với hệ thống bệnh viện hoặc hồ sơ sức khỏe điện tử.
Trong giai đoạn MVP, có thể chưa cần triển khai đầy đủ các chuẩn quốc tế, nhưng nên thiết kế database có trường standard_code để mở rộng sau này.
07
7. Luồng xử lý hồ sơ
8.1. Luồng tải lên và xử lý
Tải lên hồ sơ
↓
Kiểm tra định dạng và virus/malware
↓
Lưu tệp gốc
↓
OCR nếu cần
↓
AI trích xuất dữ liệu
↓
Chuẩn hóa tên chỉ số, đơn vị, mã bệnh
↓
Tính độ tin cậy
↓
Đưa vào hàng chờ kiểm duyệt
↓
Người có thẩm quyền xác nhận
↓
Ghi vào hồ sơ sức khỏe chính thức
↓
Chạy quy tắc cảnh báo
↓
Cập nhật bảng điều khiển và báo cáo
8.2. Luồng cảnh báo
Dữ liệu mới được xác nhận
↓
Alert Bộ xử lý kiểm tra quy tắc
↓
So sánh với ngưỡng chuẩn và lịch sử cá nhân
↓
Tạo cảnh báo nếu bất thường
↓
Gửi thông báo đến người được phân quyền
↓
Theo dõi trạng thái xử lý
↓
Đóng cảnh báo khi có kết quả xử lý
08
8. Tự động hóa và phân tích trong hệ thống
Các công cụ tự động nên được sử dụng ở các điểm sau:
- OCR nâng cao cho hồ sơ scan khó đọc.
- Nhận diện bố cục biểu mẫu bệnh viện.
- Trích xuất trường dữ liệu y tế.
- Chuẩn hóa tên xét nghiệm và tên bệnh.
- Tóm tắt hồ sơ dài thành nội dung dễ đọc.
- Phát hiện xu hướng bất thường.
- Hỗ trợ hỏi đáp dữ liệu bằng ngôn ngữ tự nhiên.
- Gợi ý báo cáo quản trị.
Các giới hạn cần đặt ra:
- Hệ thống không tự chẩn đoán thay bác sĩ.
- Hệ thống không tự quyết định nhân viên có được làm việc hay không.
- Hệ thống không được hiển thị dữ liệu vượt quyền truy cập.
- Hệ thống cần trả lời dựa trên dữ liệu có nguồn, có trích dẫn hồ sơ liên quan.
- Với dữ liệu độ tin cậy thấp, Hệ thống phải yêu cầu kiểm duyệt thay vì đưa ra kết luận chắc chắn.
9.1. Đánh giá lại khi hồ sơ bệnh viện là tài liệu sạch
Nếu hồ sơ trả về từ bệnh viện là tài liệu được xuất trực tiếp từ phần mềm, chất lượng xử lý sẽ tốt hơn rất nhiều so với trường hợp hồ sơ scan mờ hoặc ảnh chụp thủ công. Khi đó, hệ thống không nên xử lý mọi tài liệu như ảnh để OCR từ đầu. Cách làm hợp lý hơn là đọc trực tiếp cấu trúc có sẵn trong tệp.
Với PDF xuất từ phần mềm, nhiều trường hợp bên trong đã có lớp văn bản, bảng và bố cục rõ ràng. Hệ thống có thể dùng bộ đọc PDF để lấy chữ, dòng, bảng, trang và tọa độ văn bản. Với Excel và Word, dữ liệu còn thuận lợi hơn vì vốn đã được lưu theo ô, đoạn, bảng hoặc heading.
Chiến lược xử lý nên là:
Đọc trực tiếp dữ liệu trong tệp
↓
Phân tích bảng, dòng, cột và bố cục
↓
Trích xuất thông tin y tế theo schema chuẩn
↓
Chuẩn hóa tên chỉ số, đơn vị đo, nhóm bệnh
↓
Kiểm tra bằng quy tắc nghiệp vụ và y tế
↓
Chỉ dùng OCR khi tài liệu là scan hoặc ảnh
Với hướng này, OCR không còn là năng lực chính cho mọi trường hợp, mà là lớp dự phòng. Phần quan trọng hơn nằm ở document parsing, table extraction, trích xuất JSON theo schema và kiểm tra tính hợp lệ của dữ liệu.
9.2. Khả năng dùng model AI mã nguồn mở
Hệ thống có thể dùng các model và thư viện mã nguồn mở để đọc, phân tích và trích xuất dữ liệu từ hồ sơ y tế. Đây là hướng đáng cân nhắc vì dữ liệu sức khỏe là dữ liệu nhạy cảm; việc chạy nội bộ giúp giảm rủi ro đưa dữ liệu ra ngoài.
Tuy nhiên, không nên kỳ vọng một model duy nhất xử lý toàn bộ bài toán. Kiến trúc tốt hơn là ghép nhiều lớp xử lý:
- Lớp đọc tài liệu: dùng parser cho PDF, Word, Excel trước khi nghĩ đến OCR.
- Lớp OCR dự phòng: dùng cho PDF scan hoặc ảnh.
- Lớp hiểu bố cục: nhận diện bảng xét nghiệm, tiêu đề, vùng kết luận, thông tin hành chính.
- Lớp trích xuất có cấu trúc: chuyển nội dung đọc được thành JSON theo schema y tế thống nhất.
- Lớp kiểm tra: rà soát ngày tháng, đơn vị đo, ngưỡng chỉ số, dữ liệu thiếu hoặc mâu thuẫn.
- Lớp kiểm duyệt: đưa các trường có độ tin cậy thấp cho người phụ trách xác nhận.
Các công cụ có thể cân nhắc:
- Docling: phù hợp để chuyển PDF, DOCX và tài liệu nhiều bố cục thành dữ liệu có cấu trúc như Markdown hoặc JSON.
- PyMuPDF, pdfplumber: phù hợp để đọc PDF có text, tọa độ chữ và bảng.
- openpyxl: phù hợp để đọc Excel.
- python-docx hoặc mammoth: phù hợp để đọc Word.
- PaddleOCR hoặc Tesseract: phù hợp cho OCR khi gặp tài liệu scan hoặc ảnh.
- PaddleOCR-VL, Qwen-VL, InternVL: phù hợp khi cần model thị giác-ngôn ngữ để đọc tài liệu có bố cục phức tạp.
- LayoutLM/LayoutLMv3: phù hợp nếu cần fine-tune cho bài toán hiểu biểu mẫu và bố cục tài liệu.
- LLM mã nguồn mở như Qwen, Llama, Mistral: phù hợp cho bước trích xuất JSON, tóm tắt, chuẩn hóa tên chỉ số và hỗ trợ hỏi đáp dữ liệu.
Với tài liệu bệnh viện sạch, pipeline nên ưu tiên:
Document parsing + Table extraction + LLM structured extraction + Validation
Cách này thường nhanh hơn, rẻ hơn và ổn định hơn so với việc biến toàn bộ trang thành ảnh rồi yêu cầu model nhìn lại từ đầu.
9.3. Mức độ khả thi thực tế
Với giả định hồ sơ là tài liệu sạch được xuất từ phần mềm bệnh viện, mức độ khả thi của hệ thống tăng rõ rệt:
- PDF có lớp text: khả thi cao.
- Excel: khả thi rất cao.
- Word: khả thi cao.
- PDF có bảng xét nghiệm: khả thi cao, nhưng cần xử lý bảng tốt.
- Kết luận y khoa dạng văn bản tự do: làm được, nhưng vẫn nên có người kiểm tra.
- Chuẩn hóa bệnh, chỉ số và đơn vị đo: làm được nếu có từ điển y tế, quy tắc mapping và dữ liệu mẫu đủ tốt.
Do đó, phiên bản MVP hoàn toàn có thể triển khai. Cách triển khai nên bắt đầu từ 5-10 mẫu hồ sơ phổ biến nhất, đo độ chính xác theo từng trường dữ liệu, sau đó mở rộng dần theo bệnh viện, mẫu biểu và nhóm xét nghiệm mới.
09
9. Bảo mật và quyền riêng tư
Dữ liệu sức khỏe là dữ liệu nhạy cảm. Hệ thống cần thiết kế bảo mật từ đầu.
Yêu cầu bắt buộc nên có:
- Đăng nhập an toàn.
- Phân quyền theo vai trò.
- Phân quyền theo phạm vi dữ liệu.
- Mã hóa dữ liệu khi lưu trữ.
- Mã hóa dữ liệu khi truyền tải.
- Nhật ký truy cập hồ sơ.
- Nhật ký chỉnh sửa dữ liệu.
- Cơ chế thu hồi quyền truy cập.
- Cơ chế ẩn danh hoặc giả danh dữ liệu khi dùng cho thống kê.
- Sao lưu và khôi phục dữ liệu.
- Chính sách lưu trữ, xóa hoặc hủy dữ liệu.
- Quy trình xử lý sự cố rò rỉ dữ liệu.
Vai trò truy cập gợi ý:
- Admin hệ thống: quản lý kỹ thuật, không mặc định được xem toàn bộ dữ liệu y tế chi tiết nếu không cần.
- Y tế nội bộ: xem và xác nhận dữ liệu y tế.
- HR/quản lý: xem thông tin tổng quan hoặc kết luận phù hợp với mục đích quản lý, hạn chế xem chi tiết nhạy cảm.
- Nhân viên: xem hồ sơ của chính mình.
- Chuyên gia/bác sĩ: chỉ xem hồ sơ được cấp quyền.
10
10. Cơ sở pháp lý cần lưu ý
Tại Việt Nam, cần đặc biệt lưu ý:
- Luật Bảo vệ dữ liệu cá nhân số 91/2025/QH15, ban hành ngày 26/06/2025, có hiệu lực từ 01/01/2026.
- Nghị định 356/2025/NĐ-CP, ban hành ngày 31/12/2025, có hiệu lực từ 01/01/2026, quy định chi tiết một số điều và biện pháp thi hành Luật Bảo vệ dữ liệu cá nhân.
- Nghị định 13/2023/NĐ-CP về bảo vệ dữ liệu cá nhân đã từng là nền tảng trước đó và cần kiểm tra hiệu lực/quan hệ với văn bản mới khi triển khai thực tế.
- Thông tư 13/2025/TT-BYT của Bộ Y tế hướng dẫn triển khai hồ sơ bệnh án điện tử.
Các yêu cầu pháp lý cần đưa vào thiết kế:
- Có mục đích xử lý dữ liệu rõ ràng.
- Có căn cứ xử lý và/hoặc sự đồng ý của chủ thể dữ liệu khi cần.
- Thông báo minh bạch cho nhân viên về dữ liệu nào được thu thập, dùng để làm gì, ai được xem.
- Chỉ thu thập dữ liệu cần thiết cho mục đích hợp pháp.
- Không dùng dữ liệu sức khỏe vượt quá mục đích đã thông báo.
- Có quy trình đáp ứng yêu cầu truy cập, chỉnh sửa, rút đồng ý, xóa dữ liệu nếu áp dụng.
- Có đánh giá tác động xử lý dữ liệu cá nhân đối với dữ liệu nhạy cảm.
Lưu ý: Phần này cần được rà soát bởi pháp chế hoặc đơn vị tư vấn pháp lý trước khi triển khai chính thức.
11
11. Phân tích nghiệp vụ cho hãng hàng không
Đối với ngành hàng không, sức khỏe nhân viên có liên quan trực tiếp đến an toàn vận hành. Vì vậy hệ thống cần hỗ trợ phân nhóm theo tính chất công việc:
- Phi công.
- Tiếp viên hàng không.
- Kỹ thuật bảo trì.
- Nhân viên mặt đất.
- Điều phối khai thác.
- Nhân viên văn phòng.
- Nhân viên làm ca/kíp.
Mỗi nhóm có thể có bộ chỉ số và cảnh báo khác nhau. Ví dụ:
- Phi công và tiếp viên cần theo dõi kỹ hơn các vấn đề tim mạch, thị lực, thính lực, thần kinh, tâm lý, giấc ngủ.
- Kỹ thuật mặt đất cần theo dõi cơ xương khớp, thính lực, bệnh nghề nghiệp, chấn thương.
- Nhân viên làm ca/kíp cần theo dõi mệt mỏi, rối loạn giấc ngủ, stress, bệnh chuyển hóa.
Hệ thống không nên chỉ trả lời câu hỏi "ai bị bệnh gì", mà cần hỗ trợ câu hỏi quản trị:
- Nhóm nhân sự nào có nguy cơ sức khỏe tăng?
- Vị trí nào cần khám chuyên sâu hơn?
- Kỳ khám nào có tỷ lệ bất thường cao?
- Có xu hướng bệnh nghề nghiệp nào đang hình thành không?
- Ai cần được nhắc tái khám trước khi bố trí lịch làm việc nhạy cảm?
12
12. MVP đề xuất
Phiên bản đầu tiên nên tập trung vào phạm vi vừa đủ để chứng minh giá trị:
13.1. Chức năng MVP
- Quản lý danh sách nhân viên.
- Tải lên hồ sơ PDF/ảnh/Excel.
- OCR cơ bản.
- AI trích xuất thông tin chính.
- Màn hình kiểm duyệt dữ liệu.
- Hồ sơ sức khỏe theo nhân viên.
- Tìm kiếm theo nhân viên, bệnh, chỉ số.
- Bảng điều khiển thống kê cơ bản.
- Quy tắc cảnh báo theo ngưỡng.
- Xuất báo cáo Excel/PDF.
- Phân quyền người dùng.
- Nhật ký truy cập.
13.2. Chưa nên làm ngay trong MVP
- Tự động chẩn đoán y khoa.
- Tích hợp tất cả bệnh viện ngay từ đầu.
- Tư vấn tự động chuyên sâu không có bác sĩ kiểm soát.
- Mobile app đầy đủ nếu web responsive đã đủ.
- Mô hình dự đoán rủi ro phức tạp khi chưa có dữ liệu lịch sử đủ lớn.
13
13. Lộ trình triển khai
Giai đoạn 1: Khảo sát và thiết kế
Công việc:
- Thu thập mẫu hồ sơ từ các bệnh viện/phòng khám.
- Phân loại định dạng tệp.
- Xác định danh mục chỉ số y tế quan trọng.
- Làm rõ nhóm người dùng và quyền truy cập.
- Thiết kế mô hình dữ liệu.
- Xác định ngưỡng cảnh báo ban đầu.
- Rà soát yêu cầu pháp lý và bảo mật.
Giai đoạn 2: Xây dựng MVP
Công việc:
- Xây dựng backend, database, tải lên tệp.
- Tích hợp OCR.
- Tích hợp trích xuất tự động bằng AI.
- Xây dựng màn hình kiểm duyệt.
- Xây dựng hồ sơ nhân viên.
- Xây dựng bảng điều khiển cơ bản.
- Xây dựng alert bộ xử lý.
- Xây dựng phân quyền và audit log.
Giai đoạn 3: Thử nghiệm dữ liệu thật
Công việc:
- Chạy thử với dữ liệu hồ sơ cũ.
- Đo độ chính xác OCR và trích xuất tự động bằng AI.
- Điều chỉnh mapping chỉ số y tế.
- Tối ưu màn hình kiểm duyệt.
- Kiểm tra tốc độ tìm kiếm.
- Kiểm thử bảo mật.
- Huấn luyện người dùng nội bộ.
Giai đoạn 4: Mở rộng
Công việc:
- Tích hợp API với bệnh viện nếu có.
- Hỏi đáp ngôn ngữ tự nhiên.
- Báo cáo phân tích nâng cao.
- Cảnh báo dựa trên xu hướng cá nhân.
- Portal nhân viên tự cập nhật sức khỏe.
- Kết nối chuyên gia/bác sĩ tư vấn.
- Tối ưu phân tích theo nhóm nghề nghiệp.
14
14. Chỉ số đánh giá hiệu quả
Chỉ số vận hành:
- Thời gian xử lý một hồ sơ.
- Tỷ lệ hồ sơ được hệ thống trích xuất thành công.
- Tỷ lệ trường dữ liệu cần sửa sau bước trích xuất.
- Thời gian tìm kiếm hồ sơ.
- Số lượng hồ sơ tồn đọng chờ kiểm duyệt.
Chỉ số quản trị:
- Tỷ lệ nhân viên hoàn tất khám định kỳ.
- Số cảnh báo phát hiện sớm.
- Số trường hợp tái khám đúng hạn.
- Tỷ lệ nhóm bệnh theo phòng ban/chức danh.
- Xu hướng sức khỏe qua từng kỳ khám.
Chỉ số bảo mật:
- Số lượt truy cập dữ liệu nhạy cảm.
- Số truy cập bị từ chối do thiếu quyền.
- Số sự cố dữ liệu.
- Tỷ lệ người dùng hoàn tất xác thực an toàn.
15
15. Rủi ro và biện pháp giảm thiểu
16.1. Rủi ro hệ thống đọc sai hồ sơ
Biện pháp:
- Luôn có bước kiểm duyệt trước khi lưu chính thức.
- Hiển thị độ tin cậy theo từng trường.
- Lưu tệp gốc để đối chiếu.
- Ưu tiên trích xuất các trường có cấu trúc rõ.
16.2. Rủi ro lộ dữ liệu sức khỏe
Biện pháp:
- Mã hóa dữ liệu.
- Phân quyền chặt.
- Audit log đầy đủ.
- Kiểm thử bảo mật.
- Chính sách truy cập theo nhu cầu công việc.
16.3. Rủi ro dùng dữ liệu sai mục đích
Biện pháp:
- Công bố mục đích xử lý rõ ràng.
- Tách dữ liệu y tế chi tiết khỏi dữ liệu quản trị tổng hợp.
- Cấu hình quyền theo vai trò.
- Có quy trình phê duyệt khi truy cập dữ liệu nhạy cảm.
16.4. Rủi ro bệnh viện trả mẫu quá khác nhau
Biện pháp:
- Thu thập nhiều mẫu từ đầu.
- Thiết kế pipeline trích xuất linh hoạt.
- Có thư viện template bệnh viện.
- Có cơ chế học từ chỉnh sửa của người kiểm duyệt.
16.5. Rủi ro cảnh báo quá nhiều
Biện pháp:
- Phân cấp mức độ cảnh báo.
- Cho phép cấu hình ngưỡng.
- Gom cảnh báo trùng.
- Ưu tiên cảnh báo có tác động vận hành cao.
16
16. Đề xuất giao diện chính
Các màn hình nên có:
- Bảng điều khiển tổng quan sức khỏe.
- Danh sách nhân viên.
- Hồ sơ sức khỏe nhân viên.
- Tải lên hồ sơ.
- Hàng chờ kiểm duyệt.
- Kết quả trích xuất từ AI.
- Danh sách cảnh báo.
- Báo cáo thống kê.
- Cấu hình danh mục và ngưỡng cảnh báo.
- Quản lý người dùng và phân quyền.
- Nhật ký truy cập.
Nguyên tắc giao diện:
- Đơn giản, rõ ràng, ưu tiên thao tác nhanh.
- Không trình bày quá nhiều thông tin y tế nhạy cảm cho người không cần biết.
- Bảng điều khiển cho quản lý nên dùng dữ liệu tổng hợp.
- Màn hình y tế nội bộ mới hiển thị chi tiết hồ sơ.
- Luôn có đường dẫn quay lại tệp gốc.
- Cảnh báo cần có trạng thái xử lý và người phụ trách.
17
17. Kết luận
Giải pháp quản lý hồ sơ y tế nên được định vị là một nền tảng quản lý và phân tích hồ sơ sức khỏe nhân viên, không chỉ là công cụ đọc tệp. Giá trị cốt lõi nằm ở việc biến hồ sơ y tế rời rạc từ nhiều bệnh viện thành dữ liệu thống nhất, có thể tìm kiếm, thống kê và cảnh báo.
Hệ thống cần kết hợp ba năng lực:
- Năng lực dữ liệu: chuẩn hóa hồ sơ sức khỏe theo thời gian.
- Năng lực phân tích tự động: đọc, trích xuất, tóm tắt và hỗ trợ phân tích.
- Năng lực quản trị: bảng điều khiển, cảnh báo, phân quyền, tuân thủ pháp lý.
Vì dữ liệu sức khỏe là dữ liệu nhạy cảm, sản phẩm phải được xây dựng theo hướng bảo mật, minh bạch và có kiểm duyệt con người. Công cụ phân tích nên đóng vai trò trợ lý xử lý dữ liệu và hỗ trợ ra quyết định, không thay thế bác sĩ, không thay thế quy trình pháp lý và không tự động đưa ra quyết định lao động cuối cùng.