Phương pháp giúp nhận dạng đầy đủ khuôn mặt người dù khuyết thông tin

  • 13:33 ,08/01/2018

Ảnh: chân dung tác giả Võ Hoàng Trọng (H.T).

KHPT - Việc nhận dạng khuôn mặt người dù đã có từ lâu trong ngành thị giác máy tính nhưng cho đến nay vẫn còn nhiều thách thức đặt ra, mà một trong số đó là mặt người bị che khuất một phần thông tin, chất lượng ảnh kém hay mặt người theo thời gian sẽ có sự thay đổi nhất định. Trong thực tế, khi chạy xe trên đường, nhiều người hay bịt kín mặt chỉ để lộ mắt và trán, hay khi quan sát trên camera an ninh ở đám đông, người này có thể bị người kia đứng trước che mất một phần mặt.

Từ thực tế trên, tác giả Võ Hoàng Trọng (ảnh), khoa Toán – Tin học, Trường ĐH khoa học tự nhiên – ĐH quốc gia TP.HCM, dưới sự hướng dẫn của PGS.TS. Phạm Thế Bảo – trưởng bộ môn Ứng dụng tin học, khoa Toán – Tin học, Trường ĐH khoa học tự nhiên – ĐH quốc gia TP.HCM đã đề xuất một phương pháp giải quyết những thách thức trên.

Theo đó, ý tưởng chủ đạo của đề tài lại xuất phát từ những câu nói hết sức bình thường trong đời sống hằng ngày, ví dụ như: “Anh này có đôi mắt to quá!”, “Chị này có cái mũi cao thật đẹp!” hay: “Dù nó mang khẩu trang nhưng trán có sẹo này chắc chắn của thằng A!” v.v... Từ đó, Trọng và thầy đánh giá rằng, với những mặt chỉ có một vài thông tin như mắt, mũi hay trán, hãy thử nhận dạng trên từng vùng riêng biệt, lần lượt xác định những người có “mắt to” hay “mũi cao” hay “trán sẹo”, rồi tìm cách kết hợp các kết quả nhận dạng, biết đâu sẽ tìm được danh tính mặt người trong ảnh.

Nói là làm, từ ảnh ban đầu, tác giả đã phát hiện khuôn mặt bằng thuật toán HOG, phân bố các điểm mốc lên mặt và phân vùng mặt theo superpixel, từ đó tách mặt ra thành các vùng đặc trưng thuần nhất. Sau đó, áp dụng nạng neural tích chập để “huấn luyện” trên từng vùng đặc trưng. Khi kiểm tra, sử dụng những vùng đặc trưng có trên khuôn mặt để nhận dạng bằng cách xây dựng phương pháp kết hợp “trễ” từ các bộ phân loại “yếu” bằng phương pháp bầu chọn để từ đó có được một bộ phân loại “mạnh”. Đối với phương pháp bầu chọn, ở mỗi vùng đặc trưng có tính phân loại yếu, tác giả chọn ra 5 đối tượng có vùng đặc trưng giống với vùng đặc trưng của mặt người trong ảnh. Sau đó, tính điểm các đối tượng này bằng một hàm số tính điểm dựa trên khái niệm tích vô hướng của vector hệ số các vùng đặc trưng và vector xác suất của đối tượng. Cuối cùng, chọn đối tượng có điểm cao nhất để kết luận danh tính mặt người trong ảnh.

hinh_nhan_dang_mat_nguoi

Phương pháp hiện có thể nhận dạng được mặt người chỉ với một vài phần thông tin trên mặt người hay mặt người có sự thay đổi (lúc có râu, lúc không râu, lúc có đeo kính, làn da thay đổi màu, …) một cách hiệu quả với độ chính xác cao. Do đó, đề tài có thể áp dụng trong việc bảo mật các thiết bị điện tử hay phát hiện đối tượng trong đám đông thông qua camera giám sát. Công nghệ FaceID của Apple xây dựng mô hình 3 chiều của mặt người dựa trên các cảm biến, điều này giúp cho việc nhận dạng mặt dưới nhiều góc cạnh hay mặt bị che khuất một phần thông tin dễ dàng hơn nhưng lại khó khi ứng dụng vào camera công cộng vì không phải lúc nào cũng quét được mặt 3 chiều của một người ở đám đông.

Sau khi kết thúc vòng bán kết của giải thưởng Euréka 2017, hội đồng giám khảo có nhận xét nếu nghiên cứu sâu hơn, có những kết quả cụ thể thì triển vọng ứng dụng vào thực tế sẽ tốt. Đề tài được đánh giá có tính sáng tạo nhằm giải quyết bài toán khó của việc nhận dạng mặt người. Khi áp dụng vào thực tế, có thể dùng trong bảo mật các thiết bị điện tử hay phát hiện đối tượng trong đám đông.

Về hiệu quả kinh tế, theo tiết lộ của Hoàng Trọng, chi phí thực tế không quá cao khi chỉ đầu tư ở 2 khoản: tiền mua máy tính và tiền đầu tư camera rõ nét nhất có thể.

Hiện tác giả chỉ mới thử nghiệm phương pháp dựa trên toàn mặt cũng như chỉ một vài phần trên khuôn mặt người trên bộ dữ liệu FaceScrub. Bộ dữ liệu này rất thích hợp để thực nghiệm trước khi triển khai vào thực tế do tính đa dạng của ảnh mặt người trong bộ dữ liệu. Bộ dữ liệu này gồm ảnh khuôn mặt người với nhiều trạng thái cũng như chất lượng ảnh khác nhau, ví dụ như mặt chính diện, nửa nghiêng, chịu tác động bởi ngoại cảnh, ảnh bị mờ, ảnh khuôn mặt thay đổi theo thời gian mặt lúc già, lúc trẻ, lúc có râu, lúc không râu, lúc có đeo kính v.v…

Dưới đây là một số ảnh trong bộ dữ liệu FaceScrub.

hinh_nhan_dang_mat_nguoi_1_

Thực nghiệm cho 50 đối tượng, mỗi đối tượng có hơn 1.900 ảnh để thực nghiệm ban đầu. Kết quả thực nghiệm cho thấy phương pháp nhận dạng chính xác đến 86% trên toàn mặt, 80.875% khi ảnh mặt người chỉ có thông tin trán và mắt (ví dụ như người mang khẩu trang), 73% khi mặt người chỉ có mũi và hai bên má, 64.875% khi mặt người chỉ thấy thông tin của miệng và cằm. Đối với mặt chỉ thấy vùng má trái hay má phải, độ chính xác của thuật toán chỉ 57.5%.

hinh_nhan_dang_mat_nguoi_2_

Hiện đề tài đã được các bạn sinh viên khoá dưới tiếp tục hoàn thiện thêm, áp dụng được trong trường hợp mặt nghiêng hẳn sang một bên, có giải pháp tự động phát hiện những vùng đặc trưng có trên mặt người và hi vọng từ 1 - 2 năm nữa thì đề tài này sẽ được các doanh nghiệp, tập đoàn công nghệ áp dụng trong việc bảo mật thiết bị hay giám sát nhân viên. Trong tương lai xa hơn, Hoàng Trọng cũng mong rằng đề tài có thể đóng góp vào quá trình xây dựng thành phố thông minh, thông qua camera giám sát công cộng nhằm phát hiện đối tượng trong đám đông như ở sân bay, sân vận động hay phát hiện người vi phạm giao thông ở ngoài đường phố.

Đây là đề tài đã đạt giải nhì giải thưởng Sinh viên nghiên cứu khoa học - Euréka 2017.

 

 

 

 

Tuyết Mai
  • Hotline
    (028) 3920 1523
  • Email