Chia sẻ

Optical Flow: Công nghệ tiên tiến trong phân tích chuyển động và ứng dụng thị giác máy tính

Optical Flow là một kỹ thuật quan trọng trong thị giác máy tính, hỗ trợ nhiều ứng dụng trong AI, robot, giám sát và giải trí

Nội dung

Theo Market Research Intellect, thị trường Optical Flow đang chứng kiến sự tăng trưởng mạnh mẽ với dự báo tăng trưởng kép hàng năm (CAGR) đạt 8,5% từ 2026 đến 2032. Được định giá 1,5 tỷ USD vào năm 2024, thị trường này dự kiến sẽ đạt 2,8 tỷ USD vào năm 2033 nhờ vào những tiến bộ công nghệ cùng với sự thay đổi trong nhu cầu của người tiêu dùng. Vậy công nghệ Optical Flow là gì mà có thể “khuấy động” lĩnh vực thị giác máy tính như vậy? Cùng VNPT AI tìm hiểu chi tiết về Optical Flow ngay sau đây nhé. 

Optical Flow là gì?

Optical Flow (dòng quang học) là một kỹ thuật trong thị giác máy tính, dùng để mô phỏng chuyển động của các đối tượng trong không gian 2D thông qua sự thay đổi của các điểm ảnh trong video hoặc hình ảnh. Phương pháp này đề cập đến sự thay đổi của cường độ sáng (intensity) tại các điểm ảnh trong một chuỗi hình ảnh theo thời gian. Nhờ vào Optical Flow, máy tính có thể nhận diện và theo dõi chuyển động, giúp ích trong nhiều ứng dụng như nhận diện đối tượng, theo dõi vật thể và thực hiện các phép đo động học.

Optical Flow là gì
Optical Flow mô phỏng chuyển động qua thay đổi điểm ảnh, hỗ trợ nhận diện và theo dõi

Các thuật toán và công nghệ được sử dụng trong Optical Flow

Có nhiều thuật toán và công nghệ khác nhau được phát triển để tính toán Optical Flow, mỗi phương pháp có cách tiếp cận và ứng dụng riêng, phù hợp với từng yêu cầu và tính chất của dữ liệu hình ảnh. Dưới đây là hai trong số các thuật toán nổi bật nhất trong lĩnh vực này:

Phương pháp Lucas-Kanade (The Lucas-Kanade Method)

Phương pháp Lucas-Kanade là một trong những kỹ thuật phổ biến để tính toán Optical Flow, đặc biệt hiệu quả trong các trường hợp có tập hợp đặc trưng thưa (sparse features). Phương pháp này giả định chuyển động liên tục, mượt mà trong một vùng nhỏ của hình ảnh, áp dụng xấp xỉ toán học (chuỗi Taylor) để tính toán sự thay đổi của các điểm ảnh trong vùng đó.

Thông qua đó, phương pháp này giải quyết được phương trình dòng quang học với hai ẩn số cho mỗi điểm trong tập hợp đặc trưng. Lucas-Kanade rất hiệu quả trong việc theo dõi các điểm đặc trưng rõ ràng như các góc sắc nét và kết cấu (texture), thường được phát hiện nhờ các phương pháp phát hiện góc như Shi-Tomasi hoặc Harris corner detector. Ưu điểm của phương pháp Lucas-Kanade là tính toán nhanh chóng và ít tốn tài nguyên, phù hợp với các ứng dụng yêu cầu theo dõi chính xác các điểm cố định trong video.

Thuật toán Horn-Schunck (The Horn-Schunck Algorithm)

Thuật toán Horn-Schunck là một phương pháp Optical Flow dày đặc (dense), có khả năng tính toán dòng quang học cho tất cả các điểm ảnh trong hình ảnh. Khác với phương pháp Lucas-Kanade, Horn-Schunck giả định rằng dòng quang học có sự mượt mà và liên tục trên toàn bộ ảnh chứ không chỉ trong các khu vực nhỏ. Thuật toán này sử dụng một hàm sai số toàn cục để tối thiểu hóa sự thay đổi trong dòng quang học, từ đó dự đoán chuyển động cho mọi pixel trong ảnh.

thuật toán Horn-Schunck trong Optical Flow
Tìm hiểu một số thuật toán và công nghệ của Optical Flow

Mặc dù phương pháp này cung cấp thông tin chi tiết hơn về chuyển động của mọi pixel trong hình ảnh nhưng cũng đòi hỏi tính toán phức tạp và yêu cầu tài nguyên tính toán lớn. Tuy nhiên, ưu điểm của Horn-Schunck là khả năng phát hiện các chuyển động mượt mà trong các tình huống phức tạp và có độ phân giải cao. 

Ứng dụng của Optical Flow

Optical Flow hiện đang được ứng dụng rộng rãi trong nhiều lĩnh vực và ngành công nghiệp như:

Giao thông: Hệ thống hỗ trợ lái xe ADAS, Xe tự lái và Giám sát giao thông

Optical Flow đóng vai trò quan trọng trong các Hệ thống hỗ trợ lái xe nâng cao (ADAS). Điển hình như công nghệ Autopilot của Tesla sử dụng các thuật toán Optical Flow trong các cảm biến và camera để phát hiện, theo dõi các vật thể cũng như ước lượng vận tốc của các đối tượng di chuyển so với xe. Những khả năng này rất quan trọng trong việc tránh va chạm và theo dõi làn đường khi lái xe tự động.

Giám sát và An ninh: Giám sát đám đông và phát hiện hành vi bất thường

Optical Flow giúp giám sát đám đông bằng cách phân tích dòng di chuyển của đám đông để phát hiện các mẫu hành vi hoặc các sự kiện bất thường. Ví dụ, tại các sân bay hay trung tâm mua sắm, Optical Flow có thể phát hiện các chuyển động bất thường như một người di chuyển ngược chiều đám đông. Các sự kiện lớn như World Cup cũng sử dụng công nghệ này để giám sát động thái đám đông để đảm bảo an ninh.

ứng dụng của optical flow trong giám sát an ninh
World Cup sử dụng công nghệ Optical Flow để giám sát và đảm bảo an ninh đám đông

Phân tích thể thao: Phân tích chuyển động để cải thiện hiệu suất và ngăn ngừa chấn thương

Trong thể thao, Optical Flow được dùng để phân tích chuyển động của các vận động viên, từ đó tối ưu hóa chiến lược huấn luyện và cải thiện hiệu suất thi đấu. Đơn cử như công ty Catapult Sports chuyên cung cấp phân tích cho vận động viên cũng sử dụng công nghệ Optical Flow để theo dõi chuyển động của cầu thủ. Qua đó hỗ trợ huấn luyện viên phân bổ các bài tập hợp lý giúp giảm nguy cơ chấn thương và nâng cao thành tích thể thao.

Lĩnh vực Robot: Điều hướng và tránh vật cản

Các công ty công nghệ drone như Da-Jiang Innovations (DJI) sử dụng Optical Flow sensor để ổn định đường bay và tránh các vật cản. Công nghệ này giúp drone phân tích các mẫu bề mặt và tính toán chuyển động của chúng so với mặt đất, từ đó drone có thể duy trì vị trí chính xác, an toàn mà không cần sử dụng GPS. 

Sản xuất phim và video: Hiệu ứng hình ảnh, theo dõi chuyển động và tái tạo cảnh quay

Trong ngành sản xuất phim, Optical Flow video được sử dụng để tạo ra các hiệu ứng hình ảnh và chỉnh sửa hậu kỳ. Bộ phim bom tấn “Avatar” là một ví dụ tiêu biểu khi đã sử dụng các kỹ thuật Optical Flow để tích hợp mượt mà các hình ảnh máy tính (CGI) với cảnh quay thật, đồng thời tái tạo các cảnh động phức tạp mang đến hình ảnh sinh động và sống động cho người xem.

Thách thức và hạn chế của Optical Flow

Dù Optical Flow mang lại nhiều ứng dụng đột phá, công nghệ này vẫn đối mặt với một số hạn chế kỹ thuật. Các vấn đề như che khuất (occlusions), thay đổi độ sáng (illumination changes)các vùng thiếu kết cấu (texture-less regions) có thể làm giảm độ chính xác của Optical Flow trong thị giác máy tính vì chúng gây khó khăn trong việc xác định chuyển động chính xác của các vật thể trong ảnh. Để khắc phục tình trạng này, các mô hình dự đoán chuyển động dựa trên các yếu tố xung quanh để cải thiện kết quả. Hơn nữa, các thuật toán thích ứng có thể giúp điều chỉnh sự thay đổi về ánh sáng bằng cách chuẩn hóa các biến động độ sáng trong quá trình xử lý.

Một thách thức khác là vấn đề “phương trình với hai ẩn số” (equation two unknown problem), khi số lượng ẩn số vượt quá số phương trình khiến việc tính toán trở nên khó khăn. Giải pháp là giả định dòng quang học liên tục trong một vùng nhỏ, kết hợp thông tin từ các khu vực xung quanh để giải quyết vấn đề này. Các phương pháp nâng cao hơn có thể sử dụng kỹ thuật điều chỉnh lặp lại (iterative regularization) để cải thiện độ chính xác của các ước lượng.

Xu hướng phát triển của Optical Flow trong tương lai

Học sâu (Deep learning)trí tuệ nhân tạo (AI) đang mở ra một tương lai mới cho Optical Flow khi các mạng nơ-ron học sâu được tích hợp vào các hệ thống thị giác máy tính. Điều này giúp nâng cao hiệu quả và khả năng mở rộng của Optical Flow, đặc biệt trong việc nhận diện chuyển động phức tạp và cải thiện độ chính xác trong các tình huống thực tế.

Trong lĩnh vực thực tế tăng cường (AR) và thực tế ảo (VR), Optical Flow cũng đang đóng vai trò quan trọng trong việc cải thiện trải nghiệm người dùng. Việc theo dõi chuyển động chính xác hơn giúp tạo ra các môi trường ảo mượt mà, chân thực hơn, từ đó mang lại những trải nghiệm tương tác sống động.

Hiện nay các nghiên cứu cũng đang tập trung vào việc phát triển các thuật toán Optical Flow tiêu tốn ít năng lượng hơn để mở rộng ứng dụng của công nghệ này trên các thiết bị di động có giới hạn về tài nguyên tính toán và năng lượng. 

Song song đó, việc hợp tác quốc tế trong nghiên cứu và ứng dụng Optical Flow cũng có nhiều bước tiến quan trọng khi sự hợp tác giữa các ngành và quốc gia tiếp tục tạo ra các giải pháp sáng tạo, nâng cao khả năng ứng dụng của Optical Flow trong nhiều lĩnh vực khác nhau.

Kết luận 

Mong rằng những chia sẻ của VNPT AI đã giúp bạn đọc hiểu rõ Optical Flow không chỉ là một công nghệ cốt lõi trong thị giác máy tính mà còn là nền tảng cho nhiều ứng dụng quan trọng trong các lĩnh vực như xe tự lái, an ninh, thể thao và thực tế ảo. Mặc dù vẫn đối mặt với không ít thách thức nhưng với sự phát triển không ngừng của các thuật toán và công nghệ học sâu, Optical Flow hứa hẹn sẽ tiếp tục phát triển mạnh mẽ, mở ra nhiều cơ hội đột phá trong tương lai.

Tác giả: Nguyễn Minh Hải

Đánh Giá