Thị giác máy tính (Computer Vision – CV) là một trong ba mảng đang rất hot trên thị trường Công Nghệ AI: Computer Vision, Natural Language Processing và Decision Making, sử dụng các thuật toán Học máy (Machine Learning – ML) và Học máy sâu (Deep Learning – DL) để cho phép máy tính “nhìn” và phân tích môi trường xung quanh. Thị Giác Máy Tính có tác động lớn đến các công ty thuộc mọi ngành, từ bán lẻ đến nông nghiệp. Nó đặc biệt hữu ích cho những vấn đề mà chúng ta cần đến con mắt của con người để theo dõi và xử lý.
Có rất nhiều bài toán tương tự cần được giải quyết, do vậy hàng ngàn ứng dụng của Computer Vision vẫn chưa được phát triển hoặc chưa thể khai thác. Bài viết này là tổng hợp danh sách các ứng dụng Thị Giác Máy Tính hiện đại, đang phát triển nhanh và được sử dụng trong các ngành công nghiệp trọng yếu trong năm 2020.
Thị giác máy tính trong thể thao
Sản xuất thể thao: Sản xuất thể thao hoàn toàn tự động đã được tạo ra thông qua học tập sâu, bao gồm phóng to và quay phim giống hệt với sản xuất chuyên nghiệp do con người chỉ đạo. Thay vì sử dụng người quay phim, thị giác máy tính đang được sử dụng để nhận ra vị trí của các cầu thủ và quả bóng nhằm tập trung cụ thể vào những khía cạnh đó tùy thuộc vào những gì trong tầm nhìn.
Theo dõi người chơi: Video, hoặc thậm chí cảnh quay trực tiếp, được lập trình để hiểu từng khung hình. Hành động của người chơi có thể được giải mã bằng cách nhận dạng các kiểu chuyển động cơ thể người giữa các khung hình. Điều này cho phép phân tích thành tích của vận động viên, tiến độ tập luyện hoặc xem xét kỹ thuật vận động viên.
Theo dõi bóng: Theo dõi bóng là một ứng dụng của máy học và sâu để làm cho bóng xuất hiện trên màn hình. Điều này rất hữu ích vì có thể nhìn rõ quả bóng trong các môn thể thao có sân rộng (ví dụ: bóng đá) giúp việc đưa tin dễ dàng hơn cho các phát thanh viên thể thao. Ngoài ra, theo dõi bóng cho phép phân tích chiến thuật của trò chơi và đội.
Thị giác Máy tính trong Y tế và Sức khỏe
Phát hiện ung thư: Máy học được tích hợp trong các ngành y tế cho các mục đích như phát hiện ung thư vú và ung thư da. Tính năng phát hiện hình ảnh cho phép các nhà khoa học tìm ra sự khác biệt nhỏ giữa hình ảnh ung thư và không ung thư, đồng thời chẩn đoán dữ liệu từ quét hình ảnh cộng hưởng từ (MRI) và các bức ảnh nhập vào là ác tính hay lành tính.
Phân loại tế bào: Năm 2016, ML được sử dụng để phân loại tế bào lympho T chống lại tế bào biểu mô ung thư ruột kết với độ chính xác cao. ML dự kiến sẽ đẩy nhanh đáng kể quá trình xác định bệnh liên quan đến ung thư ruột kết một cách hiệu quả và ít hoặc không tốn kém sau khi tạo ra.
Phân tích chuyển động
Các bệnh thần kinh và cơ xương như đột quỵ sắp tới, các vấn đề về thăng bằng và dáng đi có thể được phát hiện bằng cách sử dụng mô hình học sâu và thị giác máy tính ngay cả khi không có phân tích của bác sĩ. Các ứng dụng thị giác máy tính phân tích chuyển động của bệnh nhân hỗ trợ bác sĩ chẩn đoán bệnh nhân dễ dàng và tăng độ chính xác.
Phát hiện khẩu trang: Các công ty như Uber đã tạo ra các tính năng bằng Computer Vision để triển khai trong ứng dụng di động của họ để phát hiện hành khách có đeo khẩu trang hay không. Các chương trình như thế này làm cho phương tiện giao thông công cộng an toàn hơn trong thời kỳ đại dịch.
Phát hiện khối u: Các khối u não có thể được nhìn thấy trong quét MRI và thường được phát hiện bằng cách sử dụng mạng lưới thần kinh sâu. Các phương pháp mới liên tục được phát triển để nâng cao độ chính xác của những chẩn đoán này.
Nông nghiệp và trồng trọt
Xác định và loại bỏ nông sản bị hư: Sản phẩm bị hư hỏng có thể được phát hiện khi đang xử lý bằng các thuật toán máy học. Các thuật toán được cung cấp vô số dữ liệu và được huấn luyện để nhận ra sự khác biệt giữa sản phẩm chín và sản phẩm hư hỏng.
Đếm và thống kê số lượng: Khối lượng sản phẩm có thể được cung cấp thông qua một hệ thống Computer Vision mà sau đó có thể đếm có bao nhiêu đối tượng trong toàn cảnh. Điều này cho phép nông dân có dữ liệu về thu nhập từ sản phẩm mà họ đang canh tác và do đó cho phép họ tính toán chi phí và xác định giá thành cho sản phẩm.
Nhận dạng thực vật: Các chương trình có thể được sử dụng để xác định thực vật và động vật ở cấp độ loài từ một bức ảnh do người dùng nhập vào. Giờ đây, nông dân có thể dễ dàng xác định cỏ dại và sâu bệnh với ứng dụng thị giác máy tính này.
Giám sát động vật: Động vật có thể được theo dõi bằng cách sử dụng các kỹ thuật mới đã được đào tạo để phát hiện loại động vật và theo dõi hành động của chúng. Việc giám sát động vật trong trồng trọt được sử dụng nhiều như có thể theo dõi vật nuôi từ xa để phát hiện bệnh tật, thay đổi hành vi hoặc sinh đẻ. Ngoài ra, các nhà khoa học nông nghiệp và động vật hoang dã có thể xem các loài động vật hoang dã một cách an toàn từ xa.
Tự động hóa trang trại: Các công nghệ như robot thu hoạch, gieo hạt và làm cỏ, máy kéo tự động và máy bay không người lái để giám sát điều kiện nông trại và bón phân có thể tối đa hóa sản lượng khi thiếu lao động. Nông nghiệp cũng có thể có lợi hơn khi dấu chân sinh thái của nông nghiệp được giảm thiểu.
Giao thông, vận tải
Xe tự hành: Còn được gọi là xe tự lái, xe tự hành cho phép người dùng không bao giờ phải chạm vào vô lăng trong quá trình đi làm. Tesla là công ty thị giác máy tính hàng đầu đã tạo ra những bước đột phá trong lĩnh vực lái xe tự hành và gần như đã biến ý tưởng về những chiếc xe hoàn toàn tự lái thành hiện thực. Điều này có thể đem lại sự an toàn hơn việc để con người lái xe của chính mình.
Theo dõi khả năng tập trung của người lái xe: Các thuật toán học máy và sâu đã được cung cấp hàng nghìn mẩu dữ liệu về khuôn mặt chú ý và không chú ý có thể phát hiện sự khác biệt giữa tập trung và không tập trung qua ánh mắt, cũng như các dấu hiệu cho biết khi lái xe bị mất tập trung. Trí tuệ nhân tạo trong trường hợp này rất quan trọng vì nó có khả năng bảo vệ cả người lái xe và những khác trong vùng lân cận. Kết quả của nó cũng có thể được các cơ quan chức năng sử dụng làm bằng chứng về việc lái xe trong tình trạng say xỉn.
Nhận dạng biển số: Để tạo ra dữ liệu vị trí xe, tính năng nhận dạng biển số tự động thực hiện nhận dạng ký tự trên hình ảnh của biển số đăng ký xe. Công nghệ này có thể được tích hợp trong các camera thực thi quy tắc trên đường, thu phí điện tử hoặc các mục đích thực thi pháp luật khác như điều tra tội phạm.
Phân tích Giao thông và An toàn: Các ứng dụng Computer Vision trong phân tích giao thông phát hiện các số trên biển số xe bị bắt khi đang chạy quá tốc độ, vượt đèn đỏ và hơn thế nữa. Dữ liệu đó sau đó có thể được báo cáo và tự động chỉ định tiền phạt và các hậu quả khác mà không có sự can thiệp của cơ quan quản lý. Các dữ liệu khác được thu thập thông qua phân tích giao thông cũng có thể giúp lập kế hoạch điều tiết giao thông và đo đếm lưu lượng giao thông.
Tránh va chạm: Mạng nơron học sâu đã được sử dụng gần đây để nghiên cứu khả năng của học sâu và việc sử dụng nó để tránh va chạm. Ôtô có thể phát hiện ra khoảng cách từ vị trí của chúng đến điểm giới hạn có thể gây ra va chạm hoặc đến chiếc ô tô đang tới đang chạy nhanh và có nguy cơ xảy ra va chạm.
Phát hiện góc chết: Hệ thống quét bên hông xe giúp nhận dạng người đi xe đạp, phương tiện hoặc người bên cạnh xe và báo hiệu họ bằng đèn LED hoặc cảnh báo thêm bằng âm thanh báo động nếu ai đó đang ở trong khu vực nguy hiểm.
Bán lẻ và Sản xuất
Theo dõi khách hàng: Các thiết bị đếm được đặt một cách chiến lược trong toàn bộ cửa hàng bán lẻ có thể thu thập dữ liệu thông qua các quy trình máy học về nơi khách hàng dành thời gian và trong bao lâu. Việc phân tích hành vi khách hàng có thể giúp các cửa hàng bán lẻ hiểu hơn về sự tương tác của người tiêu dùng và thay đổi cách bố trí hàng hóa trong cửa hàng.
Thống kê số lượng khách hàng: Các thuật toán Computer Vision được đào tạo với các ví dụ dữ liệu để phát hiện con người và đếm khi phát hiện. Công nghệ như vậy rất hữu ích cho các cửa hàng để thu thập dữ liệu về lưu lượng khách viếng thăm cửa hàng và cũng có thể được áp dụng trong các tình huống liên quan đến COVID-19 khi cần giới hạn số lượng người được phép vào cửa hàng cùng một lúc.
Phát hiện trộm cắp: Các nhà bán lẻ có thể phát hiện hành vi đáng ngờ chẳng hạn như đi lang thang hoặc vào các khu vực bị giới hạn bằng cách sử dụng các thuật toán Computer Vision tự động phân tích hiện trường.
Phân tích thời gian chờ: Để tránh khách hàng phải chờ đợi quá lâu, các nhà bán lẻ đang triển khai công nghệ phát hiện và đếm số lượng khách hàng đang chờ phục vụ. Tính năng này sử dụng máy ảnh để theo dõi và đếm số lượng người mua sắm trong một hàng. Sau khi đạt đến ngưỡng số lượng khách hàng, hệ thống sẽ phát ra âm thanh cảnh báo cho nhân viên mở quầy thanh toán mới.
Cách ly xã hội: Để đảm bảo việc tuân thủ các biện pháp an toàn phòng ngừa lây nhiễm, các công ty đang sử dụng máy dò khoảng cách. Camera theo dõi chuyển động của nhân viên hoặc khách hàng và sử dụng cảm biến độ sâu để đánh giá khoảng cách giữa chúng. Tùy thuộc vào vị trí của họ, hệ thống Computer Vision sẽ vẽ một vòng tròn màu đỏ hoặc xanh lá cây xung quanh người đó.
Phân tích năng suất: Phân tích hiệu xuất làm việc và theo dõi tác động của việc thay đổi nơi làm việc, cách nhân viên sử dụng thời gian và sức lực của họ cũng như triển khai các công cụ khác nhau. Dữ liệu như vậy có thể cung cấp thông tin chi tiết có giá trị về quản lý thời gian, cộng tác tại nơi làm việc và năng suất của nhân viên.
Quản lý chất lượng: Hệ thống quản lý chất lượng giúp các tổ chức đảm bảo được các yêu cầu của khách hàng bằng cách giám sát các chính sách, thủ tục, hướng dẫn, quy trình nội bộ của tổ chức nhằm đáp ứng yêu cầu khắt khe của người tiêu dùng.
Và nhiều hơn thế nữa, học máy và học sâu đã được sử dụng để tạo ra các ứng dụng Computer Vision được sử dụng theo nhiều cách khác nhau và cho tất cả các ngành công nghiệp.