Nên sử dụng Machine Learning hay Deep Learning?

[Hot] Tìm hiểu về AI & Data Science tại AI4vietnam

[Upcoming] Tổng hợp các khóa học cho người làm IT

Hiểu công nghệ AI nào để sử dụng và triển khai một dự án có thể là một thách thức trước tốc độ và sự phát triển nhanh chóng của khoa học máy tính. Bài viết này xin chia sẻ sự khác biệt giữa Học máy và Học máy sâu. Học máy – Machine Learning (ML): Mô hình Học máy cổ điển (classical), một phân nhánh của AI Học máy sâu – Deep Learning (DL): Mô hình Học máy hiện đại (modern), là một phân nhánh của ML.

Trước tiên, hãy cùng chúng tôi tìm hiểu khái niệm, quá trình phát triển của hai phương pháp học máy này cũng như những khác biệt cơ bản giữa chúng nhằm giúp chúng ta xác định và lựa chọn mô hình học máy phù hợp nhất cho một dự án AI.

Trong cả Học máy và Học máy sâu, các kỹ sư sử dụng các công cụ phần mềm, chẳng hạn như MATLAB, cho phép máy tính xác định xu hướng và đặc điểm trong dữ liệu bằng cách học từ tập dữ liệu mẫu. Trong trường hợp Học máy, dữ liệu đào tạo được sử dụng để xây dựng một mô hình mà máy tính có thể sử dụng để phân loại dữ liệu mẫu và cuối cùng là dữ liệu trong thế giới thực. Theo truyền thống, một bước quan trọng trong quy trình làm việc này là phát triển các tính năng (công cụ thuật toán trích xuất đặc trưng, các chỉ số bổ sung lấy từ dữ liệu thô) giúp mô hình chính xác hơn. Học Máy Sâu là một tập hợp con của học máy, nơi các kỹ sư và nhà khoa học bỏ qua bước tạo tính năng theo cách thủ công. Thay vào đó, dữ liệu được đưa vào thuật toán Học máy sâu, máy tính sẽ tự động trích xuất và học những đăng trưng hữu ích nhất để xác định đầu ra.

(source: DZone)

Học máy: Một nhánh của Trí Tuệ Nhân Tạo, nơi các kỹ sư và nhà khoa học chọn thủ công các đặc trưng trong dữ liệu và đào tạo mô hình. Các thuật toán học máy phổ biến bao gồm Decision Tree, SVM, Neuron Networks và Ensemble.
Học máy sâu: Một nhánh của học máy được mô hình hóa lỏng lẻo trên các đường dẫn thần kinh của não người, nơi thuật toán tự động trích xuất và học những đặc trưng hữu ích. Các thuật toán học sâu phổ biến bao gồm mạng CNNs, RNNs và Deep Q.

Hồ sơ dự án

Học Máy thường được sử dụng cho các dự án liên quan đến dự đoán kết quả đầu ra hoặc phát hiện các xu hướng. Trong các ví dụ này, một phần dữ liệu giới hạn được sử dụng để giúp máy học các mẫu mà sau này chúng có thể sử dụng để xác định chính xác dữ liệu đầu vào mới. Các thuật toán phổ biến được sử dụng trong học máy bao gồm Linear regression, Decision Tree, SVM, Naive Bayes, Discriminant Analysis, Neural Networks và Ensemble.

Học Máy Sâu phức tạp hơn và thường được sử dụng cho các dự án liên quan đến phân loại hình ảnh, xác định các đối tượng trong hình ảnh và xử lý hình ảnh và tín hiệu nâng cao. Trong những trường hợp này, mạng nơ ron sâu có thể được áp dụng, vì chúng được thiết kế để tự động trích xuất đặc trưng từ dữ liệu được tổ chức theo không gian và thời gian như hình ảnh và tín hiệu. Các thuật toán phổ biến được sử dụng trong học tập sâu bao gồm CNNs, RNNs và Deep Q.

Các thuật toán học máy có thể được ưu tiên chọn lựa nếu bạn cần kết quả nhanh hơn. Bạn có thể đào tạo nhanh hơn và yêu cầu ít sức mạnh tính toán hơn. Số lượng các thuộc tính và dữ liệu thu thập sẽ là những yếu tố chính ảnh hưởng đến thời gian đào tạo. Các kỹ sư áp dụng máy học nên dành phần lớn thời gian để phát triển và đánh giá các tính năng để cải thiện độ chính xác của mô hình.

Mô hình học sâu sẽ cần nhiều thời gian hơn để huấn luyện. Mạng tri thức có sẵn (pre-trained) và bộ dữ liệu mở có thể rút ngắn quá trình đào tạo thông qua việc học chuyển giao (transfer learning), nhưng đôi khi việc áp dụng các mô hình có thể phức tạp. Nói chung, các thuật toán học sâu có thể mất ít thời gian hoặc cần đến nhiều tuần để đào tạo tùy thuộc vào phần cứng và khả năng tính toán của hạ tầng. Các kỹ sư áp dụng học sâu nên dành nhiều thời gian vào việc huấn luyện các mô hình và thực hiện tối ưu kiến trúc của các mạng học sâu.

Nên chọn mô hình Học máy hay Học máy sâu?

Đánh giá dữ liệu

Hiểu các tập dữ liệu có sẵn có thể giúp xác định liệu học máy hay học sâu nên được áp dụng cho một nhiệm vụ nhất định.

Nói chung, Học Máy được sử dụng khi có sẵn dữ liệu có cấu trúc, hạn chế hơn. Hầu hết các thuật toán học máy được thiết kế để huấn luyện mô hình thành dữ liệu dạng bảng (được tổ chức thành các hàng và cột độc lập). Nếu dữ liệu không phải dạng bảng, có thể áp dụng công nghệ máy học, nhưng nó yêu cầu một số thao tác dữ liệu – tức là dữ liệu cảm biến có thể được chuyển đổi thành biểu diễn dạng dạng bảng bằng cách trích xuất đặc trưng dạng cửa sổ sử dụng các số liệu thống kê phổ biến (trung bình, trung vị, độ lệch chuẩn, độ lệch kurtosis, vv…), và sau đó được sử dụng với các kỹ thuật học máy truyền thống.

Học Máy Sâu thường yêu cầu một lượng lớn dữ liệu đào tạo để đảm bảo rằng mạng, rất có thể có hàng chục triệu tham số và không trang bị quá nhiều dữ liệu đào tạo. Mạng nơ-ron chuyển đổi được thiết kế để hoạt động trên dữ liệu hình ảnh, mặc dù chúng có thể được sử dụng trên dữ liệu cảm biến cũng như bằng cách thực hiện tính toán tần số thời gian chẳng hạn như biểu đồ quang phổ trên tín hiệu. Mạng nơ-ron tuần hoàn như mạng LSTM được thiết kế để hoạt động trên dữ liệu tuần tự như tín hiệu và văn bản.

Phần cứng và Hạ tầng triển khai

Việc xác định phương pháp tiếp cận AI nào nên được áp dụng cũng phụ thuộc vào phần cứng có sẵn. Các thuật toán học máy yêu cầu ít sức mạnh tính toán hơn. Ví dụ, CPU máy tính để bàn là đủ để đào tạo các mô hình này. Đối với các mô hình học sâu, thường yêu cầu phần cứng chuyên dụng do yêu cầu về bộ nhớ và khả năng tính toán cao hơn. Phần cứng chuyên dụng cũng thích hợp bởi vì các hoạt động được thực hiện trong một mạng nơ-ron sâu, chẳng hạn như các chập, cho thấy tốt với kiến trúc song song của GPU. Mô hình học sâu có sức mạnh tính toán đáng kể. Chúng nên được xem xét nếu GPU có sẵn hoặc nếu có thời gian để huấn luyện trên CPU (sẽ lâu hơn đáng kể).

Đào tạo mô hình học sâu trên các cụm hoặc đám mây đã trở nên phổ biến với học sâu giúp giảm bớt khoản chi phí cao liên quan đến việc sử dụng GPU. Tùy chọn này cho phép một số nhà nghiên cứu chia sẻ phần cứng. Tuy vậy, việc triển khai GPU tích hợp cũng ngày càng trở nên phổ biến, vì nó có thể cung cấp tốc độ xử lý nhanh trong môi trường được triển khai. Bộ mã hóa GPU cho phép tạo mã từ các mô hình học sâu trong MATLAB tận dụng các thư viện được tối ưu hóa từ Intel, NVIDIA và Arm. Với các gói hỗ trợ bộ mã hóa GPU cho GPU NVIDIA, bạn có thể biên dịch chéo và triển khai mã CUDA đã tạo dưới dạng ứng dụng độc lập trên GPU tích hợp.

Định hướng và phát triển

Mặc dù luôn có thử nghiệm và sai sót, nhưng những điều trên có thể giúp hướng dẫn việc ra quyết định và đẩy nhanh quá trình thiết kế tổng thể cho các kỹ sư mới sử dụng máy học và học sâu. Bằng cách hiểu sự khác biệt giữa học máy và học sâu, biết ứng dụng cuối cùng của dự án, dữ liệu có sẵn và hạ tầng phần cứng, các nhóm thiết kế sẽ có được cái nhìn sâu sắc hơn về cách tiếp cận nào phù hợp nhất cho các dự án tương ứng.

Do vậy, rất cần thiết để trang bị kiến thức AI một cách toàn diện cả về ML và DL để có thể ứng dụng vào các bài toán thực tế nhằm giúp kỹ sư xác khai thác tốt nhất kỹ thuật và các mô hình trong dự án của mình. (Nguồn: Tổng hợp)