Giới thiệu cơ bản các thuật toán Machine Learning

Post Reply
boco.cf
Posts: 13
Joined: Wed Apr 17, 2019 1:29 pm

Giới thiệu cơ bản các thuật toán Machine Learning

Post by boco.cf »

Các thuật toán Machine Learning thường được chia làm 4 nhóm: Supervised learning, Unsupervised learning, Semi-supervised lerning và Reinforcement learning.

Supervised Learning (Học có giám sát)

Supervised learning là thuật toán dự đoán đầu ra (outcome) của một dữ liệu mới (new input) dựa trên các cặp (input, outcome) đã biết từ trước. Cặp dữ liệu này còn được gọi là (data, label), tức (dữ liệu, nhãn). Supervised learning là nhóm phổ biến nhất trong các thuật toán Machine Learning.

Thuật toán supervised learning được chia nhỏ ra thành hai loại chính:
  • Regression (Hồi quy)
  • Classification (Phân loại)
Regression có một số thuật toán:
  1. Simple linear regression
  2. Multi linear regression
  3. Polynomial linear regression
  4. Non-linear regression
Classification có các thuật toán:
  1. K- Nearest Neighbors (KNN)
  2. Decision Tree
  3. Logistic regression
  4. Support Vector Machine (SVM)
Unsupervised Learning (Học không giám sát)

Trong thuật toán này, chúng ta không biết được outcome hay nhãn mà chỉ có dữ liệu đầu vào. Thuật toán unsupervised learning sẽ dựa vào cấu trúc của dữ liệu để thực hiện một công việc nào đó, ví dụ như phân nhóm (clustering) hoặc giảm số chiều của dữ liệu (dimension reduction) để thuận tiện trong việc lưu trữ và tính toán.

Thuật toán Unsupervised learning được chia thành hai loại:
  • Clustering (phân nhóm)
  • Association
Clustering có các thuật toán:
  1. K-Means
  2. Agglomerative
  3. DBSCAN (Density-Based Clustering)
Association có các thuật toán:
  1. Content based filtering
  2. Collaborative filtering
Semi-Supervised Learning (Học bán giám sát)

Các bài toán khi chúng ta có một lượng lớn dữ liệu X nhưng chỉ một phần trong chúng được gán nhãn được gọi là Semi-Supervised Learning. Những bài toán thuộc nhóm này nằm giữa hai nhóm được nêu bên trên.

Reinforcement Learning (Học Củng Cố)

Reinforcement learning là các bài toán giúp cho một hệ thống tự động xác định hành vi dựa trên hoàn cảnh để đạt được lợi ích cao nhất (maximizing the performance). Hiện tại, Reinforcement learning chủ yếu được áp dụng vào Lý Thuyết Trò Chơi (Game Theory), các thuật toán cần xác định nước đi tiếp theo để đạt được điểm số cao nhất.

...
Donate:
DGB address: D5SDMcJX6r1cJoPjWUfRj5BSfM2Y4Qvnzr

Post Reply