1. Classification and Representation

1.1. Sigmoid Function or Logistic Function

Trong bài toán phân loại (classification), mặc dù ta có thể tiếp cận nó bằng các thuật toán linear regression đã biết bằng cách tạm thời quên đi giá trị của y chỉ có thể là 0 hoặc 1.Cách tiếp cận này có vẻ không được tốt cho lắm. Giá trị của $h_0(x)$ phải nằm trong khoảng từ 0 tới 1.

Để giải quyết vấn đề này, ta sẽ biến đổi hàm hypotheses $h_0(x)$ để thỏa điều kiện $0<=h_\theta(x)<=1$ .Ta sẽ nhét $\theta^Tx$ vào Logistic Function:

biểu thức trên có biểu diễn đồ thị như sau:

Function g(z) có thể biểu diễn bất kỳ số thực nào nằm trong khoảng từ 0 đến 1. $h_\theta(x)$ cho chúng ta xác suất kết quả = 1. Ví dụ như nếu $h_\theta(x) = 0.7$ có nghĩa là xác suất kết quả = 1 là 70%. Ngược lại, xác xuất kết quả = 0 là 30% (vì output chỉ có thể có 2 giá trị là 0 và 1).