Tuần 3 trong course Machine Learning của giáo sư Andrew Ng trên Coursera.

Xem các bài viết khác tại Machine Learning Course Structure

1. Classification and Representation

1.1. Sigmoid Function or Logistic Function

Trong bài toán phân loại (classification), mặc dù ta có thể tiếp cận nó bằng các thuật toán linear regression đã biết bằng cách tạm thời quên đi giá trị của y chỉ có thể là 0 hoặc 1.Cách tiếp cận này có vẻ không được tốt cho lắm. Giá trị của h_0(x) phải nằm trong khoảng từ 0 tới 1.

Để giải quyết vấn đề này, ta sẽ biến đổi hàm hypotheses h_0(x) để thỏa điều kiện 0<=h_\theta(x)<=1.Ta sẽ nhét \theta^Tx vào Logistic Function:

h_\theta (x) = g ( \theta^T x )
z = \theta^T x
g(z) = \dfrac{1}{1 + e^{-z}} 

biểu thức trên có biểu diễn đồ thị như sau:

Function g(z) có thể biểu diễn bất kỳ số thực nào nằm trong khoảng từ 0 đến 1.h_\theta(x) cho chúng ta xác suất kết quả = 1. Ví dụ như nếu h_\theta(x) = 0.7 có nghĩa là xác suất kết quả = 1 là 70%. Ngược lại, xác xuất kết quả = 0 là 30% (vì output chỉ có thể có 2 giá trị là 0 và 1).

h_\theta(x) = P(y=1 | x ; \theta) = 1 - P(y=0 | x ; \theta)
P(y = 0 | x;\theta) + P(y = 1 | x ; \theta) = 1 

1.2. Decision Boundary

Dựa vào Logistic function ở trên, ta có thể `biến đổi` hàm hypothesis của ta lại thành như sau:

 
 h_\theta(x) \geq 0.5 \Rightarrow y = 1
 h_\theta(x) < 0.5 \Rightarrow y = 0 

Function g(z) hoạt động như sau:

g(z) \geq 0.5
when
z \geq 0 

Nhớ rằng:

z=0, e^{0}=1 \Rightarrow g(z)=1/2
z \to \infty, e^{-\infty} \to 0 \Rightarrow g(z)=1
z \to -\infty, e^{\infty}\to \infty \Rightarrow g(z)=0 

Như vậy, ta có thể viết:

h_\theta(x) = g(\theta^T x) \geq 0.5
when
\theta^T x \geq 0 

Từ những phát biểu trên, ta có thể viết

\theta^T x \geq 0 \Rightarrow y = 1
\theta^T x < 0 \Rightarrow y = 0 

Decision Boundary chính là đường phân chia vùng y = 0 và vùng y = 1, được tạo ra bởi hàm hypothesis của chúng ta

2. Ví dụ

Ta có ví dụ sau:

\theta = \begin{bmatrix}5\\ -1\\ 0\end{bmatrix}
y = 1 \; if \; 5 + (-1) x_1 + 0 x_2 \geq 0
5 - x_1 \geq 0
- x_1 \geq -5
x_1 \leq 5 

vậy đồ thị của chúng ta sẽ giống như sau

Lưu ý rằng tùy vào hàm hypothesis và các tham số theta, hình dáng boudary line có thể thay đổi tương ứng

Advertisement

Leave a Reply

Fill in your details below or click an icon to log in:

WordPress.com Logo

You are commenting using your WordPress.com account. Log Out /  Change )

Facebook photo

You are commenting using your Facebook account. Log Out /  Change )

Connecting to %s

This site uses Akismet to reduce spam. Learn how your comment data is processed.