Một số loại phân tích hồi quy phù hợp để xử lý các tập dữ liệu phức tạp hơn các loại khác. Sau đây là một số ví dụ.
Hồi quy tuyến tính đơn giản
Hồi quy tuyến tính đơn giản được định nghĩa bằng hàm tuyến tính:
Y= β0*X + β1 + ε
β0 và β1 là hai hằng số chưa biết đại diện cho độ dốc hồi quy, trong khi ε (epsilon) là thuật ngữ sai số.
Bạn có thể sử dụng hồi quy tuyến tính đơn giản để lập mô hình mối quan hệ giữa hai biến, chẳng hạn như sau:
- Lượng mưa và sản lượng cây trồng
- Tuổi và chiều cao ở trẻ em
- Nhiệt độ và sự giãn nở của thủy ngân kim loại trong nhiệt kế
Hồi quy tuyến tính bội
Trong phân tích hồi quy tuyến tính bội, tập dữ liệu chứa một biến phụ thuộc và nhiều biến độc lập. Hàm đường hồi quy tuyến tính thay đổi để bao gồm nhiều yếu tố như sau:
Y= β0*X0 + β1X1 + β2X2+…… βnXn+ ε
Khi số lượng biến dự báo tăng lên, các hằng số β cũng tăng lên tương ứng.
Hồi quy tuyến tính bội lập mô hình nhiều biến và tác động của chúng lên một kết quả:
- Lượng mưa, nhiệt độ và mức độ sử dụng phân bón đối với sản lượng cây trồng
- Chế độ ăn uống và tập thể dục đối với bệnh tim
- Tăng trưởng tiền lương và lạm phát trên lãi suất cho vay gia đình
Hồi quy logistic
Các nhà khoa học dữ liệu sử dụng hồi quy logistic để đo lường xác suất xảy ra một sự kiện. Dự đoán là một giá trị giữa 0 và 1, trong đó 0 thể hiện một sự kiện khó xảy ra, và 1 thể hiện khả năng tối đa rằng sự việc đó sẽ xảy ra. Các phương trình logistic sử dụng các hàm logarit để tính toán đường hồi quy.
Sau đây là một số ví dụ:
- Xác suất thắng hoặc thua trong một trận đấu thể thao
- Xác suất đỗ hoặc trượt một bài kiểm tra
- Xác suất một hình ảnh là trái cây hoặc con vật