Nhảy đến nội dung
Nhận Diện Chữ Số Viết Tay Bằng scikit-learn

Bài gốc: Recognizing hand-written digits

Đây là một ví dụ sử dụng scikit-learn để nhận diện hình ảnh các chữ số viết tay từ 0 tới 9. Bộ này được viết bởi Gael Varoquaux

Regression Supervised Learning Python

Bài viết liên quan tới bộ scikit-learn - bộ ML được biết tới với 

Supervised Learning - Python

Bài viết liên quan tới bộ scikit-learn - bộ ML được biết tới với 

Sử dụng np.permutation()
def permutation_sample(dl1, dl2):

    """Tạo một mẫu hoán vị từ 2 bộ dự liệu dl1 và dl2."""

    # Ghép hai bộ dữ liệu thành 1 lưu lý khác với merge(): dl

    dl = np.concatenate((dl1, dl2))

    # Hoán vị các thành phần trong dl, nó trả lại một dl mới: permuted_dl

    permuted_data = np.random.permutation(dl)

    # Bây giờ phân tách dl đã hoán vị thành 2: perm_mau_1, perm_mau_2

    perm_sample_1 = permuted_data[:len(dl1)]

    perm_sample_2 = permuted_data[len(dl2):]

    return perm_sample_1, perm_sample_2

Có 2 bộ dữ liệu dl1 và

Giải thích NUMPY RANDOM SEED
import numpy as np

# Trong bài này mình sẽ giới thiệu cách mà np.random.seed() có thể làm

Hàm này sử dụng khá đơn giản, nhưng khi áp dụng trong trường hợp nào lại phức tạp hơn. 

np.random.seed() dùng cho các số ngẫu nhiên pseudo-random trong Python.

Numpy ramdom seed đơn giản chỉ là một hàm, hàm này thiết lập random seed of the NumPy pseudo-random number generator, nó cung cấp đầu vào để NumPy tạo pseudo-random numbers cho các quá trình ngẫu nhiên.

ECDFs (Empirical Cumulative Distribution Function)

ECDFs là một trong những đồ thị quan trọng trong phân tích thông kê. 

Sử dụng hàm sau đây

def ecdf(data):
    """Compute ECDF for a one-dimensional array of measurements."""   
    n = len(data)
    x = np.sort(data)
    y = np.arange(1, n+1) / n
  return x, y