Machine Learning thật thú vị
Loạt bài này gồm 5 phần, được dịch từ nguồn https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471#.ksejcntgw Mình thấy loạt bài này tác giả rất thú vị nên mình sẽ dịch và cập nhật từng phần. Hy vọng sẽ giúp ích phần nào cho những bạn quan tâm tới lĩnh vực Học máy . Có phải bạn đã ...
Loạt bài này gồm 5 phần, được dịch từ nguồn https://medium.com/@ageitgey/machine-learning-is-fun-80ea3ec3c471#.ksejcntgw
Mình thấy loạt bài này tác giả rất thú vị nên mình sẽ dịch và cập nhật từng phần. Hy vọng sẽ giúp ích phần nào cho những bạn quan tâm tới lĩnh vực Học máy.
Có phải bạn đã từng nghe ai đó nói về Học Máy nhưng bạn chỉ hình dung được ý nghĩa mơ hồ về nó?
Loạt bài hướng dẫn này dành cho những ai đang tò mò về lĩnh vực Học Máy nhưng không biết bắt đầu từ đâu. Tôi hình dung rằng có rất nhiều người đã cố gắng đọc bài viết về học máy trên Wikipedia, đã thất vọng và từ bỏ mong móng ai đó sẽ đưa ra những giải thích ở mức độ cao hơn. Lọat bài viết này sẽ giúp bạn giải đáp về điều đó.
Mục đích là hướng tới tất cả mọi người - có nghĩa rằng bài viết sẽ được đề cập tới nhiều vấn đề tổng quan.
Machine Learning là gì?
Học Máy là ý tưởng rằng có những thuật toán di truyền có thể nói với bạn điều gì đó thú vị về một tập dữ liệu mà bạn không cần phải viết những đoạn mã tùy chỉnh cụ thể cho vấn đề đó. Thay vì phải viết mã, bạn cung cấp dữ liệu cho những thuật toán đó và nó xây dựng logic cho chính nó dựa trên dữ liệu.
Ví dụ, một trong số chúng là thuật toán phân lớp. Nó có thể phân chia dữ liệu vào nhiều nhóm khác nhau. Thuật toán phân lớp được dùng để nhận dạng chữ số tay cũng có thể được sử dụng để phân loại thư rác mà không cần thay đổi dòng mã nào. Chúng đều dùng chung một thuật toán nhưng được truyền vào các dữ liệu huấn luyện khác nhau do đó nó dẫn đến các logic phân lớp khác nhau.
"Học Máy" là một thuật ngữ chung bao gồm rất nhiều loại giải thuật di truyền.
Hai loại thuật toán học máy
Bạn có thể nghĩ tới các thuật toán học máy với hai nhóm chính: Học có giám sát và Học không giám sát. Sự khác biệt giữa chúng rất đơn giản nhưng lại thực sự quan trọng.
Học có giám sát
Giả sử rằng bạn là một đại lý bất động sản. Doanh nghiệp của bạn đang phát triển, vì vậy bạn thuê nhiều các thực tập sinh làm đại lý giúp đỡ bạn. Nhưng có một vấn đề - bạn có thể xem qua một ngôi nhà và có một ý tưởng tuyệt vời về giá trị của ngôi nhà đó. Nhưng các học viên của bạn không có kinh nghiệm như bạn vì vậy họ không biết cách để định giá được ngôi nhà của họ.
Để giúp đỡ các học viên, bạn quyết định viết một ứng dụng nhỏ có thể ước lượng giá trị của ngôi nhà trong khu vực dựa trên kích cỡ, khu vực lân cận, ..., và những ngôi nhà tương tự đã được bán.
vi vậy bạn viết ra mọi lần ai đó bán mọt ngôi nhà ở thành phố của bạn trong 3 tháng. Với mỗi ngôi nhà, bạn viết ra một loạt các đặc điểm - số lượng phòng ngủ, diện tích, khu vực lân cận,... Nhưng quan trọng nhất, bạn viết ra được giá bán cuối cùng:
Sử dụng dữ liệu huấn luyện trên, chúng ta muốn tạo ra một chương trình có thể ước lượng được giá trị của những ngôi nhà khác trong khu vực của bạn:
Đó được gọi là Học có giám sát. Bạn biết được câu trả lời cho mỗi vấn đề và có thể đi ngược từ đó để tìm ra logic chung.
Để xây dựng nên ứng dụng, bạn đưa dữ liệu huấn luyện về mỗi ngôi nhà vào thuật toán học máy của bạn. Thuật toán cố gắng tìm ra những dạng toán cần thực hiện để những con số bạn đưa vào làm việc.