Tự học machine learning nên bắt đầu từ đâu?
Những hướng dẫn đơn giản dưới đây có thể giúp bạn có được khởi đầu dễ dàng hơn với lĩnh vực đang cực hot này. Machine learning (ML) đang ngày càng trở thành lĩnh vực có tiềm năng ứng dụng rộng lớn mà không ai trong giới công nghệ còn có thể làm ngơ. Tuy nhiên, không phải ai cũng ...
Những hướng dẫn đơn giản dưới đây có thể giúp bạn có được khởi đầu dễ dàng hơn với lĩnh vực đang cực hot này.
Machine learning (ML) đang ngày càng trở thành lĩnh vực có tiềm năng ứng dụng rộng lớn mà không ai trong giới công nghệ còn có thể làm ngơ. Tuy nhiên, không phải ai cũng có may mắn được theo học ML chính thống ở trường. Harper Maddox, CTO của startup EdgeTheory đã chia sẻ về kinh nghiệm cá nhân của anh trong việc tự học ML ngay cả khi vô cùng bận rộn với ba con nhỏ cùng công việc tại công ty.
Nếu gõ tìm hướng dẫn lộ trình học ML lên Google, bạn sẽ nhận về vô số kết quả với những kho tài nguyên đồ sộ do cộng đồng tích lũy được. Tuy nhiên, nếu chưa có chút kinh nghiệm gì về mảng này thì hãy bắt đầu một cách nhẹ nhàng đơn giản trước đã.
Tiếp cận
1. Học nền tảng – Khóa online miễn phí
Đầu tiên, theo Maddox gợi ý, bạn hãy tham gia ngay khóa học Machine Learning “huyền thoại” trên Coursera của Giáo sư Andrew Ng, một trong những chuyên gia hàng đầu về AI hiện nay. Đây chính là khóa học được hầu hết những người làm việc trong ngành gợi ý. Nó sẽ cung cấp cho bạn những nguyên lý căn bản cũng như cách sử dụng hiệu quả các công cụ như Tensor Flow và Keras.
Nếu cảm thấy khó khăn với việc học bằng tiếng Anh, hãy thử bắt đầu với khóa Machine Learning cơ bản bằng tiếng Việt trên blog của anh Vũ Hữu Tiệp, một nghiên cứu sinh ngành Machine Learning and Computer Vision tại ĐH Bang Pennsylvania, Mỹ.
2. Ứng dụng AI – Email Newsletter
Maddox đăng ký nhận newsletter qua email từ Technically Sentiment, kênh thông tin chuyên cập nhật những diễn biến mới nhất trong các mảng AI, ML, robot cũng như khía cạnh kinh doanh, thương mại hóa của chúng. Thường newsletter sẽ được chuyển tới bạn vào một ngày cố định trong tuần để cập nhật những thông tin nổi bật cũng như bài báo đáng đọc nhất.
3. Podcast
Podcast gần giống như các kênh Youtube, cũng có thể subscribe theo dõi thường xuyên qua các ứng dụng podcast (Apple Podcast trên iOS hay Stitcher trên Android) hoặc vào thẳng website của kênh, chỉ khác là thường ở dạng audio nhiều hơn là video. Một số kênh podcast nổi bật được Maddox gợi ý là:
– Machine Learning Guide của OCDevel: chuyên đưa ra bình luận về từng tiết học trong khóa Machine Learning của Andrew Ng)
– TWiML (This Week in Machine Learning – ML tuần này có gì mới) của Xavier Amatriain, lãnh đạo nhóm ML tại Netflix.
– Machine Learning is Hard của Zayd Enam, chuyên gia đến từ Stanford AI Lab – bàn luận cả những chủ đề gai góc mà không nhiều người nhắc đến trong AI.
Thực hiện
Maddox chia sẻ anh thường theo dõi khóa học online của Coursera vào ban đêm nhưng cũng có khi tận dụng thời gian nghỉ trưa để xem luôn qua app Coursera (mỗi video trong khóa thường chỉ kéo dài vài phút). Một vài điều rút ra trong quá trình học:
– Dựa vào một lượng lớn dữ liệu, chúng ta có thể dự đoán khá chính xác những gì xảy ra kế tiếp.
– Bạn không nhất thiết phải giỏi toán mới học được: Tự nhận mình không hề giỏi đại số, Maddox vẫn có thể nắm bắt rất nhanh các khái niệm tầm cao. Nghe đến việc phải xử lý dữ liệu và thiết lập thuật toán trong ML, những người không khá toán có thể sẽ lo sợ nhưng thực tế, một khi đã hiểu bản chất, bạn sẽ thấy công việc ở đây chủ yếu sẽ là nhập dữ liệu đầu vào rồi xử lý chúng bằng một số công cụ trong Matlab, không giống toán bạn vẫn học ở phổ thông.
– Mỗi loại phần mềm lại được dùng cho một phạm vi riêng: Gradient Descent không phải thứ gì quá thần thánh. Những vấn đề tương tự có thể được giải quyết bằng ứng dụng Calculus qua những phương trình bình thường. Tuy nhiên, cách làm này lại không hiệu quả với những set dữ liệu có trên 10.000 đặc tính.
– Hãy quen với sự không chắc chắn: Ngay cả các chuyên gia cũng thường dựa vào những quy tắc bất thành văn và cũng có những điểm không thực sự hiểu rõ về ML.
– Debug gần như không thể thực hiện được: Mạng thần kinh nhân tạo cũng giống như những chiếc hộp đen, và thời gian để hoàn thành việc chỉnh sửa code có thể sẽ không nhanh chút nào.
– Các câu hỏi (quiz) đưa ra trong khóa học cũng không hề dễ: Bạn phải trả lời đúng 80% số câu hỏi đưa ra trong một bài quiz thì mới gọi là qua được bài đó. Bí quyết ở đây là hãy save các file tài liệu học PDF và đọc kỹ lại trước khi bắt tay vào làm quiz, và đừng quên kiểm tra kỹ câu trả lời trước khi ấn nút nộp bài.
Techtalk via GenK