
hống kê và phân nhóm dữ liệu trong Pandas - Pandas
Một trong những phần thiết yếu của xử lý dữ liệu lớn đó là thống kê dữ liệu. Như trong bài Xác suất và Thống kê với NumPy, mình đã đề cập đến khá nhiều phương thức thống kê như max, min, median, mean,.... Về cơ bản, thống kê các giá trị này cho ta 1 con số phản ánh cho một vấn đề nhất định trong ...

ìm hiểu thư viện phân tích dữ liệu PANDAS trong Python - Pandas
Python là một ngôn ngữ lập trình được ứng dụng nhiều trong phát triển trí tuệ nhân tạo.Trong đó thư viện Pandas được dùng để phân tích dữ liệu tự động khá phổ biến dành riêng cho Python. Trong bài viết này, Growupwork sẽ giới thiệu với các bạn về thư viện phân tích dữ liệu PANDAS trong lập trình ...

Pandas là gì? Cách cài đặt Pandas Python - Pandas
Trong bài này mình sẽ hướng dẫn các bạn cách cài đặt thư viện Pandas Python. Qua bài này sẽ giúp bạn hiểu khái niệm Pandas là gì? Những lợi ích khi sử dụng Pandas? Và các bước cài đặt như thế nào? 1. Pandas là gì? Pandas là một thư viện mã nguồn mở giúp phân tích và thao tác dữ liệu nhanh, ...

ìm hiểu Series, DataFrame và Index trong Pandas - Pandas
Trong bài trước ta đã tìm hiểu về pandas cũng như cách cài đặt thư viện này, vậy thì trong bài này ta sẽ tìm hiểu về Pandas Object, một kiến thức quan trọng khi học Pandas. Ở mức độ cơ bản nhất thì bạn có thể hiểu Pandas object giống như phiên bản nâng cấp của NumPy Structured Array (bài cuối ...

Data Selection và Indexing trong Pandas - Pandas
Trong bài này chúng ta sẽ tìm hiểu Data Selection và Indexing trong Pandas, thông qua hai đối tượng DataFrame và Series. Trong chương NumPy, chúng ta đã tìm hiểu các cách để truy cập vào các phần tử / mảng con như: indexing (vd: arr[2]), slicing (vd: ...

Xử lý dữ liệu trong Pandas - Pandas
Ở trong series về NumPy ta đã được làm quen với các Ufuncs rất mạnh mẽ trong các thao tác tính toán và xử lý dữ liệu như các hàm số học (cộng, trừ, nhân, chia,...) và những phép toán phức tạp (lượng giác, luỹ thừa,...), vì Pandas vốn được xây dựng trên NumPy, nó kế thừa hầu hết các ưu điểm và các ...

Hierarchical Indexing trong Pandas - Pandas
Từ đầu chương đến giờ, chúng ta đã tìm hiểu và sử dụng về Series và DataFrame khá nhiều và nó tỏ ra rất hữu ích trong việc lưu trữ cũng như thao tác dữ liệu. Thực tế thì như trong các bài trước đã nói, chúng ta hình dung Series như là mảng 1 chiều còn DataFrame là mảng 2 chiều. Tuy nhiên trong ...

Kết hợp các tập dữ liệu trong Pandas - Pandas
Một trong những điều mà ai cũng phải làm trong Data Science đó là kết hợp các bộ dữ liệu từ các nguồn khác nhau. Tuỳ thuộc vào kiểu dữ liệu mà ta sẽ có các thao tác khác nhau, trong đó phổ biến nhất là việc kết hợp giữa những dữ liệu nhỏ, đơn giản hay kết hợp những tập dữ liệu lớn như database-style ...

Django là gì? Có nên sử dụng Django để làm website? - Học Django từ căn bản đến nâng cao
Trong bài viết này mình sẽ giới thiệu Django là gì? Đây là một framework Python được dùng để xây dựng ứng dụng website. Nói đến làm website thì nhiều người sẽ nghĩ tới PHP, .NET, ASP, ... nhưng có lẽ nhiều người không biết rằng Python có thể làm được, không những vậy mà còn rất mạnh là đằng khác, ...

Ứng dụng quản lý sinh viên với MySQL và Python cơ bản - Python nâng cao
Trong bài này mình sẽ làm một bài tập, đó là xây dựng ứng dụng quản lý sinh viên với MySQL và Python cơ bản, qua đó bạn sẽ biết cách xử lý truy vấn CSDL MySQL bằng Python. Trước khi đọc bài này thì bạn phải xem bài xử lý MySQL trong Python nhé, trong bài đó mình đã hướng dẫn các thao tác như: ...

Random trong Python: Tạo số random ngẫu nhiên - Python nâng cao
Trong bài này mình sẽ hướng dẫn bạn cách tạo số ngẫu nhiên bằng cách sử dụng module random trong Python. Với module này bạn có thể tạo ra một số ngẫu nhiên bất kì dựa với nhiều yêu cầu khác nhau. Random number generator (RNG) là một số được tạo ra ngẫu nhiên từ máy tính, và thường có hai loại ...

Xử lý chuỗi JSON trong Python - Python nâng cao
Trong bài này mình sẽ hướng dẫn cách xử lý chuỗi JSON trong Python, bằng cách sử dụng module json bạn có thể chuyển chuỗi JSON thành dữ liệu có cấu trúc trong Python. JSON (JavaScript Object Notation) là một định dạng dữ liệu có cấu trúc rõ ràng, dễ dàng đọc bởi mắt thường, cũng như máy tính có ...

Cách sử dụng Google Translator trong Python - Python nâng cao
Trong bài học này chúng ta sẽ tìm hiểu googletrans, hay còn gọi là Python Google Translator, đây là một module dùng để dịch văn bản qua các ngôn ngữ bằng cách sử dụng Google API. 1. Python Google Translator là gì? Python googletrans là một module để dịch văn bản. Nó sử dụng API Google ...

Xử lý MySQL trong Python (insert / update / delete / select) - Python nâng cao
Trong bài này mình sẽ hướng dẫn cách dùng module mysql-connector-python để xử lý kết nối và truy vấn MySQL. Các thao tác trong MySQL cơ bản như kết nối / insert / update / delete và select. Đây là module phổ biến nhất khi làm việc với MySQL trong Python. Và trước khi bắt đầu thì mình xin giới ...

Multiprocessing trong Python (xử lý đa tiến trình) - Python nâng cao
Trong bài này chúng ta sẽ tìm hiểu xử lý đa tiến trình trong Python. Đa xử lý hay còn gọi là multiprocessing, thường được dùng để xử lý nhiều tiến trình chạy song song. Đa xử lý được tích hợp trong module multiprocessing, trong đó có lớp process, vì vậy bạn phải import thư viện này vào trước khi ...

Hướng dẫn cài đặt package Python với pi - Python nâng cao
Trong bài này mình sẽ hướng dẫn các bạn cách cài đặt package Python với pip, đây là lệnh giúp bạn install package, update package trong Python một cách dễ dàng. Package Python giống như là một phần mềm nên muốn sử dụng thì bạn phải cài đặt nó. Bạn cũng có thể xem nó như là những plugin của ...

Hướng dẫn cài đặt và sử dụng Jupyter Notebook - Python nâng cao
Nếu bạn là người mới và thắc mắc muốn tìm một công cụ nào giúp phát triển cũng như hỗ trợ tương tác cho project về data science, thì có lẽ hầu hết mọi người sẽ trả lời là Jupyter Notebook. Một notebook có thể xuất ra một tài liệu duy nhất trong đó kết hợp hình ảnh trực quan, văn bản tường thuật, ...

Anaconda là gì? Cài đặt Anaconda trên Windows - Linux - Mac OS - Python nâng cao
Trong bài này chúng ta sẽ tìm hiểu khái niệm Anaconda là gì, đồng thời mình cũng hướng dẫn cách cài đặt Anaconda để bắt đầu học Data Science nhé. Máy tính của chúng ta có khả năng chạy nhiều chương trình. Tuy nhiên, khi bạn muốn tạo hoặc viết nên ứng dụng của riêng mình, ví dụ như xây dựng một ...

Built-in Functions trong Python - Python căn bản
Trong bài này mình sẽ tổng hợp những Build-in functions trong Python, đây là danh sách những hàm có sẵn trong Python mà bạn chỉ việc gọi ra để sử dụng. Trong Python, Build-in functions có rất nhiều hàm khác nhau giúp lập trình viên tiết kiệm thời gian trong việc giải quyết bài toán. Ví dụ với hàm ...

Các câu hỏi thường gặp trong Python - Python căn bản
Đây là tổng hợp những câu hỏi cơ bản thường gặp nhất trong quá trình học Python, hy vọng những câu hỏi này sẽ giúp bạn nâng cao thêm kiến thức lập trình Python. Về bài tập thì mình không soạn ở đây, mà chỉ trả lời những thủ thuật nhỏ hoặc là những câu hỏi nhỏ thường gặp thôi nhé. ...