sklearn là thư viện về machine learning phổ biến nhất của Python. Nó viết sẵn các thuật toán lằng nhằng phức tạp, bạn chỉ việc nhét dữ liệu vào, chờ nó tính toán rồi lấy kết quả, dễ như ăn kẹo.

Iris

Bài này thừa nhận rằng bạn có biết đọc code Python. Ta tập trung vào: kiến thức về xử lý dữ liệu, machine learning và sử dụng sklearn. Nếu bạn không biết cả 3 thứ này, học cả 3 cùng lúc sẽ rất mệt và không hiệu quả.

import sklearn
import sys
print("Python version: {}".format(sys.version))
print("sklearn version: {}".format(sklearn.__version__))

Kết…


R — đầy đủ là GNU R — là một ngôn ngữ lập trình dành cho phân tích / biểu diễn dữ liệu.

Khi tên một phần mềm có chữ GNU đứng đầu, ám chỉ nó là một sản phẩm của tổ chức GNU — tức là miễn phí hoàn toàn.

Vào năm 2017, R là nền tảng hấp dẫn thứ 2 (nó đứng thứ 1 năm 2016) cho việc phân tích dữ liệu. Python soán ngôi thứ nhất — khi vừa cung cấp nhiều tính năng giống R, lại vừa là một ngôn ngữ lập trình đa mục đích.

Tại sao lại không dùng Python?


(hay vẽ đồ thị hàm số với Matplotlib Python) by HVN at https://pymi.vn

Toán học vốn được dạy một cách khô khan ở hầu hết các lớp học toán, tất cả các cấp học từ phổ thông đến đại học. Không thể trách có những người ghét toán, sợ toán, trong khi ở phía khác, có những người khen toán học đẹp đẽ và tuyệt vời.

Với những người “hiểu” toán, đồ thị và hàm số là những công cụ tuyệt vời, đẹp đẽ. Đối với phần còn lại, đồ thị là một bài toán cần phải khảo sát và…


Tính toán, vẽ đồ thị, trình bày báo cáo khoa học, chạy code Python, R… trên cùng một chương trình: Jupyter

Ma trận, không trận nào mà lại khiến sinh viên sợ như ma👻

Trước đây ta thường viết công thức toán bằng tay, vừa xấu, vừa xa, nhìn lại không ra gì. Mãi cho tới năm học cuối, khi phải đi làm đồ án tốt nghiệp, lúc ấy mới cần viết công thức toán lên máy tính. Các sinh viên “tiêu chuẩn” sẽ làm đồ án và viết lên Microsoft Word, việc gõ công thức khá trực quan nhưng cũng xấu và không kém phần mệt mỏi.
Một cách khác là dùng LATEX


Làm quen với Machine Learning căn bản bằng Python

Bài toán thầy giáo PyMi.vn bán chuối 🍌

Nếu biết một giảng viên Python bán chuối, bán 10 quả anh có 30 nghìn VNĐ, bán 3 quả anh có 9 nghìn, bán 5 quả anh có 15 nghìn. Hỏi bán 9 quả anh có bao nhiêu tiền? Để giải bài này, ta sẽ dùng 1 thuật toán trong machine learning có tên Linear Regression.

CHÚ Ý

Nếu bạn không biết tiếng Anh, bài viết này cung cấp đủ dùng cho bạn.
Bạn chỉ cần biết toán cấp 2, không cần biết toán cấp 3 hay đại học để hiểu bài này. Bạn…


Auto-complete IPython 6

Một công cụ không thể thiếu của bất cứ lập trình viên Python nào: IPython

Chữ I ở đây luôn được viết HOA, phân biệt với các sản phẩm của Apple (iPhone, iPad…). Chữ I này là viết tắt của “Interactive”.

IPython là gì?

Nếu bạn vẫn chưa biết IPython thì đây là những tính năng nổi bật:

  • Auto-complete: chỉ gõ một phần của câu lệnh / function rồi bấm phím tab, IPython sẽ hiện ra các lựa chọn có thể.
  • Có màu cho các từ khoá của Python (if/def/for/list/str …)
  • Truy cập nhanh nội dung của help(x): Ví dụ để xem method…


Chỉ số chất lượng không khí (PM2.5 AQI) tại tp.Hà Nội và tp.Hồ Chí Minh từ 17h 24/3/2017 đến 16h 25/3/2017

Chỉ số PM2.5 (Particulate Matter 2.5 — bụi có đường kính động học ≤2,5µm [1]) AQI (Air Quality Index) là một chỉ số quan trọng để đánh giá mức độ ô nhiễm của không khí.

AQI từ 101 đến 150 là chất lượng không khí ảnh hưởng tới sức khỏe của bệnh nhân về hô hấp, tim mạch. AQI 151–300 phản ánh không khí không tốt cho sức khoẻ của tất cả mọi người. AQI cao hơn 300 là mức rất nguy hại, mọi người không nên ra ngoài. …


Đồ thị của một tập dữ liệu theo phân phối chuẩn

Statistics (thống kê) là một nhánh của toán học, thực hiện thu thập, phân tích, thấu hiểu, và biểu diễn một lượng số liệu lớn.
Là một cựu sinh viên viện Toán Ứng Dụng và Tin Học của đại học Bách Khoa Hà Nội, nhưng sau 4 năm không động tới thì tôi thậm chí còn chả nhớ nổi một khái niệm đã học ở trường, không phân biệt nổi phương sai và độ lệch chuẩn. Sau ngần ấy thời gian đi làm, tôi nhận ra thống kê là một bộ môn thực hành (chứ không phải lý thuyết) đầy thú…


Catch ghost by Python

Một đêm trăng sáng không đèn, cu Hít bật IPython Python3 lên để gõ:

Có vẻ hơi dài để so sánh bằng mắt thường, xếp chúng thẳng hàng nhau và đọ chiều dài:

Khi đã xếp thành hàng rồi sẽ thấy rõ, nhìn bằng mắt thường, đeo kính cận hay soi kính lúp, 2 string này trông GIỐNG HỆT nhau.

Đó là lý do người ta tin có ma, cho đến khi … người ta không tin nữa. …


Python sets

Tại lớp PyFML, một học viên sau khi đọc docstring của kiểu dữ liệu set thấy:

In [1]: set? # dùng IPython
Init signature: set(self, /, *args, **kwargs)
Docstring:
set() -> new empty set object
set(iterable) -> new set object
Build an unordered collection of unique elements.
Type: type

Nhưng theo quan sát thì thấy set có vẻ có thứ tự:

In [2]: set([10,5,1,2,6])
Out[2]: {1, 2, 5, 6, 10}

Tại sao?

Trả lời

Nói về thứ tự: nếu 1 list là: [1,2,3,4], nó đang xếp theo thứ tự số học (numerical) tăng dần.
Thử với list string

In [8]: set([‘121’, ‘13’…

Viet Hung Nguyen

Python addict, CLI lover, minimalist, runs pymi.vn

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store