scikit-learn(‘싸이킷-런’, a.k.a. sklearn)은 파이썬으로 구현된 기계학습 오픈소스 라이브러리다! 오피셜 문서 첫 화면에 소개 된 특징은 다음과 같다.
- 데이터마이닝, 데이터 분석을 위한 간단하고 효율적인 도구 (Simple and efficient tools for data mining and data analysis)
- 누구나 사용할 수 있고, 다양한 상황에서 재사용이 가능 (Accessible to everybody, and reusable in various contexts)
- NumPy, Scipy, matplotlib을 기반으로 제작 (Built on NumPy, SciPy, and matplotlib)
- BSD 라이센스, 상업적으로 사용 가능한 오픈소스(Open source, commercially usable — BSD license)
scikit-learn 이 어떤 라이브러리인지 설명해 주세요.
주요 기능 3가지를 설명해 주세요.
scikit-learn은 python에서 다양한 기계학습 태스크를 수행하는데, 표준 라이브러리이다. 외에 추가적으로 설명할 수 있는 내용은 더 없을 듯 하다.
오피셜 문서 첫 화면을 통해 주요 기능은 다음과 같이 정리할 수 있다. —( 간판은 괜히 간판이 아니다.)
- 지도학습(Supervised learning) 모델: Classification, Regression
- 비지도학습(Unsupervised learning) 모델: Clustering
- 차원 축소 및 전처리: Dimensionality reduction, Preprocessing
- 모델 평가 및 선택: Model selection
다음 이야기: python vitualenv(가상환경) 사용법/개념