차례:
- SciPy를 사용하여 과학 도구 액세스
- 클러스터링
- 모델 선택
- matplotlib 라이브러리 수행하는 분석의 데이터 표현을 작성하기위한 MATLAB과 같은 인터페이스를 제공합니다. 라이브러리는 현재 2D 출력으로 제한되어 있지만 분석하는 데이터에 표시되는 데이터 패턴을 그래픽으로 표현할 수있는 방법을 제공합니다.이 라이브러리가 없으면 데이터 과학 커뮤니티 외부의 사람들이 쉽게 이해할 수있는 결과물을 만들 수 없습니다.
비디오: 머신러닝 입문 강좌 | TEAMLAB X Inflearn | 1-6 Python ecosystem for machine learning 2024
Python에서 데이터 과학 작업을 수행하려면 라이브러리를로드해야합니다. 다음은 데이터 과학에 사용할 수있는 라이브러리의 개요입니다. 이 라이브러리는 데이터 과학자를 위해 여러 기능을 수행 할 수 있습니다.
SciPy를 사용하여 과학 도구 액세스
SciPy 스택에는 별도로 다운로드 할 수있는 다른 여러 라이브러리가 포함되어 있습니다. 이 라이브러리는 수학, 과학 및 공학을 지원합니다. SciPy를 얻으면 다양한 종류의 응용 프로그램을 만들기 위해 함께 작동하도록 고안된 일련의 라이브러리를 갖게됩니다. 이 라이브러리들은
판다를 사용하여 데이터 분석 수행
pandas 라이브러리는 데이터 구조 및 데이터 분석 도구를 지원합니다. 라이브러리는 데이터 과학 작업을 특히 빠르고 효율적으로 수행하도록 최적화되어 있습니다. pandas의 기본 원칙은 R과 같은 다른 언어와 유사한 Python을위한 데이터 분석 및 모델링 지원을 제공하는 것입니다.
Scikit-learn을 사용하여 기계 학습 구현
Scikit-learn 라이브러리는 여러 언어 중 하나입니다. Scikit 라이브러리는 NumPy와 SciPy가 제공하는 기능을 기반으로하여 Python 개발자가 도메인 별 작업을 수행 할 수 있도록합니다. 이 경우 라이브러리는 데이터 마이닝 및 데이터 분석에 중점을 둡니다.
Classification
회귀 분석클러스터링
차원 축소
모델 선택
전처리matplotlib을 사용하여 데이터 플로팅
matplotlib 라이브러리 수행하는 분석의 데이터 표현을 작성하기위한 MATLAB과 같은 인터페이스를 제공합니다. 라이브러리는 현재 2D 출력으로 제한되어 있지만 분석하는 데이터에 표시되는 데이터 패턴을 그래픽으로 표현할 수있는 방법을 제공합니다.이 라이브러리가 없으면 데이터 과학 커뮤니티 외부의 사람들이 쉽게 이해할 수있는 결과물을 만들 수 없습니다.
Beautiful Soup을 사용하여 HTML 문서 파싱
-
Beautiful Soup 라이브러리 다운로드는 실제로 Python 웹 사이트에서 찾을 수 있습니다. 이 라이브러리는 Python이 이해할 수있는 방식으로 HTML 또는 XML 데이터를 구문 분석하는 수단을 제공합니다. 트리 기반 데이터로 작업 할 수 있습니다.
-
트리 기반 데이터로 작업하기위한 수단을 제공 할뿐만 아니라, Beautiful Soup은 HTML 문서로 작업하는 많은 작업을 수행합니다. 예를 들어, HTML 문서의
-
인코딩
-
(문자가 문서에 저장되는 방식)을 UTF-8에서 유니 코드로 자동 변환합니다. 파이썬 개발자는 일반적으로 인코딩과 같은 것에 대해 걱정할 필요가 있지만 Beautiful Soup에서는 코드에 집중할 수 있습니다.