비디오: Supervised Learning by Andrew Ng 2024
예측 분석을 위해 알고리즘을 사용할 데이터를로드해야합니다. scikit이 이미 데이터 셋을로드하는 함수를 만들었 기 때문에 아이리스 데이터 셋을 scikit에로드하는 것은 몇 줄의 코드를 발행하는 것만 큼 간단합니다.
세 길이 | 세퍼 레이션 | 꽃잎 길이 | 꽃잎 너비 | 대상 클래스 / 라벨 |
---|---|---|---|---|
5. 1 9. 599. 4 990. 2 세토 사 (0) | 7. 0 9. 2 4. 799. 4 Versicolor (1) | 6. 3 3. 3 9. 0 2. Virginica (2) |
|
새로운 파이썬 대화 형 셸 세션을 엽니 다. |
새로운 파이썬 세션을 사용하여 메모리에 남아있는 것이 없으며 함께 작업 할 수 있습니다. | 프롬프트에 다음 코드를 입력하고 sklearn의 >>>> 결과를 확인하십시오. datasets import load_iris >>> iris = load_iris () | 이 두 문장을 실행 한 후에는 인터프리터의 메시지를 보지 않아야합니다. 변수 iris는 홍채의 모든 데이터를 포함해야합니다. CSV 파일. | >>> iris | 결과는 홍채의 모든 내용이됩니다. csv 파일과 함께 load_iris 함수가 변수에로드 한 데이터 집합에 대한 다른 정보를 제공합니다. 변수는 네 가지 주요 속성을 가진 사전 데이터 구조입니다. 홍채의 중요한 특성은 다음과 같습니다. |
속성 이름 | 설명 | 데이터 | 관측치의 모든 측정 값을 포함합니다. |
-
지형지 물의 이름 (속성 이름)을 포함합니다.
target
-
관측치의 모든 대상 (레이블)을 포함합니다.
target_names
클래스의 이름을 포함합니다.
인터프리터에서 변수 이름을 입력하고 점과 속성 이름을 차례로 입력하여 값을 인쇄 할 수 있습니다. 예를 들어 홍채를 사용합니다. 데이터는 다음과 같이 홍채 속성에 액세스합니다. >>>> 홍채. 데이터
이것은 많은 프로그래밍 언어로 객체의 속성에 액세스하는 표준 방법입니다.
SVM 분류 자의 인스턴스를 만들려면 해석기에 sklearn의 >>>> 코드를 입력합니다. svm import LinearSVC >>> svmClassifier = LinearSVC (random_state = 111)
첫 번째 코드 행은 Linear SVC 라이브러리를 세션으로 가져옵니다. SVC (선형 지원 벡터 분류 자)는 선형 분류를위한 SVM 구현이며 다중 클래스 지원을 포함합니다.데이터 세트는 다소 선형으로 분리 가능하며 3 개의 클래스가 있으므로 선형 SVC를 사용하여 어떻게 수행되는지 확인하는 것이 좋습니다.
두 번째 줄은 svmClassifier 변수를 사용하여 인스턴스를 만듭니다. 이것은 기억해야 할 중요한 변수입니다. random_state 매개 변수를 사용하면 이러한 예제를 재현하고 동일한 결과를 얻을 수 있습니다. random_state 매개 변수를 넣지 않으면 결과가 여기에 표시된 것과 다를 수 있습니다.