개인 재정 기계 학습을위한 벡터 간의 유사성 측정 - 더미

기계 학습을위한 벡터 간의 유사성 측정 - 더미

차례:

비디오: 7 1 Clustering I 2024

비디오: 7 1 Clustering I 2024
Anonim

벡터로 생각하면 계산을 사용하여 데이터의 예제를 쉽게 비교할 수 있습니다. 다음 정보는 학습 목적으로 벡터 간의 거리를 계산하는 등의 작업을 수행하기 위해 벡터 간의 유사성을 측정하는 방법을 설명합니다.

유사성 이해

벡터 형식에서는 예제의 각 변수를 일련의 좌표로 볼 수 있으며 각 변수는 다른 공간 차원의 위치를 ​​가리 킵니다. 벡터에 두 개의 요소가있는 경우, 즉 두 개의 변수 만 있으면 작업 할 수 있습니다.이 값은 East-West 축의 위치에 첫 번째 숫자를 사용하고 North-West 축의 첫 번째 숫자를 사용하여지도에서 항목의 위치를 ​​확인하는 것과 같습니다. 남쪽 축.

차트의 값으로 플롯 된 값의 예.

예를 들어 괄호 (1,2) (3,2)와 (3,3) 사이의 숫자는 모두 점의 예입니다. 각 예제는 x (가로 축) 및 y (가로 축)에 대한 목록의 첫 번째 값을 사용하여지도에 쉽게 배치하고 인쇄 할 수있는 정렬 된 값 목록 (튜플이라고 함)입니다. 결과는 산점도입니다.

다차원성에 대해 걱정하지 마십시오. 2 차원 또는 3 차원에서 배운 규칙을 여러 차원으로 확장하므로 규칙이 2 차원 공간에서 작동하면 여러 차원에서 작동합니다. 그러므로 모든 예들은 처음에 2 차원적인 예들을 언급한다.

학습을위한 계산 거리

알고리즘은 거리 측정을 사용하는 수의 벡터를 사용하여 학습 할 수있다. 벡터에 의해 암시 된 공간은 거리가 특정 조건을 존중하는 공간 인 미터법입니다:

음수 거리가 없으며 시작점과 끝점이 일치 할 때만 거리가 제로입니다 (

비대칭

  • ). 거리는 한 점에서 다른 점으로 향하는 것과 같고 그 반대도 마찬가지입니다 (symmetry
  • 라고 함). 초기 점과 최종 점 사이의 거리는 초기 점에서부터 세 번째 점까지 그리고 마지막 점에서 마지막 점까지의 거리보다 항상 크거나 같지 않다 (삼각형 부등식 < - 바로 가기가 없음을 의미). 미터법 공간을 측정하는 거리는 유클리드 거리, 맨하탄 거리 및 체비 셰프 거리입니다. 이것들은 숫자 벡터에 적용 할 수있는 모든 거리입니다.
  • 유클리드 거리 (Euclidean distance) 가장 일반적인 것은 유클리드 거리이며 두 벡터의 l2 놈으로도 설명됩니다 (l1, l2 및 linfinity 놈의 설명을 참조하십시오). 2 차원 평면에서 유클리드 거리는 두 점을 연결하는 직선으로 재구성되며 두 벡터의 요소 사이의 차의 제곱의 합을 제곱근으로 계산합니다. 위의 그림에서 점 (1, 2)과 (3, 3) 사이의 유클리드 거리는 sqrt ((1-3) ^ 2 + (2-3) ^ 2)로 R에서 계산할 수 있습니다. 거리의 약 2 236. 맨하탄 거리

또 다른 유용한 측정 값은 맨하탄 거리 (두 벡터의 11 표준으로 설명 됨)입니다. 벡터의 요소 간 차이의 절대 값을 합산하여 맨하탄 거리를 계산합니다. 유클리드 거리가 최단 경로를 표시하면 맨해튼 거리는 도시에서 이동하는 택시의 방향과 비슷하게 가장 긴 경로를 표시합니다. (거리는 택시 또는 도시 블록 거리라고도합니다.) 예를 들어, 포인트 (1, 2)와 (3,3) 사이의 맨하탄 거리는 abs (1-3)이고 abs Chebyshev distance

Chebyshev distance 또는 maximum metric은 벡터 요소 간의 절대 차이의 최대 값을 취합니다. 이것은 체스 게임이나 창고 물류에서 왕이 어떻게 움직여 오버 헤드 크레인이 크레이트를 한 장소에서 다른 장소로 이동 시키는데 필요한 작업을 나타내는 거리 측정입니다.

기계 학습에서 Chebyshev 거리는 많은 치수를 고려해야 할 때 유용합니다. 대부분 Chevyshev에서는 절대 차이가 가장 큰 것을 선택하기 만하면됩니다. 위의 예제에서 거리는 단순히 2이며 최대 값은 (1-3)과 abs (2-3) 사이입니다.

기계 학습을위한 벡터 간의 유사성 측정 - 더미

편집자의 선택

Photoshop Elements 11 - Stone

Photoshop Elements 11 - Stone

을 사용하여 Stone Out을 조각하는 방법 Photoshop Elements 11의 도구를 입력하여 텍스트와 같은 모양의 선택 영역을 만든 다음 이미지 자체를 해당 유형의 채우기로 사용합니다. 예를 들어 꽃 테마 웹 페이지를 만드는 경우 꽃 그림을 텍스트 채우기로 사용할 수 있습니다. 유형 선택을 사용하면 모든 부분을 잘라낼 수 있습니다.

Photoshop Elements 9에서 여러 파일을 일괄 처리하는 방법 - 여러 개의 인형이있는 경우

Photoshop Elements 9에서 여러 파일을 일괄 처리하는 방법 - 여러 개의 인형이있는 경우

여러 파일에 공통적으로 적용 할 편집 기능을 사용하면 Photoshop Elements에서 이러한 변경 사항을 일괄 적으로 처리 할 수 ​​있습니다. 단일 메뉴 명령을 사용하여 파일 형식을 변경하고 파일 속성을 변경하고 공통 파일 기본 이름을 추가 할 수 있습니다. 파일 이름 바꾸기는 내보내기 명령의 일부일 수도 있고 사용할 수도 있습니다.

편집자의 선택

승마 2012 런던 하계 올림픽 - 인형

승마 2012 런던 하계 올림픽 - 인형

승마 (말의 화려한 이름) 경쟁 런던 2012 하계 올림픽은 조련사, 이벤트 및 점프의 세 가지 분야로 구성됩니다. 각 분야는 팀과 개인 메달을위한 기회를 제공합니다. 대회는 7 월 28 일부터 31 일까지 개최됩니다. 조련사 경연 대회는 8 월 2 일부터 9 일까지 개최됩니다. 점프 대회는 ...

동계 올림픽에서의 자유형 스키 - 인형

동계 올림픽에서의 자유형 스키 - 인형

프리 스타일 스키는 동계 올림픽의 X 게임 이벤트 중 하나입니다. . 자유형 스키에서는 경쟁자가 언덕 꼭대기에서 바닥까지 다양한 행사를 수행합니다. 프리 스타일 스키는 기술 스키의 가장 중요한 부분을 차지하며 스노우 보드에서 트릭을 만들어내는 기술과 결합되어 있습니다.

필드 2012 런던 하계 올림픽의 이벤트 - 인형

필드 2012 런던 하계 올림픽의 이벤트 - 인형

스프린트, 릴레이 및 도로 경주 이외에도 2012 런던 하계 올림픽 육상 경기에는 점프 및 던지기 경기가 포함됩니다. 남자와 여자는 높은 점프, 긴 점프, 트리플 점프, 장대 높이뛰기 등의 4 가지 점프 이벤트와 총구, 원반, 창 던지기 및 망치와 같은 네 가지 투구 이벤트에서 경쟁합니다. 필드 이벤트 ...

편집자의 선택

Excel의 유용한 범위 객체 메소드 2016 VBA 프로그래밍 - VBA 메소드가 수행하는

Excel의 유용한 범위 객체 메소드 2016 VBA 프로그래밍 - VBA 메소드가 수행하는

엑셀 2016의 액션. Range 객체는 수십 개의 메소드를 가지고 있지만, 이들 중 대부분은 필요하지 않습니다. 여기서는 가장 일반적으로 사용되는 Range 객체 메소드를 찾습니다. Select 메서드 Select 메서드를 사용하여 셀 범위를 선택합니다. 다음 문은 ...

시나리오 관리자를 사용하여 대출 계산 모델링 방법 - 더미

시나리오 관리자를 사용하여 대출 계산 모델링 방법 - 더미

시나리오 관리자는 목표 탐색 데이터 탭의 가정 분석 섹션에 데이터 테이블이 있습니다. 다른 유용한 도구와 함께 그룹화하면 시나리오 관리자가 중요한 도구임을 믿게 될 것입니다. 그러나 유용한 이름과 좋은 회사가 있음에도 불구하고 ...

더 나은보고 모델을 위해 Power Query와 Power Pivot을 함께 사용 - Power Pivot을 사용하여 더미

더 나은보고 모델을 위해 Power Query와 Power Pivot을 함께 사용 - Power Pivot을 사용하여 더미

Power Query를 함께 사용하면 관리 및 유지 보수가 쉬운보고 모델을 만들 수 있습니다. 보고 모델은보고 메커니즘이 구축되는 기초를 제공합니다. 데이터를 가져오고, 변환하고, 모양을 만들고, 집계하는보고 프로세스를 작성하면 본질적으로보고 모델을 구축하게됩니다. 잘못 작성하는 중 ...