비디오: Google I/O Keynote (Google I/O '17) 2024
세션 ID가있는 웹 서버는 검색 엔진의 삶을 흥미롭게 만듭니다. 세션 ID 는 특정 시간에 사이트를 방문한 특정 사용자를 식별하여 서버가 방문자가 어떤 페이지를보고 어떤 세션이 방문자가 세션을 수행하는지 추적 할 수있게합니다.
웹 사이트에서 페이지를 요청하면 페이지가있는 웹 서버가 브라우저로 보냅니다. 그런 다음 다른 페이지를 요청하면 서버는 해당 페이지도 보내지 만 서버는 사용자가 동일한 사람인지 여부를 알지 못합니다. 서버가 본인을 알아야 할 경우 페이지를 요청할 때마다 사용자를 식별 할 수있는 방법이 필요합니다. 세션 ID를 사용하여이를 수행합니다.
세션 ID는 여러 가지 이유로 사용되지만 웹 개발자가 다양한 유형의 대화 형 사이트를 만들 수 있도록하는 것이 주 목적입니다. 예를 들어 개발자가 안전한 환경을 만든 경우 방문자가 먼저 홈 페이지를 통과하도록 할 수 있습니다. 또는 개발자가 미완성 세션을 다시 시작하는 방법을 원할 수도 있습니다. 방문자의 컴퓨터에 세션 ID가 포함 된 쿠키를 설정함으로써 개발자는 방문자의 마지막 세션이 끝날 때 방문자가 사이트에 있었던 위치를 알 수 있습니다.
귀하를
인식합니다.
URL 자체에 표시하십시오.
-
일부 시스템은 세션 ID를 쿠키에 저장하도록 설정되어 있지만 사용자 브라우저가 쿠키를 허용하지 않도록 설정 한 경우 URL 세션 ID를 사용합니다. 다음은 세션 ID가 포함 된 URL의 예입니다.
-
http: // yourdomain. co.kr / index jsp; jsessionid = 07D3CCD4D9A6A9F3CF9CAD4F9A728F44
URL의 07D3CCD4D9A6A9F3CF9CAD4F9A728F44 부분은 세션에 할당 된 고유 식별자입니다.
검색 엔진이 URL을 세션 ID를 포함하는 것으로 인식하면 검색 봇이 사이트로 돌아올 때마다 세션 ID가 만료되어 서버가 다음 중 하나를 수행하므로 참조 된 페이지를 읽지는 않을 것입니다. 다음:
색인 된 페이지가 아닌 오류 페이지를 표시하거나 사이트의 기본 페이지를 표시 할 수 있습니다.
즉, 검색 엔진은 누군가가 검색 결과 페이지의 링크를 클릭하면 거기에없는 페이지의 색인을 생성했습니다.
-
새 세션 ID를 할당하십시오. 원래 검색 번트가 사용한 URL의 유효 기간이 만료되었으므로 서버는 ID를 다른 것으로 바꾸고 URL을 변경합니다. 따라서 스파이더는 동일한 페이지에 대해 여러 개의 URL을 제공받을 수 있습니다.
-
검색 봇이 참조 된 페이지를 읽는 경우에도 색인을 생성하지 않을 수 있습니다. 웹 마스터는 때때로 검색 엔진이 자신의 사이트에 들어 왔고 동일한 페이지를 반복해서 요청했으며 대부분의 사이트 색인을 생성하지 않고 남아 있다고 불평했습니다. 검색 봇은 혼란스러워지고 떠났습니다. 또는 검색 엔진이 URL의 세션 ID를 인식하지 못하는 경우가 있습니다. 한 고객에게는 Google에서 색인을 생성 한 수백 개의 URL이 있었지만 모두 긴 만료 된 세션 ID 였기 때문에 모두 사이트의 기본 페이지를 가리 켰습니다. 주요 검색 엔진의 검색 봇은 세션 ID를 인식하고이를 해결하기 위해 최악의 시나리오를 사용합니다. 또한 세션 ID를 사용하는 경우 canonical 지시어를 사용하여 검색 엔진에 페이지의 올바른 URL을 알리는 것이 좋습니다. 예를 들어 세션 ID를 사용 중이며 URL이 다음과 같은 경우:
http: // www. 너. co.kr / product. PHP? item = rodent-racing-gear & xyid = 76345 & sessionid = 9876
검색 엔진은 결국 동일한 페이지를 효과적으로 참조하는 수백 개의 URL로 끝날 수 있습니다. 따라서 웹 페이지의 섹션에 태그를 넣으면 검색 엔진에 올바른 URL을 알릴 수 있습니다.
세션 ID 문제는 예전보다 훨씬 적습니다. 과거에는 세션 ID 문제를 해결하는 것이 마술을 수행하는 것과 같았습니다. 검색 엔진에서 보이지 않는 사이트가 갑자기 나타납니다! 검색 엔진 토론 그룹의 한 사이트 소유자는 자신의 사이트가 Google에서 색인을 생성 한 페이지가 6 개를 초과하지 않았지만 세션 ID를 제거한 지 일주일 만에 600 페이지가 넘는 색인을 생성했다고 설명했습니다.
사이트에 세션 ID 문제가있는 경우 표준 지시문을 사용하는 것 외에 다음과 같은 몇 가지 작업을 수행 할 수 있습니다.
URL에 세션 ID를 사용하는 대신 세션 정보를 사용자의 컴퓨터.
페이지가 요청 될 때마다 서버는 세션 정보가 저장되어 있는지 확인하기 위해 쿠키를 검사 할 수 있습니다. 그러나 서버는
-
쿠키를 요구하지 않아야하며, 그렇지 않으면 추가 문제가 발생할 수 있습니다. 서버에서 웹 페이지를 요청하는 장치가 검색 표시 줄이면 프로그래머가 세션 ID를 생략하도록하십시오. 서버는 searchbot에 동일한 페이지를 전달하지만 세션 ID를 할당하지 않으므로 세션 ID를 사용하지 않고 검색 봇을 사이트 전체로 이동할 수 있습니다. 이 프로세스는 사용자 에이전트가 페이지를 요청하는 브라우저, 검색 봇 또는 기타 프로그램을 참조하는 사용자 에이전트 전송
-
으로 알려져 있습니다. 클로킹으로 알려진 기술에서 서버는 한 페이지를 검색 엔진에 보내고 다른 페이지는 실제 사이트 방문자에게 보냅니다.일부 웹 사이트는 사이트 방문자가 보는 콘텐츠와 다른 콘텐츠를 제공하여 속임수를 사용하려고하기 때문에 검색 엔진은 일반적으로 클로킹을 좋아하지 않습니다. 물론 세션 ID 문제를 피하기 위해이 기술을 사용하는 맥락에서 이는 의도가 아닙니다. 이는 사이트 방문자가 보는 동일한
콘텐츠를 표시하는 방법이므로 사실적인 클로킹이 아닙니다. 그러나, 위험은 검색 엔진이 무슨 일이 일어나고 있는지를 알아 내면 은폐로 간주 할 수 있습니다.