비디오: 네이버 영화 리뷰 데이터 분석 ② 데이터 시각화 [ Python 데이터 분석과 이미지 처리 ] 2024
Bernard Marr
큰 데이터는 큰 헤드 라인을 만들어 내지 만, 최신 비즈니스 유행. 이 현상은 매우 현실적이며 많은 다른 분야, 특히 비즈니스 분야에서 구체적인 이점을 제공합니다. 여기서는 비즈니스 소유자 또는 관리자로서 큰 데이터의 핵심에 도달하게 될 것입니다. 비즈니스를위한 중요한 대용량 데이터 기술을 이해하는 데 필요한 핵심 용어, 큰 데이터를 사용하여 더 나은 의사 결정을 내리기위한 10 단계, 통찰력을 데이터에서 동료에게 전달하는 데 필요한 팁.
대용량 데이터 전문 용어 이해
대용량 데이터를 둘러싼 기술적 전문 용어는 처음에는 다소 어려울 수 있습니다.
-
빅 데이터: 점점 더 많은 일을 디지털 추적 (또는 데이터)으로 남겨 둡니다. (및 기타)가 사용하고 분석 할 수 있습니다. 큰 데이터 라는 문구는 수집되는 데이터와이를 사용하는 능력을 나타냅니다.
-
빅 데이터 분석: 사실 기반의 의사 결정을 알리는 통찰력을 얻기 위해 데이터를 수집, 처리 및 분석하는 프로세스입니다. 많은 경우 알고리즘을 사용한 소프트웨어 기반 분석이 필요합니다.
-
알고리즘: 데이터를 분석하기 위해 소프트웨어로 실행되는 수식 또는 통계 프로세스. 일반적으로 여러 계산 단계가 포함되며 데이터를 자동으로 처리하거나 문제를 해결하는 데 사용할 수 있습니다.
-
클라우드 컴퓨팅: 로컬이 아닌 원격 서버에서 실행되는 소프트웨어 또는 데이터. 따라서 자신의 컴퓨터에 물건을 저장하거나 컴퓨팅하는 대신 네트워크 (예: 인터넷)를 통해 컴퓨터에 연결된 다른 컴퓨터를 사용할 수 있습니다.
-
구조화 된 데이터: 정의 된 레코드 또는 파일 (예: 데이터베이스 또는 스프레드 시트) 내의 고정 필드에있는 모든 데이터 또는 정보. 고유 한 구조로 인해 빠르고 쉽게 분석 할 수 있습니다.
-
비정형 데이터: 모든 데이터는 기존 형식이나 데이터베이스로 쉽게 저장 및 색인되지 않습니다. 여기에는 이메일 대화, 소셜 미디어 게시물, 비디오 콘텐츠, 사진, 음성 녹음, 사운드 등이 포함됩니다. 구조가 부족하여 전통적인 컴퓨터 프로그램을 사용하여 분석하기가 더 어려워졌습니다.
-
반 구조화 된 데이터: 예상했듯이 이것은 구조화되지 않은 데이터와 구조화 된 데이터의 교차점입니다. 그것은 분석을 위해 사용될 수 있지만 데이터베이스 나 스프레드 시트에서 발견되는 엄격한 구조가 결여 된 어떤 구조를 가질 수있는 데이터입니다. 예를 들어 Facebook 게시자는 저자, 날짜, 길이 및 정서별로 분류 할 수 있지만 일반적으로 콘텐츠는 구조화되지 않습니다.
-
내부 데이터: 귀하의 비즈니스가 현재 가지고 있거나 잠재적으로 액세스하거나 생성 할 수있는 모든 데이터를 설명합니다. 형식으로 구성되거나 (예: 고객 데이터베이스) 구조화되지 않을 수도 있습니다 (고객 서비스 호출의 대화식 데이터).
-
외부 데이터: 간단히 말해서, 이것은 귀하의 비즈니스 외부에 존재하는 무한한 정보 배열입니다. 공개적으로 사용할 수 있거나 비상장 될 수 있으며 형식으로 구조화되거나 구조화되지 않을 수도 있습니다.
-
인터넷의 것: 서로 통신 할 수 있도록 장치 (이름에 언급 된 )를 연결하는 네트워크입니다. 이것은 스마트 TV, 스마트 폰 및 센서와 같은 기술을 포함하며 장치, 시스템 및 서비스 간의 연결성이 크게 증가한 덕분입니다.
6 모든 주요 비즈니스 요구 사항의 핵심 데이터 기술
대용량 데이터를 성공적으로 사용하는 데 필요한 핵심 기술은 무엇입니까? 여기에는 모든 특성을 갖춘 데이터 과학자를 모집하거나 기존 직원에게 이러한 기술을 개발하여 모든 비즈니스가 개발해야하는 6 가지 주요 기술이 포함됩니다.
-
Analytics: 여기에는 어떤 데이터가 질문과 관련이 있는지를 결정하는 작업이 포함됩니다 당신은 그 답을 얻기 위해 데이터에 대답하고 해석하기를 원합니다. 주요 기술로는 패턴 확인 및 링크 수립, 다양한 데이터 (구조화 및 비 구조화 모두)를 이해하는 능력, SAS Analytics 및 Oracle Data Mining과 같은 업계 표준 분석 패키지에 대한 올바른 지식 등이 있습니다.
-
창의력: 누구나가 공식화 될 수 있습니다. - 당신은 당신의 사업을 팩과 차별화시킬 혁신을 목표로해야합니다. 창의력은 테이블과 차트에 적합하지 않은 데이터 인 비정형 데이터 를 이해하고자하는 모든 비즈니스에 특히 중요합니다. 가치있는 창조 기술은 문제 해결을위한 요령 (다른 사람들이 아직 인식하지 못하는 문제를 발견하기까지)과 데이터를 수집하고 해석하는 새로운 방법을 제시 할 수있는 능력을 포함합니다.
-
수학 및 통계: 수학 또는 통계에 대한 배경 지식이 강한 사람들은 큰 데이터 관련 작업을 수행 할 수있는 좋은 근거를 가지고 있습니다. 통계에 대한 기본적인 이해와 지저분한 데이터를 계량화하여 수치를 계산하여 결론을 도출 할 수있는 능력을 찾고 있습니다.
-
컴퓨터 과학: 매우 광범위한 범주는 기계 학습, 데이터베이스 및 클라우드 컴퓨팅과 같은 모든 하위 분야를 포괄합니다. 케이블을 연결하여 정교한 기계 학습 및 자연 언어 처리 알고리즘을 만드는 데 이르기까지 모든 것을 망라 할 수 있습니다. 핵심 기술로는 데이터베이스 기술에 대한 확실한 이해와 Hadoop, Java 및 Python과 같은 기술에 대한 확고한 이해가 있습니다.
-
비즈니스 통찰력: 큰 데이터를 사용하는 사람들은 회사의 목표와 목적을 확실하게 파악하고 비즈니스가 올바른 방향으로 나아가고 있는지 여부를 파악해야합니다.여기에는 회사를 진드기하게 만드는 요소, 번창하게 만드는 요인 및 경쟁 업체와 비교하여 눈에 띄는 이유 (그리고 번성하지 않는 이유는 무엇인가)가 포함됩니다.
-
커뮤니케이션: 전 세계에서 최고의 분석 기술을 보유 할 수 있지만, 명확한 방법으로 결과를 제시하고 성과를 향상시키고 성공을 도울 수있는 방법을 보여줄 수있는 경우가 아니면 모든 분석이 진행됩니다 낭비. 통찰력과 분석을 통해 데이터에 가치를 더할 수있는 능력과 같이 훌륭한 대인 관계 및 서면 의사 소통 기술이 필수적입니다. 스토리 텔링을위한 요령과 시각화 기술을 통해 데이터에 생명을 불어 넣을 수 있다는 점 또한 대단히 도움이 될 것입니다.
비즈니스 의사 결정을 향상시키기 위해 데이터를 사용하는 10 가지 단계
거대 다국적 기업 또는 소규모 가족 운영 비즈니스를 운영하든 상관없이 데이터는 비즈니스에서 전략적 의사 결정의 중심에 있어야합니다. 빅 데이터는 '고객 만족도를 어떻게 향상시킬 수 있습니까?'와 같은 핵심 비즈니스 질문에 대답하는 데 도움이되는 통찰력을 제공합니다. '. 데이터는 통찰력으로 이어집니다. 비즈니스 소유자와 관리자는 이러한 통찰력을 비즈니스를 개선하는 의사 결정 및 조치로 전환 할 수 있습니다.
데이터 기반 결정을 내리기 위해이 10 단계 프로세스를 사용하십시오.
-
전략으로 시작하십시오.
당신이 접근 할 수 있거나 접근해야하는 데이터로 시작하는 대신, 귀하의 비즈니스가 성취하고자하는 것을 시작함으로써 시작하십시오. 간단히 말해서, 전략적 목표가 무엇인지, 예를 들어 고객 기반을 늘려야 할 필요가 있습니다.
-
사업 분야에 관심있어. 귀하의 전략적 목표를 식별하십시오.
전체 전략을 달성하는 데 가장 중요한 분야를 식별하십시오. 대부분의 비즈니스에서 고객, 재무 및 운영 분야가 핵심입니다.
-
답이없는 질문을 찾으십시오.
이러한 목표를 달성하려면 어떤 질문에 답해야하는지 확인하십시오. 당신이 알아야 할 것을 정확하게 처리함으로써, 당신은 정말로 필요한 데이터에 집중할 수 있습니다.
-
그 질문에 답할 수있는 데이터를 찾으십시오.
당신에게 가장 이상적인 데이터를 확인하는 데 초점을 맞 춥니 다 - 가장 중요한 질문에 답하고 전략적 목표를 달성하는 데 도움이되는 데이터입니다.
-
귀하가 이미 가지고 있거나 액세스 할 수있는 데이터를 식별하십시오.
필요한 데이터를 확인한 후에는 즉시 알지 못하더라도 일부 정보에 이미 앉아 있는지 확인하는 것이 좋습니다.
-
비용과 노력이 정당화되면 해결하십시오.
유형 이익이 비용보다 중요한 경우 비용을 알 수있는 경우에만 해결할 수 있습니다. 이와 관련하여 다른 주요 비즈니스 투자와 마찬가지로 데이터를 취급해야합니다. 비즈니스 전략에 대한 장기간의 데이터 가치를 설명하는 투자에 대해 명확한 사례를 제시해야합니다.
-
데이터를 수집합니다.
이 단계의 대부분은 프로세스와 사람들이 데이터를 수집하고 관리하도록 설정하는 것입니다. 데이터를 수집 할 필요가없는 분석 준비 데이터 세트에 대한 액세스를 구매할 수 있습니다. 그러나 실제로 많은 데이터 프로젝트는 일정량의 데이터 수집을 필요로합니다.
-
데이터를 분석합니다.
의미 있고 유용한 비즈니스 통찰력을 추출하려면 데이터를 분석해야합니다. 결국 데이터에서 새로운 것을 발견하지 못한다면이 점에 도달 할 시점이 없습니다.
-
통찰력을 발표하고 배포하십시오. 결과가 적시에 적합한 사람들에게 의미있는 방식으로 제시되지 않는 한, 데이터 세트의 크기 또는 분석 도구의 정교함은 별 문제가되지 않습니다. 의사 결정에 정보를 제공하고 궁극적으로는 성과를 향상시키기 위해 데이터에서 얻은 통찰력을 사용해야합니다.
학습을 비즈니스에 통합하십시오.
-
마지막으로 의사 결정에 데이터의 통찰력을 적용하고 비즈니스를보다 잘 변혁시킬 의사 결정을 내린 다음 그 결정에 따라 행동해야합니다. 나를 위해, 이것은 데이터 여행에서 가장 보람있는 부분입니다.
대용량 데이터에서 통찰력 전달 방법
대용량 데이터는 통찰력을 얻는 데 도움이됩니다.
적절한 정보 가 적시에 적절한 사람들 에게 전달 될 때 경쟁 우위를 얻습니다. 이는 통찰력과 정보를 데이터에서 추출하여 의사 결정자에게 쉽게 이해할 수있는 방식으로 전달하는 것을 의미합니다. 결국, 사람들은 자신의 앞에있는 정보를 이해하기 위해 열심히 노력해야한다면 행동 할 가능성이 적습니다. 귀하의 통찰력이 다음과 같은 요령으로 빛나게하십시오:
귀하의 타겟 고객을 식별하십시오.
-
잠재 고객은 전략적 질문에 달려 있습니다. 청중은 당신이 사업주이거나 인적 자원 팀, 마케팅 팀 또는 그 조합 일 수 있습니다. 이 결과를 누가 볼 것인지 스스로에게 물어보십시오. 토론중인 문제에 대해 이미 알고있는 것은 무엇입니까? 그들은 무엇을 필요로하고 알고 싶어합니까? 그리고, 그들은 정보로 무엇을 할 것인가? 잠재 고객을위한 정보를 맞춤 설정합니다.
-
각 의사 결정자의 특정 요구 사항을 충족시키기 위해 정보를 사용자 정의 할 수 있도록 준비하십시오. 당신이 달성하고자하는 것을 기억하십시오.
-
전략적 질문에 답하고 비즈니스 목표를 달성하는 것과는 아무런 관련이없는 흥미로운 통찰력에주의를 기울이지 마십시오. 앞으로 다른 통찰력을 재검토 할 수있는 범위가있을 수 있지만, 지금은 성취하고자하는 것에 집중하십시오. 텍스트의 벽을 만들지 마십시오.
-
데이터는 숫자, 짧은 서술, 표, 그래프 또는 차트로 표현 될 수 있음을 기억하십시오. 사실 가장 좋은 방법은 이러한 형식을 조합하는 것입니다. 데이터 시각화 기술을 사용합니다.
-
비주얼은 빠르고 직접적이며 (일반적으로) 이해하기 쉽고 기억하기 쉽고 흥미를 더하기 때문에 정보를 전달하기에 적합하며 전체 페이지보다 독자의 관심을 끌 가능성이 훨씬 큽니다. 본문. 하지만이 글을 무시하지 마십시오.
-
숫자, 차트 및 비주얼은 스냅 샷 만 제공 할 수 있습니다. 내러티브를 사용하면 핵심 포인트를 더 멋지게 꾸밀 수 있습니다. 짧은 내러티브를 사용하여 당신이 보여주고있는 것을 소개하고 핵심 통찰력을 강조하십시오. 명확한 표제를 사용하여 중요한 점을 돋보이게하십시오.
-
이런 식으로, 빠른 눈으로조차도 핵심 포인트가 분명해질 것입니다. 정보를 전략에 연결하십시오.
-
전략적 비즈니스 질문에 직접 답하는 정보를 제시하는 경우 (예: 직원 이동률을 10 % 줄이는 방법)? ', 그 질문을 오프닝 내러티브와 어쩌면 헤드 라인에 포함 시켜라.