1. 빅데이터 분석과 전략 인사이트
01. 빅데이터 열풍과 회의론
빅데이터 열풍으로 인한 회의론도 있는데, 이런 회의론으로 인해 실제 우리가 빅데이터 분석에서 찾을 수 있는 수많은 가치들을 제대로 발굴해 보기도 전에 그 활용 자체를 사전에 차단해버릴 수도 있음.
02. 빅데이터 회의론의 원인 및 진단
가. 투자효과를 거두지 못했던 부정적 학습효과
- 과거 거액을 들여 고객관계관리(CRM)을 도입했던 기업들이 어떻게 활용하고 어떻게 가치를 뽑아내야 할지 난감해 했으며 생각 이상의 효과를 거두지 못했음
나. 빅데이터 성공사례 중 기존 분석 프로젝트를 포함해 놓은 것이 많다
- 국내 빅데이터 업체들이 CRM분석 성과를 빅데이터 분석으로 과대포장
03. 일차원적인 분석 vs 전략도출을 위한 가치기반 분석
- 일차적인 분석을 통해서도 해당 부서, 업무영역에 효과를 얻을 수 있지만 일차적인 분석은 태생적으로 업계 내부의 문제에만 초점을 두고 있음 → 전략적 인사이트 가치 기반을 위해 인구통계학적 변화, 경제사회 트랜드, 고객 니즈의 변화를 고려해야 함. 즉 업계 상황에 한정해서 바라보지 말고 더 넓은 시야에서 차별화를 고려해야 함
- 데이터 분석은 대상을 모델범위 외 요인들을 판단하게 되면 분석 모델의 정확성에 위험을 동반할 수 있음을 유의
2. 전략 인사이트 도출을 위한 필요 역량
01. 데이터 사이언스의 의미와 역할
데이터 사이언스란 데이터 공학, 수학, 통계학, 컴퓨터공학, 시각화, 해커의 사고방식, 해당 분야의 전문지식을 종합한 학문이다. 즉 데이터로부터 의미있는 정보를 추출해내는 학문으로 정형, 비정형 데이터를 막론하고 인터넷, 휴대전화, 감시용 카메라 등에서 생성되는 숫자, 문자, 영상 정보 등 다양한 유형의 데이터를 분석(통계학과의 차이)할 뿐만 아니라 이를 효과적으로 구현하고 전달하는 과정(데이터 마이닝과의 차이)까지를 포함한 포괄적 개념이다.
02. 데이터 사이언스의 구성요소
가. 데이터 사이언스의 영역
(1) Analytics(분석적 영역)
- 수학, 확률모델, 머신러닝, 분석학, 패턴 인식과 학습, 불확실성 모델링 등
(2) IT(데이터 처리와 관련된 IT영역)
- 시그널 프로세싱, 프로그래밍, 데이터 엔지니어링, 데이터 웨어하우스, 고성능 컴퓨팅
(3) 비즈니스 분석(비즈니스 컨설팅 영역)
- 커뮤니케이션, 프레젠테이션, 스토리텔링, 시각화 등
나. 데이터 사이언티스트의 역할(가트너)
- 데이터 관리 : 데이터에 대한 이해
- 분석 모델링 : 분석론에 대한 지식
- 비즈니스 분석 : 비즈니스 요소에 초점
- 소프트 기능 : 커뮤니케이션, 협력, 리더십, 창의력
- 데이터 사이언티스트가 갖춰야 할 역량의 공통점은 강력한 호기심이다. 호기심이란 문제의 이면을 파고들고, 질문들을 찾고, 검증 가능한 가설을 세우는 능력을 의미한다.
다. 하드 스킬과 소프트 스킬
(1) 하드 스킬
- 빅데이터에 대한 이론적 지식: 관련 기법에 대한 이해와 방법론 습득
- 분석 기술에 대한 숙련: 최적의 분석 설계 및 노하우 축적
(2) 소프트 스킬
- 통찰력 있는 분석: 창의적 사고, 호기심, 논리적 비판
- 설득력 있는 전달: 스토리텔링, Visualization
- 다분야 간 협력: Communication
03. 전략적 통찰력과 인문학의 부활
외부 환경의 변화 | 내용 | 예시 |
컨버전스 → 디버전스 | 단순 세계화에서 복잡한 세계화로의 변화 | 규모의 경제, 세계화, 표준화, 이성화 → 복잡한 세계, 다양성, 관계, 연결성, 창조성 |
생산 → 서비스 | 비즈니스 중심이 제품생산에서 서비스로 이동 | 고장나지 않는 제품의 생산 → 뛰어난 서비스로 응대 |
생산 → 시장창조 | 공급자 중심의 기술경쟁에서 무형자산의 경쟁으로 변화 | 생산에 관련된 기술 중심, 기술 중심의 대규모 투자 → 현재 패러다임에 근거한 시장창조, 현지 사회와 문화에 관한 지식 |
3. 빅데이터 그리고 데이터 사이언스의 미래
가. 가치 패러다임의 변화
(1) 디지털화(Digitalization) : 과거. 아날로그의 세상을 어떻게 효과적으로 디지털화하는가가 이 시대의 가치를 창출해내는 원천
(2) 연결(Connection) : 현재. 디지털화된 정보와 대상들은 서로 연결이 시작되었으며 그 연결을 얼마나 더 효과적으로 효율적으로 제공해주느냐가 성공요인
(3) 에이전시(Agency) : 미래. 사물인터넷(IoT)의 성숙과 함께 연결이 복잡하게 증가하며 그 연결을 얼마나 효과적이고 믿을 만하게 관리하는가의 이슈. 데이터 사이언티스트의 역량에 따라 좌우됨
🔍자주 출제되는 용어 정리
01. 데이터 레이크(Data Lake)
대규모의 다양한 원시 데이터셋을 기본형식으로 저장하는 데이터 레포지토리 유형. 데이터 레이크에 있는 데이터는 분석을 위해 필요할 때 가공되며, 이러한 경우 스키마가 적용돼 데이터 분석이 가능해짐. 이는 "읽기 스키마(Schema On Read)"라 불리는데, 데이터가 사용 준비 상태가 될 때까지 원시 상태로 보관되기 때문
02. 서비타이제이션(Servitization)
제품과 서비스의 결합, 서비스의 상품화, 그리고 기존 서비스와 신규 서비스의 결합 현상을 포괄하는 개념
03. 딥러닝(Deep Learning)
여러 층을 가진 인공신경망을 사용하고 머신러닝학습을 수행하는 심층학습 기법으로 대표적인 분석 방법으로는 LSTM, Autoencoder, RNN 등이 있음
04. 마이데이터
개인이 각종 기업, 기관에 흩어져 있는 자신의 신용 정보를 마이데이터 사업자에게 활용하도록 하고, 이들 업체로부터 자신에게 유용한 맞춤형 서비스를 받는 것
'프로그래밍 > 데이터사이언스' 카테고리의 다른 글
[ADsP] 데이터 분석 기획 Section 01. 데이터 분석 기획의 이해(2) 분석 방법론 (0) | 2023.10.04 |
---|---|
[ADsP] 데이터 분석 기획 Section 01. 데이터 분석 기획의 이해(1) 분석기획 방향성 도출 (0) | 2023.09.21 |
[ADsP] 데이터의 이해 Section 02. 데이터의 가치와 미래 (0) | 2023.09.18 |
[ADsP] 데이터의 이해 Section 01. 데이터의 이해 (1) | 2023.09.15 |
[Python] 데이터사이언스를 위한 NumPy - (2) 인덱싱, 슬라이싱 Ⅰ (0) | 2023.05.18 |