1. 분석 과정 기획, 실행 모니터
- 문제해결과 예측에 가까울수록 기획의 복잡도, 이종 데이터 양, 가공 오류가능성이 증가하여 자연스럽게 관리 포인트도 증가하게됨
2. 데이터 인쿼리 프로세스 수행
- 문제해결과 예측에 가까울수록 필요한 데이터 양이 증가하여 논리적이고 구체적인 데이터 인쿼리 수행 능력이 상대적으로 중요해짐
3. 데이터 이해 및 적용방안 파악
- 잘 이해해야 잘 기술할 수 있고, 나아가 이해에서 나온 인사이트는 상황 진단의 주요 소재가 됨
4. 비판적 사고
- 비판 역량이 있어야 자신의 기술과 진단에 대한 비판을 최소화할 수 있고, 문제해결 시 전략 대안을 실효성 있게 구성하고 우선순위를 나열할 수 있음
5. 데이터 기반 문화
- '데이터로 말하라'라는 문화가 없으면 굳이 많은 노력이 들어가는 예측 및 문제해결 분석을 할 이유를 찾지 못함
6. 데이터 윤리(보안, 개인정보보호 등)
- 데이터를 통해 인간성을 훼손하지 않고, 원천 데이터의 활용 시 법/제도 테두리를 벗어나지 않는 것은 모든 분석에서 두루 중요함
7. 분석 도구 활용
- 문제해결과 예측에 가까울수록 분석에 필요한 데이터의 양과 복잡도가 증가하여 분석 도구 숙련도에 따라 정확도, 신속성에 큰 역량 차이를 초래함
8. 데이터 발견(데이터를 발견하고 접근하는 역량)
- 단순한 데이터 기술을 넘어 문제해결에 가까울 수록, 각자가 처한 문제해결 상황의 특징이 잘 담긴 내부 데이터에 대한 접근 역량이 중요함
9. 데이터 수집
- 단순한 데이터 기술을 넘어 문제 해결에 가까울수록, 각자가 처한 문제해결 상황을 객관적으로 판단할 수 있게 하는 외부 데이터에 대한 수집 능력이 중요해짐
10. 데이터 관리 및 조직화
- 데이터가 기획, 생성, (재)활용, 폐기되는 모든 과정이 원활해야 기초데이터의 신뢰성이 확보되고 활발한 분석활동들이 생겨나게됨
11. 데이터 조정
- 특히, 예측 분석은 정량적 민감도 분석과정을 거치게 되는데, 이때 기초 데이터를 어떻게 조정하느냐에 따라 결과치 민감도에 큰 영향을 주게 됨
12. 데이터 품질과 출처의 평가 및 확보
- 분석자가 데이터 자체의 유효성까지 검증하게 되면 지나치게 많은 부담을 느끼게 되어 기본적인 데이터 클렌징을 통한 품질은 확보해줘야 함
13. 데이터 레퍼런스 구성 및 운영
- 데이터 원천소스, 생성시기, 집계목적, 집계주체, 용어설명, 연관 데이터 소개 등이 충실할 수록 데이터 활용도가 높아지고 분석 결과의 신뢰도 또한 높아짐
14. 데이터 기초 분석
- 예측, 문제해결보다 기술, 진단 분석이 상대적으로 기초적인 분석 역량으로 가능
15. 데이터 시각화
- 특정 목적과 관계없이 근간이나, 분석의 양이 많고, 복잡도가 높을수록 시각화가 가진 힘이 상대적으로 중요해짐
16. 데이터 구두 제시
- 데이터의 특징과 메시지를 구두 설명을 통해 명확히 전달하는 역량은 데이터 분석의 목적 및 난이도와 관련 없잉 전 영역에 결쳐 중요한 역량임
17. 데이터 해석
- 기본적으로 모든 목적에 중요하나, 오류 없이 해석하는 역량은 명확한 인지력이 중요한 기술분석에서 상대적으로 중요성이 높음
18. 데이터 기반 문제 정의
- 데이터로 문제를 착안하는 것은 고도의 상황파악 능력을 요구하며, 어떻게 정의하느냐에 따라 이후 모든 문제해결 과정에 영향을 줌
19. 데이터 기반 의사결정
- 의사결정 맥락, 맥락에 따른 문제정의 ,문제정의에 따른 제약조건, 제약조건에 따른 (불)필요데이터 판단, 필요데이터 간 우선순위, 우선순위에 따른 분석 어프로치 설계, 어프로치에 따른 가공 오류 방지, 분석 중간 결론에 따른 어프로치 진화 등을 수행할 수 있어야 효과적인 데이터 의사결정이 가능함
20. 데이터 기반 의사결정 검증
- 다른 사람이 도출한 의사결정 결과를 데이터 유효성, 분석기법 적절성, 분석 결과 메시지화 관점에서 효과적으로 비판 할 수 있어야 자신의 의사결정 역량도 증가함
21. 메타데이터의 생성 및 활용
- 데이터의 특징을 나타내어 '데이터의 데이터'라 불리는 메타데이터는 데이터 활용 범위에 해당하는 개념으로 목적과는 무관하게 중요함
22. 데이터 지속성 및 재활용
- 원래 작성/수집 의도된 것 이외의 분석 목적으로 데이터를 사용하는 개념으로 데이터 활용 범위에 해당하는 개념으로 목적과는 무관함
23. 데이터 공유
- 데이터가 3자에게 오류 없이 사용되게 할 수 있게 하는 투명성과 일관성을 갖춘 관리체계 및 정책을 의미하므로 특정 데이터 분석 목적과는 무관함
24. 데이터 보존
- 데이터 저장 분류, 메타데이터 업데이트 등의 활동으로 최대한 많이 활용될 수 있도록 '접근환경'을 유지하는 데이터 보존은 특정 데이터분석 목적과는 무관함
25. 포맷 간 데이터 전환
- 데이터가 가진 맥락과 정보를 충분히 이해한 상태에서 다른 포맷의 데이터로 전환하여 데이터 활용도를 높이는 역량이므로 특정 데이터 분석 목적과는 무관함
26. 가설 전개
- 진단과 문제해결 분석은 분석 가설을 수립하는 것이 효율적 분석 어프로치 설계에 매우 중요하며, 분석 중간 결론으로 가설을 진화하는 것을 포함함
27. 대용량 데이터 활용
- 데이터의 양은 분석 목적과 무관함
(출처: book) 데이터 리터러시, 강양석 지음/이콘