[패스트캠퍼스 수강 후기]
소비자 리서치와 보고서 작성 100% 환급 챌린지 22회차 미션
06. Chapter 06. 데이터 구조 파악 및 전처리(Data Processing)
2. Data Editing & Cleaning
* 좋은 데이터가 갖추어야 할 요소
- 데이터 완결성 (Data Completeness): 필수 데이터들은 모두 기록되어 있어야 합니다.
- 데이터 유일성 (Data Uniqueness): 동일한 데이터가 중복되어 있으면 안됩니다.
- 데이터 통일성 (Data Conformity): 데이터는 동일한 형식으로 저장되어 있어야 합니다 .
- 데이터 정확성 (Data Accuracy): 수집 과정에서 표본 비표본 오차를 최소화 해야 합니다 .
>>> 펀칭과 코딩을 마친 데이터를 바로 분석하기 전, 데이터를 점검하고 , 필요에 따라 정정하는 과정이 필요합니다.
* 데이터 에디팅(Data Editing)
- 데이터의 입력 오류 또는 응답 오류를 확인하는 과정
- 펀칭 전 설문지를 하나하나 검수하는 것 + 펀칭 후 입력된 데이터를 확인하는 것 모두 포함
- 데이터 결측치 (missing) 및 이상치 (outlier) 확인
- 로직 상 오류 확인
- 입력된 데이터의 Base(각 문항 별 응답자 수) 확인
* 에디팅 가이드
- 에디팅 볼 내용을 미리 정리해 둔 가이드
- 특히 오프라인 조사 시 꼼꼼한 작성이 필요
- 온라인 모바일 설문의 경우 설문 프로그래밍 시 로직을 설정해 둘 수 있어 대부분 생략하나, 로직 설정이 어려운 경우 예 : 상반된 질문에 동일하게 답변등)은 염두에 두고 에디팅을 보아야 함
* 데이터 클리닝 (Data Cleaning)
- 데이터 에디팅을 통해 확인한 오류를 정정하는 과정
- 불성실 응답자 데이터 삭제
- 명백한 로직상 에러는 교체 또는 결측값 처리
- 정해진 추정 원칙에 따라 추정치 삽입 평균값으로 대체하는 등 결측값 대체
Chapter 6. 주요 조사 유형
3. 빈도분석과 교차분석
* 가장 기본적이고 많이 활용하는 분석법
빈도분석
변수별 수집된 데이터의 빈도(Frequency)를 보여줍니다 .
- 가장 기초적인 분석 방법
- 척도에 관계없이 사용할 수 있습니다. 명목, 서열, 등간, 비율척도 모두)
- 빈도, 비율 뿐 아니라 평균, 표준편차, 최빈값, 중위값, 최대값, 최소값까지 표시할 수 있습니다. 등간, 비율척도인 경우만)
- 엑셀에서 하실 경우, 피벗테이블 기능을 이용하면 편리합니다. 단일응답인 경우 Raw data 범위 지정 후 삽입 피벗테이블 행 값 ’영역에 분석하려는 변수' 추가
교차분석
변수 by 변수 분석을 합니다. 한 변수와 다른 변수 응답을 교차
- 소비자 조사에서 가장 많이 활용하는 분석 방법
조사결과 테이블(교차분석표 통계표=Cross tabulation)
조사대상의 특성 별 차이를 확인할 수 있는 통계표
- Raw data 를 읽을 수 있는 형태로 가공한 것
- 보통 테이블을 리딩하고 인사이트를 발견하여 보고서를 작성하게 됨
- 대부분의 마케팅 조사는 집단간 차이, 브랜드간 차이를 보기 위해 진행되며, 빈도분석만으로 발견할 수 있는 인사이트는 제한적이므로 프로필 문항간 교차분석 데이터를 보게 됨
- 마케팅 조사에서 고급통계를 요구하는 경우도 있으나 대개는 교차분석 위주
- 보통 비율 테이블을 보며, 필요에 따라 빈도 테이블도 봄
배너가이드
교차분석을 하기 위한 분석 기준(Banner)을 사전에 정의해 둔 것
- 가지고 있는 가설 , 궁금증을 확인할 수 있는 변수를 사용할 것
예) 학생과 직장인이 선호하는 육포 브랜드는 다를거야 ’
--> '직업'을 배너로 '육포를 자주 먹는 사람은 육포를 선택할 때 가격을 중요하게 생각할거야 ’
--> '취식 빈도'를 배너로
- 배너 By 배너 분석을 하여 전체 응답자의 특성을 이해하고, 기본적인 Base 확인에 활용
예) 이 설문의 응답한 학생 직장인의 성별과 연령은 다음과 같이 구성되어 있구나
배너가이드를 잘 만들기 위한 몇 가지 Tip
- 중요하게 볼 배너를 앞쪽으로 배치
- 배너로 올렸 때 , 응답자수가 30 명 이하인 것은 기타 로 묶어서
- 보기가 너무 많을 경우, 그룹핑하는 것을 고려
- 빈도 금액대 소득 등은 비율을 고려하여 H/M/L 등으로 묶어서
- 척도형 응답은 Top2/Bot2 또는 Top3/Bot3 로 묶어서
- 배너변수의 value name 이 긴 경우 적당히 줄여서 단, 오인 없도록
Chapter 6. 통계 분석 기법을 이용한 조사 결과 분석 및 가설 검증
1. 교차분석 결과 해석
교차분석
엑셀에서 피벗테이블을 통해 할 수 있습니다. 그러나 ...
- SPSS, SAS, R 등의 통계 분석 프로그램을 주로 사용합니다 . 특히 광범위하고 다양한 통계분석을 실시할 수 있는 SPSS 를 주로 활용합니다. 그러나 ..
- 조사회사에 의뢰하신다면 배너를 요청해서 맞춤 테이블을 받아 보실 수 있어요.
- 결과 분석툴을 제공하는 리서치사 플랫폼 오픈서베이, 오픈서베이 폼, 서베이몽키등을 이용하시면 편리해요.
교차분석 결과 : 비율형 문항
- 표 안 데이터의 단위를 확인합니다.
- 보통은 % 비율이며, 소수점 첫 째 자리까지 표기되어 있습니다.
- 전체 및 배너 별 응답자 수를 살펴봅니다.
- 응답자 수는 일반적으로 여기에 표시되며, 단위는 명 입니다.
- 배너 별 데이터를 확인하기 전 전체값을 먼저 파악합니다.
- Total 값은 각 응답이 전체 집단에서 차지하는 비중을 나타내므로 가장 먼저 해석합니다.
- 응답 집단 배너 간 차이가 있는지를 확인하기 위해 각각의 행에 있는 자료를 확인합니다.
- 차이를 비교하기 위해서는 각 집단의 표본크기가 충분한지 보아야 하는데, 응답자 수가 30명(평균점수인 경우) 혹은 100명(비율인 경우) 이하 라면 해석을 하지 않는 것(해석에 유의)이 좋습니다.
- 리서치 실무에서는 통상 Total 값 대비 3% 이상 차이나는 값들을 표시하여 읽습니다.
- 집단 간 차이는 비율자료인 경우 최소 5~10% 이상은 되어야 차이가 난다고 해석합니다.
- 통계적으로는 카이스퀘어분석 비율차 검정 을 통해 집단 간 차이 여부를 검증합니다.
- 일반적으로 조사회사 리서처 혹은 기업의 실무자들은 조사 결과를 경험적, 상식적 수준에서 해석합니다.
- 엄밀한 해석이 필요한 경우 비율 평균차에 대한 통계적 검정을 실시해야 하나,
1) 다루는 질문 항목이 매우 많고
2) 빠른 분석이 필요하며
3) 해당 시장 및 고객에 대해 기본적으로 이해하고 있으며
4) 엄밀한 실험설계가 아니라면 오히려 가설을 해석하는 데 흐름을 방해할 수 있으므로 경험적으로 해석하는 경우가 대부분입니다.
* 교차분석표 기반의 3% 이상 차이나는 셀을 읽는 방식 업계 통상적 해석 방법 은 기대빈도(전체값을 통해)와 관측빈도(실제 셀 빈도)간의 차이에서 P 값이 0.05 이하인 값들을 발견하는 통계학 접근과 거의 비슷한 결과를 제시하고 있는데요, 과거 통계학 기반의 해석을 업계에서 더 쉽고 빠르게 처리하기 위해 찾은 방법이 전체 대비 3% 이상 차이라는 기준이 된 것으로 보입니다.
- 보기로 빈도 횟수 가격 등의 숫자 Range 를 제시했다면 , 평균으로 환산 하여 살펴볼 수도 있습니다.
- 아래와 같이 표에서 환산하거나 , Raw data 에서 가중치를 주어 계산할 수 있습니다.
- 보기로 빈도 횟수 가격 등의 숫자 Range 를 제시했다면 , 평균으로 환산하여 살펴볼 수도 있습니다
- 단순한 집단 간 차이보다는 집단 간 차이의 경향성 을 살펴보세요
(예 : 각 연령대의 차이를 보기 보다는, 연령이 높아질수록 혹은 낮아질수록 어떤 경향을 보이는지)
교차분석 결과 : 척도형 문항
- 5 점 척도의 경우 Top2%(= 긍정율 동의율 와 평균 , 7 점 척도의 경우 Top3% 와 평균을 주로 확인합니다.
(비율 분포에 의한 해석을 우선, 평균은 보완적으로 함께 보기를 추천 : 해석 시 용이)
- 평균은 통상 소수점 둘 째 자리까지 표기하며, Total 평균 대비 0.1~0.2 이상의 차이를 살펴봅니다.
- Top1%( 매우 긍정 의 비율도 확인합니다 .
- 제품 수용도의 척도형 평가의 경우 , 산업의 성격에 따라 해석이 달라질 수 있습니다 .
*경험상 대체로 Top2%가 60%, 평균 3.6 이상 이면 긍정적인 편 (Mass 수용도 기준 통과으로 해석합니다.
- 리커트 척도의 경우, 100 점 만점으로 환산해서 볼 수도 있습니다.(대부분 만족도 조사)
- 다만 환산기준을 명확히 정해야 합니다.
- 100점 만점 기준으로 환산 시, 통상 2점 이상의 차이를 차이가 있다고 해석합니다.
22회차 미션 완료. 마지막을 향해 오늘도 열심히 고고~~
올인원 패키지 : 소비자 리서치와 보고서 작성👉https://bit.ly/35aoyzE
'제인은 지금 공부중' 카테고리의 다른 글
[패스트캠퍼스 수강 후기]소비자 리서치와 보고서 작성 100% 환급 챌린지 24회차 미션 (0) | 2020.11.25 |
---|---|
[패스트캠퍼스 수강 후기]소비자 리서치와 보고서 작성 100% 환급 챌린지 23회차 미션 (0) | 2020.11.24 |
[패스트캠퍼스 수강 후기]소비자 리서치와 보고서 작성 100% 환급 챌린지 21회차 미션 (0) | 2020.11.22 |
[패스트캠퍼스 수강 후기]소비자 리서치와 보고서 작성 100% 환급 챌린지 20회차 미션 (0) | 2020.11.21 |
[패스트캠퍼스 수강 후기]소비자 리서치와 보고서 작성 100% 환급 챌린지 19회차 미션 (0) | 2020.11.20 |