다중응답의 교차분석

May 25, 2020 21:13 · 179 words · 1 minute read R Markdown plot regression

다중응답의 교차분석1

두 변수의 독립성을 검정할 때(카이제곱 검정을 이용, 교차분석이라고도 함)는 설문지가 단일응답이라는 가정을 깔고있다.

예를 들어 성별과 혈액형이 독립인지를 판단하고 싶을 때 실제 조사에서는 성별(남/여), 혈액형(A/B/O/AB) 중에 하나만 선택가능하다.

하지만 단일응답의 가정을 깨고 성별과 좋아하는 영화장르(5개선정)의 독립성 여부를 판단할 때 설문조사에서 좋아하는 영화장르를 묻는 질문이 다중응답이라면 두 변수끼리의 독립성 검정을 할 수 없다.

다중응답의 교차분석2

왜냐하면 카이제곱검정의 과정에서 교차표의 기댓값을 구하는 과정에서 항목별 표본의 수에 차이가 생기기 때문이다.

남성10명, 여성10명을 대상으로 좋아하는 영화장르를 2개씩 고르는 경우에는 영화장르에 대한 표본의 수는 총 40개지만 성별의 표본은 20명이다.(그래도 다중응답에서 선택문항의 갯수가 정해지는 케이스에서는 가중치를 둔다던지(?)하는 방안으로 교차분석을 할 수 있지 않을까)

하지만 좋아하는 영화장르를 모두 고르시오라는 설문지에 대하여 교차분석을 실시하고 있는 경우에는 두 변수의 독립성을 검정하기가 상당히 까다롭다. 현재 SPSS에서는 이에 대하여 교차표와 퍼센테이지만 제공하고 있는데 이를 검정하는 방법에 대해 알아보아야 할 필요가 있다.

아니면 다중응답의 분석방법은 아예 교차분석이 아닌 다항로지스틱회귀분석을 이용해야 하는 것인가?

par(mar = c(0, 1, 0, 1))
pie(
  c(280, 60, 20),
  c('Sky', 'Sunny side of pyramid', 'Shady side of pyramid'),
  col = c('#0292D8', '#F7EA39', '#C4B632'),
  init.angle = -50, border = NA
)
A fancy pie chart.

Figure 1: A fancy pie chart.