[정보디자인] 서울시장보궐선거 시간대별 투표율 비교 그래프 리디자인

2012. 3. 11. 22:34UI 가벼운 이야기
無異

지난번 사내에서 강규영님의 정보 시각화 강의  를 듣고 
규영님 블로그의 http://alankang.tistory.com/295 관련 공부 자료에서 안 읽어봤던 책도 읽어보고 관련된 블로그도 관심있게 구독하고 있습니다.

그 중에서 akaiving님의 블로그를 재밌게 보고 있다가 관심있는 주제가 있어서 글을 남깁니다.


글에서는 지난번 서울시장보궐선거와 무상급식주민투표의 시간대별 투표율 변화를 그래프로 표시해서 한 눈에 비교해 볼 수 있도록 시각화 하였습니다. 
 



보통은 아래와 같은 누적 그래프를 통해서 비교를 하는데 시간대별 투표율 변화를 비교하여 보여줌으로써 동일 시간대에 두 선거 투표율 변화를 보다 명확하게 비교 할 수 있을 뿐 아니라 시간 흐름에 따른 투표 참가자 추이를 볼 수 있게 되어서 좀 더 의미있는 패턴을 발견하는데 도움을 줄 수 있습니다. 아래와 같은 누적 추이에서는 잘 보이지 않지만 퇴근 이후(저녁)의 투표율이 다른 시간대의 2배 정도에 비해 현저히 높았던 것이 잘 드러납니다. 



원문에는 그래프를 그리기 위한 데이타가 포함되어 있는데 아래와 같이 선관위에서 시간대별로 발표하는 누적 투표율을 가지고 시간대별 투표율 변화를 산출한 것으로 생각됩니다. 



그대로도 충분히 아름답긴 하지만 몇 가지 개선했으면 하는 부분을 손 봤습니다. 히스토그램을 예쁘게 그릴 수 있는 툴이 없어서 akaiving님의 그래프를 포토샵으로 편집했습니다. :)


원본 :  akaiving  수정:  無異 via 포토샵

1. 투표율 '증감' 패턴이라고 해서 비교 대상이 무엇인지 처음에는 잘 이해가 되지 않았습니다. 한 두 시간 간격으로 집계하여 발표한 누적 투표율을 자료로 하고있으므로 특정 시각에서의 투표율의 변화보다는 시간대별(구간) 투표자수(투표율)로 표시하는게 이해하기 편할 것 같습니다. 
오후8시에 누적 투표율 변화가 5.0%p 라는 것보다 7시에서 8시 사이에 전체 유권자의 5.0%가 투표에 참여했다는게 상황을 잘 설명하니까요. 그래서 우선 시간 구간 사이의 투표자수 히스토그램이 되도록 단위(%p -> %)를 바꾸고 시간 축을 실제 투표 시간(6시부터 오후 8시)에 맞게 이동하였습니다. 처음 그래프에서 없었던 아침 시간 구간의 자료는 위의 carrotday님의 표를 참고하여 추가하였습니다.

2.다른 구간은 1시간 간격인데 처음 구간은 2시간 간격이라 오해 할 수 있는 부분을 수정할 필요가 있습니다.
시장선거에서 9-11시까지 8.8%p 이고 11-12시 사이는 8.5%p라서 이른 아침에 가장 많이 투표를 하는 것처럼 보이지만 두 시간의 변화율이니까 반으로 나눈 4.4%p이어야 할 것 같습니다. 아침 일찍 부터 투표하러 갈만큼 부지런하지는 않다는 거죠.

3. 그래프의 가로축을 그리고 baseline이 0이 되도록 수정하였습니다. 두 그래프의 비율을 비교해보는 것이 의미가 있으므로 baseline의 기준이 중요한데 원본은 Data Ink Ratio를 높이기 위해 가로 축을 생략하고 눈금만을 남겨두었더라구요. 눈금의 위를 잇는 가상의 선이 축으로 보였는데 2.4%p가 1.2%p와 축에서 2배 떨어져 있지 않은 것 같아 살펴보니 실제는 시간 숫자의 baseline이 기준선이었습니다. 익숙하지 않은 형태라 명시적으로 축을 그려넣었습니다.

다른 두 투표의 개별 투표율을 나타내고 있지만 두 투표가 서울시민을 대상으로 하고 있으므로 두 달정도 사이의 투표 인구수의 변동은 있었겠지만 거의 같다고 보고 양적인 비교를 해도 무리가 없을 것 같습니다. 
(동일 시간대에서 두 면적을 비교해서 두 배이면 투표자 수도 두배라고 이해해도 무방할거라는거죠)

4. 시간의 표시는 24시간제 보다는 일상적으로 사용되는 12시간제가 이해 하기 쉬운 것 같습니다. (그래프 툴에서는 지원하지 않겠지만요)

5. 오후 1시에서 3시,3시에서 5시 구간은 같은 값이라도 오전 7시에서 9시 구간과는 다르게 구간의 데이타가 있었다는 걸 표시하기 위해 일부러 끊어 두었습니다.

6. 각 항목 투표 이름에 비교할 수 있게 전체 투표율을 추가하였습니다. 투표 이름을 오른쪽으로 옮긴건 왼쪽엔 두 그래프가 너무 가까이 붙어있어서 일 뿐 별 의미는 없습니다.


그래프를 수정하고 보니 시간대별 투표 양상이 대충 눈에 들어옵니다. 의미 있는 시간대는 출근(등교)시간 전, 점심시간, 퇴근 후 인 것 같고요. 암튼 그래서 서울시장보궐선거에서는 퇴근 후 시간대의 투표율이 모든 시간대중 가장 높은 상당히 이례적인 결과 였다는게 좀 더 분명히 드러나게 되었습니다.


[참고##정보디자인##]