노력에는 지름길이 없으니까요

240711 아티클스터디 - 데이터 속 거짓말 발견하기 본문

내일배움캠프 일지/아티클스터디

240711 아티클스터디 - 데이터 속 거짓말 발견하기

데건 2024. 7. 11. 16:47
728x90

아티클 정리

 

https://yozm.wishket.com/magazine/detail/1821/

 

데이터 시각화 101: ③데이터 속 거짓말 발견하기 | 요즘IT

간혹 직관적으로 이해된 시각화가 부정확한 정보를 전달하기도 하고, 시각적으로 오해를 불러일으키기도 합니다. 그 때문에 우리는 이러한 문제점이 왜 일어나는지 이해하고, 데이터 시각화

yozm.wishket.com

https://blog.naver.com/businessinsight/221918586252

 

통계로 거짓말 하는 방법?..'시각화 기법'에만 매몰되지 않아야│인터비즈

출처 프리미엄 경영 매거진 DBR 196호 필자 서울과학종합대학원 빅데이터 MBA 주임교수 김진호 인터...

blog.naver.com

 

이쪽 자료도 함께 참고했다. 블로그가 참고했다는 원 출처를 따로 기재한다.

출처 프리미엄 경영 매거진 DBR 196호

필자 서울과학종합대학원 빅데이터 MBA 주임교수 김진호

 

https://namu.wiki/w/%EA%B7%B8%EB%9E%98%ED%94%84%20%EC%99%9C%EA%B3%A1#s-4.9

다양한 그래프 왜곡 예시가 있다.

 


 

데이터 시각화를 정확하게 판단하며 볼 수 있는 눈을 길러야 한다.

시각화 -> 데이터를 단순화하면서 동시에 데이터가 가진 사실을 충실하게 전달해야 한다.

 

1. 막대그래프를 특히 주의하자

> 기준선이 '0'인지 확인

 

그래프의 밑을 잘라내어 데이터 왜곡을 범하고 있다.

실제 의존도 차이는 약 30%에 불과하지만, 마치 몇배나 되는 것처럼 표현되었고,

그림7의 스케일 역시 0이 아닌 3200에서 시작하는 것을 확인할 수 있다.

 

 

 

 

2. 선 그래프는 스케일이 중요

선 그래프의 목적은 변화를 보여주는 것,  따라서 특정한 경우를 제외하고는 기준선을 '0'으로 두지 않는다.

그만큼 스케일에 주의해서 확인을 해야한다.

변화를 조금 더 극적으로 보이고 싶을 때 스케일을 조정하면 된다는 의미가 되기도 한다.

 

> 두 개의 Y축을 멀리하자

 

 

> 누적값으로 눈속임

판매량 등의 그래프를 제시했을 때, 이것이 누적값인지 확인하지 않는다면, 판매량 자체가 감소해도 누적값은 계속 올라갈 수밖에 없다는 맹점을 놓치기 쉽다.

 

 

3. 파이 차트를 써야 할까?

> 전체의 합이 100%인지 확인하자

> 3D는 피하자

각도에 따라 특정 데이터만을 강조해서 보이게 하거나, 올바른 비율로 시각화 정보를 제시할 수 없을 수도 있다.

 

 

 

그래프를 보는 사람의 입장에서 그래프의 공정성을 평가하기 위해 확인해야 할 것!

그래프가 전체 그림을 보여주고 있는가?

각 축의 눈금이 과장되어 있지 않을까?

 

그래프를 만드는 사람 입장에서는?

데이터의 본질을 이해할 필요가 있다.

변화에 따른 축소와 과장을 강조해서는 안 된다.

그림의 면적 혹은 부피의 차이가 그 수치의 차이와 동일하도록 정확하게 라벨링 해야 한다.

 

728x90
반응형