사랑의 시각화, 17171771

휴대폰이 없고 삐삐만 있던 시절, 사랑하는 연인에게 보내던 메시지가 있습니다. 혹시 모르시는 분들을 위해 설명하자면 삐삐는 문자를 지원하지 않고 오직 숫자만 지원합니다. 이에 다양한 숫자 암호들이 등장했습니다. 8282는 빨리빨리, 58은 오빠 등 지금도 흔히 쓰이는 숫자 축약어도 이때 만들어진 것이지요. 그중 이제는 거의 쓰이지 않는 17171771이라는 문구도 있습니다. 요즘 아이에게 물어보면 기차 또는 바코드냐고 묻는 이 수의 의미는 사랑이라고 하네요. 거꾸로 보면 영어 ‘I Love you’와 비슷해 보여서 그렇게 지었다고 하는데, 정말 로맨틱하지 않나요? 이렇게 마음속에만 가득한 사랑을 화면에 나타낸 것도 시각화라고 할 수 있습니다. 시각화란 보이지 않는 개념을 이미지, 차트, 문자 등으로 표현하는 과정을 뜻하니까요.

방대한 데이터를 한눈에 볼 수 있게 하는 데이터 시각화

그러면 왜 하필 ‘청각화', ‘후각화'가 아닌 ‘시각화’였을까요? 이는 인간의 인지 처리 과정 때문인데요. 보는 것에 익숙하기 때문입니다. 실제로 인간은 80%의 정보를 시각을 통해 얻는다고 합니다. 또 시각화된 자료가 청각화된 자료보다 정보의 밀도가 높고 시공간의 제약이 없다는 것도 한몫했을 것입니다.


©newsjelly, 인구통계 데이터 표

데이터 시각화 역시 인지 처리의 자연스러운 연장선에서 탄생한 기술입니다. 예전에는 데이터라고 하면 위의 그림과 같이 몇천 줄에 달하는 통계표를 떠올렸을 겁니다. 이 표를 활용하면 통계 수치를 하나하나 항목별로 뜯어 볼 수 있긴 하지만, 이해하는 데 아주 오랜 시간이 걸리니 별도의 정리 형식이 필요했고, 그것이 차트와 그래프가 된 것이죠. 또 이제는 컴퓨터로만 확인 가능한 비정형 데이터가 마구 쌓이는 시대가 되었습니다. 이런 비정형 데이터는 사람이 도무지 읽어낼 수 없는 언어로 작성되어 있으니, 데이터를 차트와 그래프로 변환하지 않으면 의미 파악이 불가능합니다.


©newsjelly, 인구 데이터 인터랙티브 사례

‘데이터 시각화’가 탄력을 받고 성장한 배경입니다. 데이터를 차트나 표로 표현한다는 기존 의미에서, 인간이 이해할 수 없는 비정형 데이터를 이해할 수 있는 형식으로 정리하는 기술 전체를 ‘데이터 시각화’라고 하는데요. 이렇게 데이터를 시각화하면 방대한 데이터를 한눈에 볼 수 있게 되고, 의미를 알 수 없던 비정형 데이터도 활용이 가능하게 되죠. 게다가 통계 수치로는 알 수 없던 패턴을 확인할 수 있게 되어 데이터에서 인사이트를 얻기 수월해집니다.

데이터의 정확한 해석을 가능하게 하는 데이터 시각화


©newsjelly, 데이터가 한눈에 보이는 시각화 발췌

데이터를 시각화하면 데이터 해석의 정확성도 높아집니다. 위의 그림은 데이터 시각화 분야의 유명 인사인 알베르토 카이로(Alberto Cairo)가 발견한 사례입니다. 그려진 12개의 차트, 심지어 저 공룡까지 모두 같은 데이터값을 갖는데요. 평균과 분산, 표준편차 등 주요한 지표가 소수점 두 자리까지 같은 데이터 3개인데도 시각화해 보니 이런 제각각의 패턴이 나왔습니다. 숫자만으로는 정확한 의미를 도출할 수 없다는 것이죠. 데이터 분석 과정에서 시각화를 필수적으로 활용해야 합니다. 이를 ‘시각적 분석(Visual Analysis)’이라고 하는데요, 변수, 수치 계산 방식, 차트 유형 등의 조건을 달리하면서 다른 형태로 표현되는 시각적 패턴을 근거로 데이터를 분석하는 방법입니다.

데이터의 민주적인 활용을 가능하게 하는 시각화 대시보드

이런 데이터 시각화의 정점에 ‘대시보드’가 있다고 할 수 있습니다. 데이터 시각화 대시보드란 한 개 이상의 시각화 차트를 한 화면에 모아서 배치하고, 데이터를 탐색할 수 있도록 설계한 화면입니다. 대시보드를 도입하면 데이터 전문 지식이 없는 임직원 누구나 데이터 기반의 의사 결정을 쉽게 할 수 있다는 이점이 있는데요. 최근 현대로템은 열차에서 생성되는 데이터를 활용한 스마트 유지보수 플랫폼에도 사용자(운영자 및 유지보수자)환경에 맞는 대시보드를 개발하고 있는데, 열차의 주요 부품의 정형/비정형 데이터를 시각화하여 부품의 상태를 진단하고 고장 시, 효율적으로 분석하고 고장을 예지하기 위한 의사 결정의 수단으로 활용할 계획이라고 합니다.


©newsjelly, 제품 판매량과 실판매가 지표를 중심으로 만들어진 데이터 시각화 대시보드

이렇듯 데이터를 대시보드로 구현할 때는 주의할 점이 있습니다. 단순히 차트만 모아놓는다고 대시보드가 성립하지 않기 때문입니다. 우선 대시보드 제작 목적을 명확히 해야 합니다. 데이터를 쌓는 것 자체는 사실 어려운 일이 아니지만, 수많은 데이터 중에서 필요한 데이터만을 추리는 것이 중요한 부분입니다. 예를 들면 현대로템의 스마트 유지보수 플랫폼의 대시보드에는 열차와 관련한 수많은 데이터(운행/고장/상태 정보)가 있지만, 어떤 목적의 대시보드냐에 따라 관련 데이터 등을 시각화 대상으로 선별하여 개발 중입니다.
이러한 대시보드는 여러 사용자를 고려하여 시나리오 기반으로 꼼꼼하게 기획되어야 함에 따라, ‘완벽한 시나리오’가 설계되어야 한다는 점에서도 주의를 기울여야 합니다. 실무자는 상세한 데이터 속성값을 알아야 하고, 의사 결정자는 전체적인 흐름을 파악하는 것이 중요하겠죠. 또 같은 데이터라도 활용 목적에 따라 표현 차트의 형식을 다르게 해야 합니다. 기간에 따른 추이 변동은 라인 차트로, 항목별 비교는 바 차트로 표현하는 것이 데이터를 활용할 때 자연스러울 것입니다.


©newsjelly, 시각화 차트와 데이터 표를 함께 활용한 데이터 시각화 대시보드의 예시 화면

위 원칙을 반영해 열차 유지보수를 위한 데이터 시각화 대시보드를 만든다고 생각해 보겠습니다. 유지보수 자를 위한 화면을 설계할 때는 도형을 활용한 시각화 차트와 데이터 표를 함께 구현하면 좋을 것입니다. 유지보수를 위한 상세한 데이터 분석과 함께 유지보수 행위를 수행해야 하기 때문이며, 이를 위해 세부적인 데이터 항목 및 수치를 하나의 화면에 표현하면 유지보수 업무에 참고하기가 훨씬 용이할 것입니다. 한편 관제 부서를 위해서는 전체 패턴을 파악하는 화면을 만들어야 합니다. 이상 값을 한눈에 파악해 문제를 해결하고 개선안을 도출하기 위해서는 차트 중심의 대시보드가 효과적일 것입니다. 또 기업의 경영진을 위한 화면도 고민해 볼 수 있는데요. 경영진은 기업의 핵심 KPI 지표를 모니터링하는 것을 주요한 목적으로 하죠. 여기서는 표를 완전히 생략하고, 부서별 차트를 한 화면에 구현하는 것에 집중하면 좋습니다. 전체를 한눈에 보고 직관적인 의사결정을 할 수 있도록 돕기 위해서 정보량을 줄이는 것이죠.


©열차 고장 현황 대시보드 예시 화면

사진은 위의 원칙에 따라 구현된 열차상태 시각화 대시보드 예시 화면입니다. 3개의 차트, 1개의 데이터 표, 또 1개의 인포그래픽으로 구성되어 있는데요. 좌측 상단의 “Fleet Availability”라는 열차편성의 가용성에 대한 내용을 보시면, 전체 운영 가능한 66개의 편성 중 62개의 편성이 운영되고 있음을 한눈에 알 수 있으며, 현재 ‘가용성 94%’라고 수치적으로도 표현해 줄 수도 있습니다. 또 우측 하단에서는 보유 차량 중 문제가 있는 것들을 한눈에 확인할 수 있습니다. 아마 좌측 하단 통계표에서는 자세한 설명을 확인할 수 있을 것입니다. 기존에는 여러 부서에서 관리하는 몇 개의 문서를 열어보고 확인할 수 있는 내용을 한 화면에 구현해 의사소통을 효율화한 것이죠. 현대로템 스마트 유지보수 플랫폼 개발자의 말에 따르면 IoT 기술과 빅데이터 플랫폼을 활용하여 열차 유지보수 비용을 기존 대비 최대 30%까지 절감한 사례도 있다고 합니다. 물론 전부가 데이터 ‘시각화’의 효과는 아니겠지만, 데이터를 의사 결정에 활용하는 최종 형태는 결국 시각화라는 점에서 그 중요성을 몇 번 강조해도 지나치지 않을 것 같습니다. 데이터를 어떻게 확보하느냐보다 어떻게 활용하느냐가 더 중요한 질문이 된 오늘날, 데이터의 가치를 그리는 시각화의 역할은 필수적입니다. 더 많은 사람이 시각화를 통해 데이터 인사이트를 쉽게 그릴 수 있기를 희망합니다.