스트레스의 영향을 걱정하는 사람들은 많은 스트레스를 경험하지만 그 영향을 부정적으로 인지하지 않는 사람들에 비해 조기 사망 위험이 43% 증가했다. 이상하게도 스트레스 수치는 높지만, 스트레스에 대한 두려움의 수치가 낮은 사람들이 사망할 위험이 가장 적었다. 이들은 도전을 즐기는 사람들이다. - 켈리 하딩, ‘다정함의 과학’에서
스탠포드 심리학자 켈리 맥고니걸 교수가 18년 동안 추적 연구한 결과, 스트레스는 건강에 큰 영향을 미친다고 보고한 사람들은 스트레스는 건강에 아무런 영향을 미치지 않는다고 보고한 사람들에 비해 심장마비의 위험이 두 배 높았습니다. 스트레스 그 자체가 위험한 것이 아니라, 스트레스를 걱정하는 것이 병을 불러옵니다. 걱정하지 않고 오히려 즐길 수 있다면 스트레스는 아무런 문제를 일으키지 않습니다.
"상대가 넘어지는 것을 보면, 그 상황이 아무리 공을 툭 차면 골문으로 들어갈 수 있는 좋은 찬스라 해도 공을 바깥으로 차내라. 사람부터 챙겨라. 너는 축구 선수이기 이전에 사람이다. 사람이 먼저다."
- 손웅정의《모든 것은 기본에서 시작한다》중에서 -
* 축구의 하이라이트는 '골인'입니다. 그래서 물불을 가리지 않고 골인에 몰입합니다. 오로지 볼만 보일 뿐 아무것도 보이지 않습니다. 넘어진 상대 선수도 보이지 않습니다. 바로 이때, 아들을 세계 최고의 축구선수로 키운 아버지는 "공보다 사람을 먼저 챙기라"고 말합니다. 멋진 아버지 멋진 아들, 그 선수에 그 아버지입니다.
인간의 마음에서 일어나는 것 중 그냥 일어나는 것은 단 하나도 없다. 만일 어떤 것이 이유도 모른 채 자기 삶안에서 자꾸만 반복되어 일어난다면, 그것은 자신이 반드시 의식해야만 하는 내면 세계의 메시지다. 그러므로 중년은 나를 떠나 방황하는 시기가 아니라, 외면했던 '나'자신으로 돌아오는 사색하는 시기여야 한다.
- 최명희의《중년의 심리학》중에서 -
*'나'를 직면하는 일은 참으로 어려운 일입니다. 아마도 '나'를 의식하는 일만 해도 벅찰 수 있습니다. 그런 의식 없이 살아도 아무 문제없이 그럭저럭 살아가겠지요. 그럼에도 어느날 문득 '나'자신을 돌아본다면, 그리고 그대로 수용할 수 있다면, 로또 당첨보다도 더 기막힌 행운입니다. 행운은 '바로 지금 여기', '내 안'에 있습니다.
역사는 가혹한 스승이다. 우리는 현재의 고통이 내 일을 어떻게 조각할지 예견하지 못한다. 늘 그래왔듯 고통과 희망이 공존하는 세상에서 살아가야만 한다. 물론 고통과 희망의 정도가 동등하지는 않다. 지난 몇 년간 우리는 수많은 방식으로 힘들었는데, 내게 있어 최악은 개인적인 절망감이었다.
- 게일 콜드웰의《어느날 뒤바뀐 삶, 설명서는 없음》중에서 -
* 역사는 그냥 흐르지 않습니다. 가혹하다 못해 처참하기까지 합니다. 고난과 시련이 반복되고, 땀과 눈물과 때론 피를 요구합니다. 그 과정에서 인류 개개인에게 극한의 고통과 절망감을 안겨 줍니다. 그런데 놀라운 것은 깊은 뜻과 교훈, 미래에의 희망이 그 안에 숨겨져 있다는 사실입니다. 절망과 희망은 늘 공존합니다.
“무슨 일 있어요?” 대신에 “잘 지냈어요?” 한마디를 해도 호감을 주는 사람은 다르게 말한다. 오랜만에 본 사람이 지쳐 보이거나 초췌해 보여도 밝은 어투로 말을 시작하는 게 중요하다. “무슨 일 있어요?”, “얼굴이 왜 그래요, 어디 아파요?”라고 내가 던진 한마디가 자칫 상대의 기분을 상하게 할 수 있는 말 대신 “잘 지냈어요?”와 같이 내 판단이 틀려도 기분을 해치지 않는 말을 골라서 하는 게 좋다. 이후 대화를 나누면서 정확해진 내용을 기반으로 말을 이어가야 말실수도 막고, 상대의 기분도 상하게 하지 않을 수 있다.
“오늘은 좋아 보이네요” 대신에 “오늘도 좋아 보이네요” 아주 사소한 말 한마디가 호감을 얻는다. 간단한 예로 조사인 ‘은’을 ‘도’로 바꾸면 분위기가 정반대가 된다. 오랜만에 만난 상대방에게 “오늘은 좋아 보이네”보다 “오늘도 좋아 보이네”가 기분 좋게 들리는 것처럼 글자 하나가 미묘한 차이를 준다. 또 칭찬을 할 때 ‘특히’를 넣어 “오늘은 특히 좋아 보이네”라고 말해주면 호감을 배로 얻을 수 있다. 자신이 같은 말을 듣는다면 어떨지 상상한 다음 상대에게 말하면 좋다.
“그게 아니라” 대신에 “알고 계실 테지만” 대화에서 호감을 높이기 위해서는 상대방을 존중해 주는 말하기 방법이 필요하다. 말을 할 때 ‘알고 계실 테지만’을 덧붙여준다면, 상대방이 자신을 존중해 주는 느낌을 받을 수 있다. 특히 직장에서 상사나 동료에게 내 의견을 어필할 때 적용하면 확실한 도움이 된다. 한마디로 상대를 위한 배려를 할 수 있는 셈이다.
“안녕하세요” 대신에 “안녕하세요, **에서 뵈었었죠” 살다 보면 예전에 잠깐 만난 적 있었던 사람과 다시 만나는 경우가 있다. 그러나 간혹 만난 적 있었던 사람을 기억 못 하고, 아는 척하는 사람을 몰라보면 상대가 무안해지는 것에 무례를 저질렀다는 생각이 든다. 이 경우 “그때 뵀던 누구예요”라며 먼저 나서서 정보를 밝히는 방법을 택하는 것이 좋다. 상대에게 미리 자신의 이름과 만났던 상황을 알려줘 기억을 돕고, 기억하지 못해 난감해지지 않도록 만든다.
“수고하세요” 대신에 “좋은 하루 보내세요” 누군가 대화를 할 때면 끝에 “수고하세요”라는 말을 습관적으로 쓴다. ‘고생하라’,’수고하라’는 의미가 담긴 끝인사가 아랫사람에 한정된다는 의견도 있는만큼, “수고하세요”보다는 “수고 많으셨습니다”가 낫고, 그보단 “좋은 하루 보내세요”와 같은 덕담과 같은 끝인사가 더 자연스럽다. 조금 더 상대방의 호감을 이끌어 내기 위해서는 ‘~보내셔요, ~하셔요’라는 서술어를 사용해보는 것도 방법이다. 복수 표준어로 인정되는 ‘하셔요’는 ‘하세요’보다 조금 더 어감이 부드러워 한 끗 차이로 좀 더 친근하고 다정하게 다가갈 수 있다.
“회의 마치겠습니다” 대신에 “좋은 회의였습니다” 대부분의 사람들은 마지막에 들은 말을 잘 기억한다. 일반적인 대화나 발표, 스피치에 있어서도 마지막 클로징 멘트가 중요한 게 그 이유다. 여러모로 격한 논의가 오간 회의가 끝난 후에도 “해결해야할 이슈들이 있지만 의미있는 회의였습니다”라는 식으로 마무리하는 것이 좋다. 자신에 대해 이야기할 때에도 “밝은 사람인데 조금 어두운 면이 있어요”와 “조금 어두운 구석이 있지만, 그래도 밝은 사람이에요”처럼, 장점과 단점에 있어서 장점을 뒤에 배치하는 것만으로도 긍정적인 이미지를 줄 수 있다.
누군가는 데이터를 새로운 석유라 부르고, 누군가는 새로운 금이라고도 부른다. 철학자와 경제학자들은 비유의 적절성 대해 논쟁할 수 있겠지만, 데이터 기반 의사 결정을 도모하는 기업에 데이터 구성 및 분석이 필수적이라는 점은 의심의 여지가 없다.
일단은 견고한 데이터 관리 전략이 핵심이다. 데이터 거버넌스, 데이터 운영, 데이터 웨어하우징, 데이터 엔지니어링, 데이터 분석, 데이터 과학 등을 포괄하는 데이터 관리는 올바르게 수행될 경우 각종 비즈니스에서 경쟁 우위를 가져다줄 수 있다.
좋은 소식은 데이터 관리의 많은 측면이 잘 정립돼 있으며, 수십 년 동안 발전해 온 원칙이 존재한다는 점이다. 예를 들어, 적용하기 어렵거나 이해하기에 간단하지 않을 수 있지만, 많은 과학자와 수학자 덕분에 기업은 이제 데이터를 분석하고 결론을 내리기 위한 다양한 프레임워크를 갖게 됐다. 분석 한계를 나타내는 오차 막대를 그리는 통계 모델도 있다.
그러나 데이터 과학과 이를 뒷받침하는 다양한 학문에 대한 연구에서 얻은 모든 장점에도 불구하고 우리는 머리를 긁적거릴 때가 있다. 현장에서 벽에 부딪히는 경우가 많기 때문이다. 때로는 너무 많은 데이터를 수집하고 구성하는 역설적인 문제도 있다. 일부는 철학적이며 우리의 추상적 역량을 시험한다. 그리고 처음 데이터를 수집하는 데서는 개인 정보 보호 문제가 대두되고 있다.
다음은 수많은 기업에서 데이터 관리를 어려운 과제로 만드는 몇 가지 어두운 비밀들이다.
애물단지 비정형 데이터 기업 아카이브에 저장되어 있는 데이터의 대부분은 구조화되어 있지 않다. 은행의 콜센터 직원이 작성한 문자 메모를 검색하기 위한 인공 지능(AI) 사용을 원하는 경우가 있다. 이 문장에는 은행의 대출 및 서비스를 개선하는 데 도움이 될 수 있는 통찰이 담겨 있을 수 있다. 그러나 메모 데이터는 기록할 내용에 관해 서로 다른 생각을 가진 수백 명의 사람들이 작성한 것이다. 또한, 직원들은 서로 다른 작문 스타일과 능력을 가지고 있고, 일부는 전혀 쓰지 않았다. 또 어떤 사람들은 주어진 전화에 대해 너무 많은 정보를 기록한다. 수십 년 동안 수백 명의 직원이 작성한 텍스트 더미가 있다면, 구조화 수준이 훨씬 더 약해질 수 있다.
정형 데이터라도 비정형인 경우 좋은 데이터 과학자와 데이터베이스 관리자는 각 분야의 유형과 구조를 명료하게 지정해 데이터베이스를 마련한다. 때로는 필드의 값을 특정 범위의 정수 또는 미리 정의된 선택으로 제한한다. 하지만 사람들은 데이터베이스가 주름과 결함을 추가하는 방법을 생각해낸다.
필드가 비어 있는 경우도 있다. 질문이 적용되지 않는다고 생각할 때 ‘n.a.’를 넣기도 하지만, 그저 대시 기호를 넣는 이들도 있다. 사람들은 심지어 이름을 해마다, 날마다 다르게 표시하기도 한다.
우수한 개발자는 유효성 검사를 통해 이런 문제 중 일부를 파악한다. 훌륭한 데이터 과학자는 정리를 통해 이런 불확실성을 어느 정도 줄일 수도 있다. 그러나 탁월하게 구조화된 표에도 의심스러운 항목이 있고, 이런 의심스러운 항목에 알 수 없는 항목과 분석 오류가 발생할 수 있다. 좌절감을 느끼게 하는 현실이다.
너무 엄격하거나 느슨한 데이터 스키마 데이터팀이 스키마 제약 조건을 아무리 자세히 설명하려 해도 다양한 데이터 필드의 값을 정의하기 위한 스키마는 완벽하기 어렵다. 너무 엄격하거나 너무 느슨하다. 데이터팀에서 엄격한 제약 조건을 추가하면 사용자는 허용 가능한 값의 좁은 목록에서 답을 찾을 수 없다고 불평한다. 스키마가 너무 수용적이면 사용자는 일관성이 거의 없이 이상한 값을 추가할 수 있다. 스키마를 올바르게 조정하는 것은 거의 불가능할 지경이다.
매우 엄격한 데이터 법률 개인정보 보호 및 데이터 보호에 관한 법률은 이미 강력하며, 점점 더 강력해지고 있다. GDPR, HIPPA 및 각종 규제 사이에서 데이터를 수집하는 것은 매우 어려울 수 있으며, 해커의 침입에 대응하기란 훨씬 더 위험할 수 있다. 많은 경우에 프로그래머나 데이터 과학자보다 변호사에게 비용을 지출하는 것이 더 쉬울 수 있다. 이런 골칫거리로 인해 일부 기업은 데이터를 제거할 수 있는 즉시 데이터를 폐기한다.
엄청난 데이터 정리 비용 많은 데이터 과학자가 자신의 작업 중 90%가 데이터를 수집하고, 일관된 형식으로 만들고, 끝없는 구멍이나 실수를 처리하는 것이라고 본다. 데이터를 가지고 있는 사람은 항상 “CSV에 모든 것이 있다”라고 말할 것이다. 그러나 그들은 빈 필드나 잘못된 특성을 언급하지 않는다. 실제로 통계 분석을 수행하기 위해 R 또는 파이썬에서 루틴을 시작하는 것보다 데이터 과학 프로젝트에서 사용할 데이터를 정리하는 데 10배나 더 많은 시간을 소비하기 쉽다.
사용자의 의심 증가 최종 사용자와 고객이 기업의 데이터 관리 관행에 대해 점점 더 의심을 품고 있다. 일부 AI 알고리즘에 대한 불안감과 두려움이 증폭되고 있다. 일거수일투족을 감시하는 듯한 반응을 보이기도 한다. 이런 두려움은 규제를 조장하고 종종 기업과 선의의 데이터 과학자를 괴롭힌다. 사용자가 의도적으로 가짜 값이나 오답으로 데이터 수집을 방해하는 경향을 보이는 것이다. 때로는 작업의 절반이 악의적인 파트너 및 고객을 상대하는 업무가 될 수 있다.
외부 데이터와의 통합 위험성 공격적인 기업은 자사의 정보를 서드파티 데이터 및 인터넷에 떠도는 방대한 개인화된 정보와 통합하는 방법을 모색하고 있다. 실제로 일부 도구는 모든 고객에 대한 데이터를 흡수해 각 구매에 대해 개인화된 정보를 작성하겠다고 공개적으로 공언한다. 그렇다, 이들은 사용자의 패스트푸드 구매와 신용 점수를 추적하는 데 첩보기관이 테러리스트를 추적하는 데 사용하는 기술을 사용한다. 사람들이 불안해하는 것이 사실 당연하다.
데이터 사용을 단속하는 규제 당국 데이터 분석이 언제 어떤 선을 넘을지 알기 어렵지만, 일단 선을 넘으면 규제 당국이 나타난다. 캐나다의 최근 사례에서, 정부는 일부 도넛 가게가 어떻게 경쟁업체에서 쇼핑하는 고객들을 추적하고 있는지 조사했다.
정부는 보도 자료를 통해 “조사 결과, 팀 호튼스가 미국의 서드파티 위치 서비스 업체와 맺은 계약에 너무 모호하고 허용적인 표현이 포함되어 있었다. 이로 인해 회사가 ‘비식별화된’ 위치 데이터를 판매할 소지를 남겼을 것”이라고 밝혔다. 도대체 무엇을 위해? 더 많은 도넛을 팔기 위해서? 규제기관은 개인정보와 관련된 모든 것에 점점 더 주의를 기울이고 있다.
도출한 결과가 무가치함 우리는 뛰어난 알고리즘이 모든 것을 더 효율적이고 수익성 있게 만들 수 있다고 상상한다. 그리고 때로는 그런 알고리즘을 실제로 구현할 수 있다. 그러나 비용이 문제이다.
실제로 소비자는 물론 심지어 기업까지도 정교한 데이터 관리 체계에서 나오는 표적 마케팅의 가치에 점점 더 의문을 제기하고 있다. 이미 구매한 아이템에 대한 광고가 노출되는 것을 자주 경험했을 것이다. 엄격한 데이터 분석을 통해 실적이 낮은 공장을 식별했더니, 회사가 건물에 30년 임대 계약을 체결했을 수도 있다. 기업은 데이터 과학이 비현실적인 답을 산출할 가능성에 대비해야 한다.
결국 인간의 직관에 따라 결정 숫자는 높은 정확도를 제공하지만, 사람이 숫자를 어떻게 해석하는지가 더 중요한 경우도 많다. 모든 데이터 분석과 AI 마법이 끝난 후에 대부분 알고리즘은 일부 값이 임계 값을 초과하는지 또는 미만 인지에 대한 결정을 내려야 한다.
가령 경찰은 제한 속도의 20%를 초과하는 차량에 속도위반 고지서를 주려고 한다. 이런 임계값은 종종 임의의 값이다. 데이터에 적용할 수 있는 모든 과학 및 수학의 경우, ‘데이터 기반’ 프로세스에는 생각보다 더 많은 회색 지대가 있다. 기업이 데이터 관리 프랙티스에 투입한 방대한 자원에도 불구하고 결국 의사 결정에 영향을 미치는 최대 요인은 인간의 직관인 경우가 많다.
폭발적인 데이터 스토리지 비용 테라바이트당 가격은 계속 떨어지고 있지만 프로그래머는 더 빠르게 데이터 비트를 모으고 있다. 사물 인터넷 디바이스는 계속해서 데이터를 업로드하고, 사용자는 이런 바이트의 풍부한 컬렉션을 영원히 탐색할 것으로 기대한다. 동시에 컴플라이언스 담당자와 규제기관은 감사를 위해 계속해서 더 많은 데이터를 요구한다. 실제로 다시 액세스되는 데이터의 비율은 계속 낮아지고 있다. 그저 데이터가 하염없이 쌓여만 가는 것이다.