상세 컨텐츠

본문 제목

2023년 4월 PIE 26장 <서울대학교 빅데이터 AI 연구실 조성준 교수님>

2023년 PIE

by 서울대학교 산업공학과 학생회 소통팀 2023. 4. 30. 22:30

본문

2023년 4월 PIE 26장 <서울대학교 빅데이터 AI 연구실 조성준 교수님>

인터뷰 대상자: 조성준 교수님

Q1. 먼저 자기 소개 부탁드립니다!

 저는 옛날 옛적에 산업공학과에서 대학을 마치고 석사를 최적화 분야로 공부한 후, 그러다 산업공학에 대해서 환멸을 느꼈습니다. 그래서 컴퓨터공학과로 유학을 가서 석사를 하고, 컴퓨터 공학을 하다가 그중에서 인공지능이 너무 재밌어서 인공지능, 요즘 얘기하는 머신러닝 신경망으로 학위를 받았어요. 근데 그때는 지금처럼 이렇게 빅데이터가 있지 않았던 시절이에요. 데이터가 없으면 ai를 못 만들죠. 그래서 아이디어는 좋은데 현실성이 떨어지죠. 그렇기에 그 당시 어떤 기업도 이런 거를 하려고 하지 않았어요. 바꿔 얘기하면 취직할 데가 없었던 거죠. 그래서 이제 다시 귀국해서 포항공대 컴퓨터공학과에서 약 5년간 학생들 가르치다 서울대 산업공학과에 다시 돌아왔습니다. 

 

Q2. 교수님이 연구하시는 분야에 대해 간단히 설명해주세요!

 저는 머신러닝, 인공지능 머신러닝을 예전부터 계속 하고 있어요. 최근에 빅데이터가 생기면서 머신러닝 할 거리가 많아진 거죠.

 혹시 모르는 사람을 위해서, 데이터를 가지고 만드는 인공지능이 바로 머신러닝이에요. 인공지능은 사실은 사람처럼 똑똑한 컴퓨터가 인공지능이잖아요. 그러니까 그거는 일종의 목표예요. ‘쓸모 있는 인간이 되자.’ 같은 거죠. 그러면 어떤 면에서 쓸모 있는 사람이 될지는 굉장히 다양한 수단이 있겠죠. 그래서 ‘어떻게 인공지능을 똑똑하게 만들지?’라는 생각을 하면 크게 두 가지 방법이 있습니다.

 하나는 뭐든지 똑똑하게 잘하는 사람을 앉혀놓고 물어보는 거죠. 어떤 사고 체계를 그대로 수학에서 얘기하는 명제같이 받아 적는 거예요. 이렇게 수백 수천 개의 명제를 만든 다음에 이것들을 가지고 연역적 추론을 하는 방법, 이것이 하나입니다. 또 한 가지 방법이 있습니다. 우리가 어렸을 때를 생각해 보면 개와 고양이를 구별할 때 명제를 가지고 구별하지 않았잖아요? 개의 특성 12개, 고양이의 특성 13개 그 명제를 내가 딱 외워서 어떤 동물을 보고는 그 명제를 막 집어넣은 뒤 고양이인지, 개인지 이야기하지 않잖아요. 그럼 ‘나는 어떻게 고양이와 개를 구별했지?’를 생각해 보는 거죠. 생각해 보니까 개도 여러 종류의 개를 보고 고양이도 여러 종류를 보면서 나도 모르게 어느 날 개와 고양이가 구분이 되는 거죠. 그래서 ‘컴퓨터도 한번 그렇게 해보자’는 생각으로 시작된게 이 두 번째 방법입니다. 그러면 여러 가지 예시, 데이터를 계속 컴퓨터한테 보여주면서 무슨 특징을 보라고 얘기를 안 하고 그냥 '얘는 개야, 얘는 고양이야.' 이것만 계속 보여주면서 컴퓨터가 개와 고양이를 구분할 수 있는 능력을 갖추게 만드는 것이 머신러닝이에요. 그 머신은 컴퓨터라는 뜻이고 그래서 컴퓨터를 가르친다고 그러죠. 그게 이제 두 번째 인공지능 만드는 방법이죠. 그러니까 그게 머신러닝으로 만든 인공지능이에요.

 그런데 2023년 현재는 99.9%의 사람들이 두 번째 머신러닝 방법을 쓰고 있어요. 과거에는 데이터가 없어서 두 번째 아이디어가 현실적으로 사용이 안 되다가 최근에 빅데이터가 나오면서 이제 머신러닝을 제대로 할 수가 있는 거죠. 그래서 이제 머신러닝 AI가 다시 뜨고 있는 거예요. 여러분들 써보셨겠지만 챗GPT 같은 것도 뭔가를 가지고 학습한 거예요. 무슨 명제를 가지고 만든 게 아니라 수많은 문서를 보고 ‘아 이런 문장 다음에는 이런 게 나오겠지?’ 그걸 배운 거죠. 그럼 그걸 가르치려면 학습의 원칙이 있어야 되겠죠. 그래서 학습하는 원칙을 우리가 러닝 알고리즘이라고 부릅니다. 내가 수많은 데이터가 막 나한테 날아올 때 그 데이터를 어떻게 인텔리전스로 바꿀 것인지가 바로 학습이에요. 학습하는 방법, 학습 알고리즘, 이렇게 되겠죠. 이렇듯 인공지능에서 출발했는데 하다 보니까 데이터가 굉장히 중요하다는 것을 깨달은 거죠. 데이터가 없으면 일이 안되고, 데이터가 굉장히 중요하다 보니까 빅데이터에 대한 관심이 많아져서 빅데이터와 AI, 머신 러닝과 데이터 분석 등을 다 연구하고 있어요.

 

Q3. 교수님이 머신러닝과 데이터 분석 연구를 하시고 있는데 그중에서도 최근 가장 관심을 두고 있는 세부 분야는 어떤 것인지 궁금합니다.

우리가 이제 개념적으로는 데이터가 많으면 그걸로 AI를 만들 수 있다고 하는데 그러면 정말 실제 데이터가 어디서 많이 생길까요? 소셜미디어에 많이 생겨요. 또 어디 쪽에서 많이 생기냐면 이제 IOT라고 이렇게 센서들, 그러니까 고속도로에 차 지나가는 거 카메라 찍고, 동네마다 cctv 찍고 하는 수많은 기계가 찍는 것에서 많이 생깁니다. 소셜미디어는 내가 올리는 거죠. 사진이나 셀카와 같은 건 사람이 해서 만드는 데이터고, 반면 기계가 어떤 한 장소에 서서 그 앞에서 벌어지는 상황을 계속 기록하고 모으는 것들을 우리가 IOT라고 그래요. T가 Thing이고요, 사물. I는 인터넷. 그래서 그런 사물들을 센서가 찍고 그 데이터를 인터넷을 통해 한 군데로 다 모으는 거예요. 그러니까 이 세상에 어떤 일이 벌어지느냐가 IOT고, 우리 사람은 도대체 무엇을 하면서 시간을 보내고 무엇에 관심이 있느냐가 소셜미디어를 보면 나옵니다. 그래서 사람을 이해하려면 소셜미디어를 봐야하고, 그다음에 세상이 어떻게 돌아가는지를 보려면 IOT 데이터를 봐야 합니다.

 세 번째 소스가 뭐냐 하면 기업 또는 공공기관, 정부, 지방자치제 등에서 나오는 데이터죠. 회사에 가는 사람은 하루 종일 무엇을 할까요? 회사원은 회사에 가서 뭐할까요? 출근하면 자기 책상에 가죠. 가서 우산 내려놓고 코트 벗고 딱 앉아서 커피 한 잔 마시면서 컴퓨터를 켭니다. 그리고 간밤에 온 이메일을 쭉 읽죠. 그리고 이메일 중에 이제 업무와 관련된 것들은 읽고 답을 하거나 첨부되어 있는 엑셀 차트를 열어본다든가, 검토를 한다든가 하겠죠. 그리고 자기가 다시 답장을 쓰고 엑셀, PPT도 만들고 이런 일을 하루 종일 해요. 물론 중간에 밥 먹는 시간과 회의 시간은 앉아서 얘기하지만 나머지 시간은 전부 컴퓨터 앞에 앉아서 뭔가를 하고 있다. 개발자들은 하루 종일 코드를 짜고 있을 거고. 내 관점에서 보기에는 직종과 하는 일, 회사에 무관하게 모든 직장인들은 하루 종일 데이터를 소비하거나 생산하거나 딱 두 가지 활동을 합니다. 소비한다는 건 남이 보낸 이메일 읽는 것, 내가 소비하는 거죠. 그다음에 내가 답장 쓰는 거는 내가 생산하는 거예요. 텍스트든 차트든 뭐 그래프든 뭐든 간에 숫자든 뭐든, 그래서 하루 종일 하는 게 데이터를 만들고 소비하고. 예를 들어서 삼성전자 같은 데에서 생성되는 텍스트 데이터, 그림 데이터, 회의할 때는 또 심지어 녹음하니까 음성 데이터. 줌으로 한다면 얼굴까지 다 동영상 데이터, 어마어마한 양의 데이터가 사내에서 또는 회사와 회사 사이에 생성이 됩니다. 그게 이제 세 번째 소스죠.

 그래서 제가 관심있는 분야는 무엇인지 말씀드릴게요. 저는 데이터 분석 자체를 하면서 우리가 내가 항상 던지는 질문은 첫 번째, '무엇을 분석할 거냐?', 두 번째는 '이걸 왜 분석하느냐?'이에요. 산이 있어서 오르는 게 아니라 저 산을 내가 왜 올라가야 되느냐 하는 거죠. 여러분들도 산에 주말에 등산한다고 하면 왜 산에 올라가느냐가 첫 번째 질문, 두 번째는 왜 저 산이냐 하는 거죠. 여러가지 이유가 다 있어요. 집에서 가깝다, 친구들이랑 여기 한번 도전해보고 싶었다 등 여러 가지 이유가 있죠. 그러니까 이유가 있어야 되는 거예요. 그러려면 분석하고 싶은 사람들이 있어야 하는데, 제일 그 욕구가 큰 데가 제조업이죠. 제조 회사들은 제품을 생산하는 과정에서 쏟아져 나오는 그 데이터를 활용해서 어떻게든 제품의 품질을 올릴 수 있는 방법을 찾고 싶어해요. 아무래도 제조 쪽이 공대 출신들이다 보니까 이렇게 과학적으로 데이터를 분석해서 뭔가를 이해하고 싶어 하는 욕구가 굉장히 강해요. 그래서 우리 연구실이나 학생들과 같이 이런 걸 분석하고 싶어해요. 그러다 보니까 제조 쪽 데이터를 많이 분석하고요. 두 번째는 이제 파이낸스(Finance)입니다. 파이낸스라는 분야는 투자도 있고, 은행 신용카드 등에서 큰 돈이 걸려 있잖아요. 거기는 돈이 걸려 있다 보니까 사람들이 새로운 방법을 한번 시도하려는 욕구가 강해요. 기존 방법보다 조금이라도 더 좋으면 임팩트가 큰 거예요. 그래서 제조와 파이낸스 분야가 제일 많이 하고 있습니다.

Q3-1. 그러면 요즘에 혹시 협력하고 있는 업체나 이런 게 있나요?

굉장히 많죠. 삼성전자 1 삼성전자 2 삼성전자 3 삼성전자 4 삼성전자 5 등 다양한 부서들과 협력을 하고 있어요. 그 다음에 물론 현대 자동차, SK, 그다음에 금융사들도 있어요. 카드사나 투자사와도 하고 있어요.

 

Q4. 서울대학교 산업공학과 교수뿐만 아니라 정부 3.0 추진위원회 빅데이터 전문위원장, 한국 BI데이터 마이닝 학회 회장, 편집 위원까지 맡고 계신데 요즘 가장 많이 시간을 투자하고 있고 노력을 쏟고 있는 것은 무엇인지 궁금합니다.

 아까 앞에서 얘기했던 R&D 라고 그러죠. 연구 개발도 하고 또 한쪽으로는 나는 교육에 굉장히 관심이 많아요. 교육이라고 하면 우리 산업공학과 학생들을 수업시간에 가르치는 교육도 있고요. 대학원생들 수업도 있고요. 뿐만 아니라 나는 전공하지 않은 사람들에 대한 교육을 굉장히 중요하다고 생각해요. 전문가가 아닌 사람들에 대한 데이터 교육. 왜 이런 생각을 하게 됐냐면 우리 산업공학과에서 학부생, 대학원생들 열심히 가르쳐서 회사에 보내면 결국은 이 사람들은 전문가잖아요. 분석 전문가인데 가서는 비전문가를 만나요. 근데 비전문가는 전문가의 위에 있어요. 사장님부터 임원 다 비전문가인 거죠. 그러면 이제 전문가는 비전문가에게 설명하고 설득해야 하는 입장인데 그 위에 계신 분들이 이제 몰라도 너무 모르는 거죠. 그러면 우리 전문가들께서 굉장히 좌절을 해요. 그래서 '내가 학교에서 잘 가르쳐봐야 저렇게 되는구나'하는 자괴감이 들었어요. 

 또 예를 들면 최적화는 최소한 더 우리 산업공학에서 많이 추구하는 것들에 대해서 이 사람들이 이해를 해야만 우리 졸업생들이 진출했을 때 빛을 발한다고 생각했어요. 나는 우리 데이터 분석가는 요리사라고 생각해요. 데이터는 식재료고, 그 식재료를 요리로 만들어주는 사람이 데이터 분석가예요. 장인이죠. 그래서 막 석사 박사 이렇게 오랫동안 공부하잖아요. 근데 요리사가 딱 됐는데 요리사가 혼자 존재할 수 없어요. 음식점에 취직을 해야 돼요. 근데 음식점 사장님은 뭐라고 그래요? 내가 100가지 요리를 학교에서 배워가지고 딱 갔더니 우리는 라면집이라며 라면을 좀 끓여보라고 하는 거예요. 그럼 굉장히 괴로운 거예요. 내가 이거 하려고 8년간 100가지 요리를 배웠나, 근데 그 사장님은 라면밖에 몰라요. 아는 게 라면밖에 없어요. 그래서 이 사람이 라면 말고도 무슨 요리가 있는지를 배워야 돼요. 사장님이 배워요. 그래야 소위 말해서 셰프하고 대화를 할 수 있는거죠. 근데 셰프가 100가지 음식을 배웠다며 100가지를 얘기하는데 뭐가 뭔지 하나도 못 알아들으면 문제가 심각한 거예요. 그래서 '이거는 전부 다 알아야 된다. 음식점에 있는 사장, 부사장, 임원들이 다 그 100가지 요인에 대해서 이해를 해야 된다. 물론 요리를 할 줄 알아야 된다'는 뜻은 아니에요. 마치 우리가 음식점에 가서 메뉴 보고 주문할 때 우리가 그 요리 못 만들잖아요. 못 만들지만 내가 물냉면, 그럼 뭔지 알잖아요. 내가 먹어봤고 맛도 알고, 그래서 먹고 나면 몸이 좀 시원해진다. 이런 걸 내가 다 알아요. 그다음에 삼계탕을 먹으면 땀이 막 나고 굉장히 더운데 시원하다. 그런 걸 우리가 다 경험해서 아는 거죠. 그렇지만 나보고 삼계탕 끓이라고 그러면 못 끓여요. 그런 차이예요. 그러니까 셰프는 요리를 할 수 있어야 되고, 셰프 아닌 사람은 최소한 끓이지는 못해도 삼계탕이 뭔지는 알아야 되는 거죠. 그래서 그런 교육에 굉장히 관심이 많아요. 다양한 기술의 융합이 산업공학의 핵심이라고 얘기를 맨날 하는데, 사장님들은 사실 요리뿐만 아니라 다른 여러 가지를 고려해야 돼요. 셰프는 요리만 하면 되지만 사장님은 뭘 생각해야 되죠? 셰프한테 ‘라면 끓여.’ 그랬더니 ‘사장님 라면 말고요, 젊은이들이 요새 이런 걸 좋아하는데요.’라고 대답하죠. ‘뭘 좋아해?’ 그랬더니 ‘초밥이요.’ 아 초밥? 그럼 딱 무슨 생각해야 되죠? ‘그거 단가가 얼마지? 초밥 만들려면 재료비가 얼마 들지? 그럼 내가 메뉴에다가 라면은 5천 원이면 되는데 2만 원짜리를 내가 메뉴에 딱 실었을 때 과연 우리 집에 오는 손님들이 초밥을 주문할까?’ 막 이런 고민들을 하는 거예요. 그러니까 셰프하고는 완전히 다른 유형의 고민을 하는 거예요. 셰프는 기껏해야 ‘냉장고 있나 우리? 스시 만들려면 생선을 잘 보관해야 되는데, 냉장고가 좋은 거 하나 더 필요한데’ 이런 생각을 하고 있을 때 사장님은 단가 생각하고 우리 가게에 오는 손님들이 어떤 손님들인지를 생각하고 이 사람들이 스시를 먹을지 같은 고민들을 하는 거예요. 그러니까 다른 차원의 고민들을 하는 거죠. 빅데이터의 이해라는 교양 과목도 그런 이유에서 6~7년째 하고 있어요.

 

Q5. 삼성전자, 현대자동차, SK 텔레콤, 앞서 말씀하신 것처럼 다양한 기업에 연구과제와 자문을 수행하고 계신데 그중에서 가장 기억에 남는 프로젝트는 무엇인가요?

 굉장히 좋은 질문인데요. 이 얘기를 먼저 할게요. 삼성전자, 현대자동차, SK 하이닉스 이렇게 제조 쪽, 조선 쪽도 많이 했어요. 대우조선과 같은 기업은 내가 아무리 좋은 걸 갖다 줘도 내가 갖다 주는 순간 이게 비밀이 돼요. 절대로 공개를 안 해요. 그리고 내가 갖다 준 거를 어떻게 잘 쓰는지, 그다음에 썼을 때 얼마나 효과가 났는지도 얘기를 안 해줘요. 그냥 No More 커뮤니케이션이에요. 그래서 사실은 잘 모르겠어요. 내가 계속 갖다 줘도 이게 어떤 건 쓰이고 어떤 건 안 쓰일 수도 있잖아요. 근데 이제 확실히 잘 쓰이는 거를 잘 모르겠어요.

 내가 지금 알고 있는 건 두 개에요.  하나는 신용카드를 우리가 쓸 때 승인이 떨어지면 그 순간에 이 거래가 정상 거래인지 사기 거래인지 측정을 해서 사기 가능성을 계산해내는 시스템이 있어요. 그걸 우리가 만들었어요. 그래서 신한카드와 KB 국민카드에서 쓰고 있고요. 근데 물론 내가 사기라고 생각한다고 해서 100% 옳다는 건 아니에요. 다만 0에서 100점 사이에 이건 90점 정도로 사기인 것 같다는 식으로 정보를 줘요. 그러면 간밤에 시스템이 정리해 놓은 것을 다음 날 아침에 담당자가 왔을 때 그걸 이제 순서대로 100점부터 100점 99 98 순서로 보면서 사람이 프로세스를 해 나가죠. 그게 없으면 그 많은 거를 어떻게 사람이 다 감당하겠어요. 그래서 AI가 사람을 대체한다기 보다는 사람의 잡일, 할 수 있는데 시간이 너무 많이 걸리는 것들을 AI가 대신해주는 거죠. 사람은 중요한 것들만 집어주면 되는 시스템인 겁니다.

 또 하나가 이제 쇼박스라는 영화 배급사. CGV, 롯데, 쇼박스, 애니W같은 것들이 배급사에요. 배급사라는 건 영화를 어디서 사가지고 와서 영화관에 공급하는 거예요. 그러니까 도매해서 물건을 사다가 소매점으로 고객한테 직접 파는, 이마트 에브리데이 같은 거죠. CJ에서 햇반을 사다가 우리한테 돈을 받잖아요. 이처럼 그게 바로 쇼박스 같은 회사예요. 그런데 쇼박스에서 개봉 두 달 전에 이 영화를 상영하면 몇 명이 들어올지를 예측하고 싶어해요. 왜냐하면 이 회사는 거의 매달 하나씩 영화를 계속 내요. 근데 이 회사가 50억 주고 영화를 사 왔어요. 이제 개봉하려고 그러는데 예측을 해보니까 45억 밖에 못 벌 거 같아요. 그럼 5억 마이너스죠. 손해가 나면 안 되잖아요. 그러니까 수익을 50억이 넘어가도록 마케팅을 해요. 그래서주연 배우를 한국에 데리고 온다든가, 버스에 광고를 한다든가 하는거죠. 근데 이런 마케팅은 돈이 들어가죠. 그러니까 수익이 50억을 넘길 수 있는지 없는지를 알아야 내가 가진 전체 광고 예산 중에 어느 영화에 얼마큼 투입할지를, 결정할 수 있어요. 그게 최적화에요. 그래서 50억짜리 영화를 샀는데 60억 정도 벌 것 같아요. 그런 거는 굳이 굳이 홍보 안 해도 되죠. 그러기 위해서 이제 수익을 예측하는데 사람이 하는 것보다 훨씬 AI가 잘해서 6년동안 잘 썼어요. 코로나 오기 전까지(웃음). 영화 관람자 수는 그 배급할 영화와 굉장히 유사한 영화의 과거의 성적, 그리고 또 이 영화가 어느 영화랑 대결하느냐가 중요해요. 영화는 대결의 게임이에요. 마라톤이 아니고요. 얘는 테니스예요. 상대가 있어요. 그래서 아무리 좋은 영화라도 마블 영화같이 인기있는 영화랑 붙으면 힘 못 쓰는 거예요. 그래서 이제 그런 상대적인 건 있어요.

 

Q6. 교수님이 생각하시는 현재 빅데이터 발달의 한계와 이를 개선하기 위해선 어떤 해결법을 적용해야 할까요?

 아까 얘기한 대로 비전문가들의 무지가 한계예요. 그러니까 ‘빅데이터 쓰면 좋다. 어디에 쓰지? 왜 그걸 써야 되지?’라는 거는 누가 결정해요? 비전문가가 결정합니다. 내가 여기서 얘기하는 비전문가라는 거는 공장에서 물건 만드는 사람, 상품을 기획하는 사람, 물건을 마케팅에서 파는 사람, 품질을 측정하는 사람, 자금을 조달하는 사람, 원자재를 사 오는 사람, 인사 관리하는 사람, as 하는 사람, 수많은 그 부서에 회사의 구성원들. 그 사람들은 아무도 빅데이터 전문가가 아니에요. 그런데 그 사람들 각자의 업무에서 어떤 부분을 어떤 데이터로 어떻게 분석하면 내가 이걸 더 의사결정을 잘 할 수 있을까를 고민하는 거죠.

 예를 들면 CJ에서 밀가루를 얼마나 살 것 같아요? 일년에 다량의 밀가루를 사겠죠. 그러면 공장에서 계속 밀가루 주세요, 주세요. 할 거 아니에요. 그러면서 이제 좀 미리 쌓아두겠죠. 그다음, 언제 사는 게 좋을까요? 밀가루 가격은 어떻게 움직일까요? 일단 밀가루의 종류가 굉장히 많아요. 전 세계에서 사와요. 다 다른 밀이에요. 퀄리티도 다 달라요. 그리고 가격이 이게 계속 춤을 춰요. 1년 내내. 그럼 나는 어느 지역에 있는 어떤 밀을 언제 사는 게 좋아요? 당연히 좋은 거를 싸게 사는 게 좋아요. 그럼 언제 사죠? 매달 1일 날 사나요? 조금씩 조금씩? 그러면 평소 거래하던 곳에서 계속 거래하는 방법은 굉장히 질이 안 좋은 방법이죠. 그래서 정보들을 데이터로그로 봐야 되겠죠. ‘4월에는 다 이렇게 가격이 내려가더라’라던가, 아니면 어느 지역은 내려가고 어느 지역은 올라간다는, 이런 데이터를 보고 최적의 솔루션을 찾는거죠. 우리 산업공학에서 말하는 최적화입니다.

 최적화를 잘 하려면 그 숫자가 있어야 되잖아요. 그 숫자가 바로 데이터인거죠. 그런 걸 어떻게 내가 모으고, 어떻게 들여다보고, 어떻게 이해할건지 이런 것들이에요. 그래서 그런 거 하려면 데이터 사이언스가 필요하죠. 그런데 밀가루 사는 사람에게 갑자기 데이터 사이언스 석사나 박사를 좀 하라는건 아니죠. 이 사람은 최소한의 분석이 가능한 정도만 알면 돼요. 이걸 소위 데이터 리터러시라고 해요. 그게 잘 되면 모든 분야에서 또는 사람을 뽑거나 인재 관리할 때도 데이터를 이용할 수 있어요. 데이터를 어떻게 이용할 수 있는지를 알면 빅데이터가 책 안에 머무르지 않고 우리 현실에 넘어와서 우리의 기업에 수익을 올려주거나 예산을 절감하거나 더 적은 돈으로 더 많은 효과를 낼 수 있어요. 어떻게 핀 포인트로 딱 그 점을 잡아서 필요한 데 돈을 쓰느냐 하는 문제는 이유를 알고, 핀셋 같은 처방을 해줘야 해요. 그런데 그러려면 데이터 분석을 그쪽 사람들이 해야 되는데 거기도 또 ‘전 문과인데요’, ‘저 공무원이잖아요’, ‘저 행시 봤어요’, ‘저한테 왜 자꾸 데이터를 하라고 그러세요’ 이러는거죠. 이런 마인드가 없어지고 데이터가 전체적인 교양이 되어야 하는데 그렇지 않다는 점이 한계입니다.

 

Q7. 빅데이터 내부적으로 더 나아가야 할 점, 빅데이터의 자체 기술이 부족한 점은 어떤게 있을까요?

 예를 들어, 우리가 이제 소셜미디어를 분석한다고 하면, LG전자라는 회사에 소비자가 글을 올리거나 혹은 네이버에 영화평들 쫙 쓰면서 점수를 주잖아요. 점수도 주고 근데 거기다 글을 올린 사람이 모든 영화 본 사람이 다 올리는 게 아니에요. 생각해 보세요. 안 올리죠 여러분. 보고 너무 안 좋을 때 쓰는 사람도 있고, 좋을 때만 쓰는 사람도 있고, 또 반대인 사람도 있을 수 있고. 그래서 이게 올라온 글들이 영화를 본 사람들이 모두 쓴 글이 아니에요. 한쪽으로 이렇게 쏠려 있는 경우들이 많아요. 열심히 이해를 해도 전체가 아닌데 일부만 보고 전체라고 오해할 수 있고요. 이런 부분들이 빅데이터 자체의 문제라고 생각합니다.

 

Q8. 그러면 조금 더 이렇게 교수님의 개인적인 이야기에 들어가서 이 빅데이터 분야를 처음 시작하게 된 계기가 있을까요?

 저는 컴퓨터 공학과에서 수업을 듣다가 인공지능 수업을 들었습니다. 처음에 ‘이거 굉장히 재밌다.’라는 생각을 갖고 있다가 머신 러닝 수업을 들었는데 ‘이거 정말 끝내준다. 나는 인생을 여기다 걸겠다.’ 이런 생각이 딱 들었어요. 그래서 그때부터 머신러닝을 공부하게 됐습니다.

Q8-1. 매료하시게 된 구체적인 이유가 있었나요?

데이터로 똑똑해지는 컴퓨터를 보면서 ‘세상에 뭐 이런 게 있어?’라고 생각했어요. 내가 27살 ‘이건 정말 대박인데?’ 그러면서도 이걸로 내가 박사까지 해야겠다는 생각은 없었어요. 교수할 생각도 없었고. 선견지명도 없어요. 취직도 안 됐는데 무슨 선견지명이야 박사를 마쳤는데 취직이 안 되는데 (웃음) 지금 세상이 바뀐 거죠. 운이 좋은 거죠. 빅데이터가 안 나왔으면 아무도 안 하는 거 혼자 공부하고 있었겠죠.

[소통팀]

그걸 딱 알아보신 게 뭔가 선견지명이 있는 것 아닐까요?

[조성준 교수님]

그렇게 발전시키지 말아주세요. 혜안 이런 거 하나도 없어요. 그냥 운이다. 99% 운이에요. (웃음)

Q8-2. 그러면 빅데이터 분야를 딱 선택한 이유부터 잘했다라고 생각하시는 건가요?

 그때는 내가 이게 뭐 안 뜨고 인기가 없어서 나는 한 점의 후회도 없었어요. 그냥 이게 재밌으니까. 사실 무모함이죠. 중요한 건 그 대목에서 우리 어머니가 나한테 뭐라고 안 했어요. 요새는 엄마들이 굉장히 뭐 못하게 하잖아요. 내가 하나 자랑할 수 있는 거 하나는 우리 엄마가 내가 뭘 하든 상관 안 했다는 거에요.

 

Q9. 빅데이터 분야로의 진로를 꿈꾸는 학생분들에게 해주시고 싶은 말씀이 있나요?

 빅데이터가 재밌으면 하고요, 빅데이터 재미없으면 안 해도 돼요. 난 모든 사람이 빅데이터를 해야 한다고 절대로 생각하지 않아요. 아까 얘기한 것처럼 빅데이터, AI는 이제 소양이 될 거예요. 한번 생각해 보세요. 100년 전에는 어땠을까요? 100년 전에는 농부 둘이 그랬을 거에요. ‘나 이제 글 배운다’ 그랬더니 ‘너가 글을 왜 배워? 농사 짓는데 글이 왜 필요해’와 같은 대화가 오고 갔다는 거죠. 그리고 30년 전에는 컴퓨터 배운다고 했더니 문과인데 왜 컴퓨터를 배우냐던게 30년 전이었어요. 그때는 그래서 컴맹이라는 말이 있었어요. 지금은 뭐죠 데맹이에요. 데이터를 아는 사람과 모르는 사람. 지금은 데이터를 배운다고 하지만 이건 이제 10년 안에 다 필수 과목이 돼요. 그러니까 이제는 잘하면 대박이 아니라 안 하면 낙오되는 사회가 될 거에요. 그렇게 또 돼야 되고. 사실 꼭 빅데이터가 아니라도 물류도 좋고 인간 공학도 좋고 자기 가슴이 울리는 걸 하세요.

 

 

- 서울대학교 산업공학과 학생회 LOOK!E 소통팀

*위의 인터뷰는 서울대학교 산업공학과 공식 인스타그램에서도 확인하실 수 있습니다:)

@OFFICIAL_SNU_IE


관련글 더보기

댓글 영역