<그림> 데이터 종류에 따른 성능 향상 그래프
자료: DeepLearningAI, A Chat with Andrew on MLOps: From Model-centric to Data-centric AI, 2021.3.25
그런데 이것이 말처럼 쉽지 않다. 많은 기업이 학습용 데이터를 구축할 때 크라우드 워커를 활용한다. 수많은 크라우드 워커가 모두 똑같은 기준을 가지고 라벨링을 할 가능성은 없다. 우리 정부에서도 매년 수천억원 규모의 인공지능 학습용 데이터셋 구축 사업을 통해 공공 데이터를 만들고 있는데, 데이터 품질이 기대만큼 나오지 않는다는 게 문제다. 수십만 명이 참여하는 프로젝트에서 데이터 라벨링의 일관성을 확보하기가 쉽지 않기 때문이다.
MLOps 조직의 핵심 역할
데이터 개선을 통해 모델의 성능을 개선하는 데이터 중심의 AI 시대에 MLOps 팀의 가장 중요한 역할은 인공지능 프로젝트 전 사이클에 걸쳐 순도 높은 데이터를 구축하는 것이다. 크라우드 워커에 의존할 수밖에 없는 기업은 데이터 검수 프로세스를 시스템화하는 것도 한 방법이다. 비용이 더 들더라도 두 사람의 크라우드 워커가 라벨링을 하게 하고, 라벨링이 서로 다른 경우에 검수자가 일관된 원칙을 정해서 적용하는 것이다.
흔히 의료계에서 인공지능 데이터셋을 만들 때 이런 방법을 사용했다. 암 가능성 있는 환자의 사진에 나타난 증상을 라벨링을 한다고 했을 때, 의사마다 견해가 다를 수 있다. 궤양화, 종양, 염증, 모자이크화, 반점 등 각 증상의 경계에 해당되는 경우 의사마다 다르게 해석할 수 있다. 서로 다른 결과가 나왔을 때 선임 의료진이 참여하여 토론을 통해 증상을 확정하는 방식으로 의료 데이터를 구축했다.
인공지능 솔루션 개발에서 데이터가 중요하다는 것은 다 알고 있다. 이 말을 오늘날의 현실에 비추어 풀어보면, 데이터가 일관성 있게 구축될 때 모델의 성능이 높아진다는 의미다. 상황이 이러한 데도 인공지능 연구는 여전히 모델링에 집중돼 있다. 앤드류 응 박사가 최근 인공지능 논문 수백 편을 리뷰해 봤는데, 99%의 논문이 모델 개선에 대해 다뤘고, 1% 정도만 데이터에 대해 다뤘다는 사실을 확인했다.
MLOps 팀은 인공지능 개발, 활용, 모니터링 전 과정을 일관성을 가지고 관리하는 역할을 한다. 인공지능 수명주기 전 과정이 고객 불만 없이 빠르게 돌아가도록 하는 역할을 하는 것이다. 그런데 데이터 중심 인공지능 시대에 핵심은 인공지능 개발과 활용 전 과정에서 데이터의 일관성을 유지하는 것이다. 데이터 확보 과정에서 일관성을 어떻게 유지할지, 이후 재학습에서도 이런 원칙을 시스템적으로 지켜나갈 수 있는지, 그 방법을 고민하는 것이 MLOps의 핵심적인 역할이 돼야 한다.