들어가며,,
필자는 edutech 분야에 관심이 많다. 많은 청소년들이 고품질의 수학 교육을 받았으면 좋겠다는 생각이 있기 때문이다. 필자 생각에는 메스프레소 기업이 수학 교육 플랫폼 시장 1위를 달리고 있다고 생각하기 때문에 해당 기업의 연구를 추적하고자 한다. 본 글은 21년 6월 23일 메스프레소 엔지니어인 Sean Park 님께서 콴다 블로그에 기록한 글을 기준으로 정리하였다.
비전
청소년 수학 플랫폼인 콴다의 비전은 ‘가장 효과적인 교육을 전 세계 모두에게’ 제공하는 것이다. 필자의 비전과 일치하기 때문에 상당히 관심이 가는 플랫폼이다. 메스프레소 또한 관심 있는 기업이다. 부디 이 비전을 잃지 않고 성장하는 기업이, 플랫폼이 되기를 바란다.
AI 연구
- 다양한 비전 모델들 ( Object detection / Text Recognition 분야 )
- 비전 모델이 콴다의 자랑이라고 생각한다. 이미지로부터 문제의 수식 정보 및 텍스트 정보를 추출해 내는 기술이 상당하다.
- 콴다 제품의 출발은 문제를 사진으로 찍으면 해당 문제를 본 학생들(주로 대학생)이 문제풀이를 제공해주는 형태였다. 이러한 과정을 자동화해주는 데 큰 역할을 한 모델이 비전 모델이다.
- 비전 모델은 사진으로부터 수식과 텍스트를 추출하여 해당 문제와 관련 있는 해답을 찾아 학생에게 제공해준다. 이러한 모델들의 사용으로 자동화가 가능했다고 한다.
- PLM for NLP ( RoBERTa / ELECTRA )
- 필자의 업무가 자연어 영역이기에 이 부분을 관심있게 봤다. 1번에서 추출한 수식과 텍스트를 이용하여 문제와 개념을 연결하고, 교육 콘텐츠를 연결했다고 한다.
- 현재 메스프레소는 6개의 나라에 서비스를 제공하고 있다고 한다.(더 추가됐을지도 모른다.) 각 언어별 모델을 만든 뒤, 문제의 유형 및 개념을 예측하여, 초기 단계의 문제와 개념간의 연결을 만들고 있다고 한다.
- 해당 모델은 few shot learning이 가능하다고 한다. 단원당 10~20개의 데이터만으로 해당 Task 에서 Top3 Accuracy 83.59 % 를 기록했다고 한다.
- 분류해야 하는 단원의 수는 1,795 개의 유형으로 매우 많다. 그런데도 80%가 넘는다는 건 데이터를 잘 만들었을 뿐만 아니라 성능 향상을 위한 모델 구조 연구를 많이 했다는 걸 의미한다. 와우..
- 필자가 가장 놀라운 부분은 데이터를 보유하고 관리하는 메스프레소의 능력이다. 양질의 데이터를 얻기 위해서는 전략적인 데이터 수집 과정이 꼭 필요하기에 어떤 Process로 데이터를 수집하는지 정말 궁금하다.
- (개인화)문제 추천 (협업 필터링 / Youtube )
- 콴다 제품은 과거에 비해 더욱 발전하여 학생 개개인에 맞는 문제를 추천해주는 기능이 추가되었다.
- 문제 추천 전략은 협업 필터링과 Youtube 알고리즘? 을 사용했다고 한다.
- Youtube 알고리즘?은 2016년에 발간된 Deep Neural Networks for YouTube Recommendations 논문이다.
- 문제 추천 전략으로 어떠한 로직을 적용했는지, 해당 로직에 사용된 알고리즘은 무엇인지, Cold start problem 문제는 어떻게 대처하였는지 궁금하다.
블로그 마지막 말: 교육기술에 적용되려면
기술은 교육을 더욱 효과적으로 바꿀 수 있습니다. 특히 최근 급격히 발전하고 있는 AI 기술을 활용한다면 그 가능성은 무궁무진할 것으로 기대하고 있습니다.
AI 기술을 활용하기 위해서는 무엇보다도 많은 양의 데이터를 확보하는 것이 중요합니다. 앞선 사례에서 언급 하였듯, 사전 학습된 언어모델을 만들기 위해서는 매우 많은 양의 데이터를 수집하는 것이 필요하며, 개인화된 추천을 고도화하기 위해서는 유저의 행동 데이터 및 학습과 관련된 데이터가 수집되어야합니다. 또한 AI 기술을 적용하고 발전시키기 위해서는 AI 엔지니어 뿐 아니라 파이프라인을 만들고, 데이터를 관리할 데이터 엔지니어 분과 모델을 효과적으로 적용하기 위한 백엔드 개발자 등 여러 분야의 전문가가 필요합니다.
콴다 팀은 콴다라는 교육 플랫폼을 통하여 교육 분야의 막대한 데이터를 생산하고, 관리하며 분석하고 있습니다. 데이터는 충분합니다. 콴다는 기술로서 더욱 효과적인 교육을 만들어가실 분들을 찾고 있습니다. 고민하지 마시고 우선 지원해주세요 !
끄적,,
Edutech 관련 국가과제를 수행해봤기에 안다. 학생이 문제를 푼 데이터 수집과 수학 문제와 풀이 데이터 수집이 얼마나 중요한지, 얼마나 얻기 힘든 데이터인지. 왜 얻기 힘든지, 수학이라는 과목에 AI를 적용하여 고품질 교육 플랫폼을 만드는 게 얼마나 어려운 task인지... 때문에 메스프레소 엔지니어인 Sean Park 님께서 작성하신 블로그 글을 보고 큰 감동을 받았다.
필자는 언젠간 메스프레소로 가고 싶다. 그곳에서 콴다의 비전과 함께하고 싶다. 현재 필자의 실력은 미비하기에 꾸준히 메스프레소가 가는 길을 모니터링하며 블로그에 정리하고자 한다. 또한 경쟁 제품인 아이스크림 에듀 제품도 분석하고자 한다. 지난 달인가? 아이스크림 에듀 제품인 아이스크림 홈런 제품의 일부 기능을 업스테이지에서 개발한다는 기사를 봤기 때문이다. 아이스크림 홈런 제품이 어떻게 변할지 기대된다.
필자는 이러한 경쟁 구도가 선순환이 된다고 생각한다. 어느 한 기업에, 제품에 소비자가 몰리면 이러한 선순환은 힘들다. Edutech 제품들의 발전을 모니터링하며 필자 또한 함께하는 순간을 그리며 본 포스팅을 마친다.
'Broad AI without NLP > Education' 카테고리의 다른 글
[Mathpresso] 회사 및 제품의 방향성 F/U (0) | 2022.11.09 |
---|---|
[이모저모] 플랫폼을 만들기 위해서는 무엇이 필요 할까? (0) | 2022.08.24 |
Knowledge Tracing datasets (0) | 2022.06.23 |
[SAINT+] Integrating Temporal Features for EdNet Correctness Prediction (0) | 2022.06.23 |
[SAINT] Towards an Appropriate Query, Key, and Value Computation for Knowledge Tracing (0) | 2022.06.23 |
댓글