82호[특집] AI 디지털교과서, 엇나간 혁신 | 위장된 혁신 | 진냥

2024-10-07
조회수 1176

[특집] AI 디지털교과서, 엇나간 혁신


위장된 혁신



진냥(희진)  

jinnyang3@gmail.com 

본지 편집위원, 경남 초등 교사




AI 디지털교과서와 관련한 글 중 많은 경우가 자신이 얼마나 평소에 디지털 기기에 친근한지를 구구절절 설명하는 것으로 시작한다. 아마 앞으로 할 이야기가 몰라서, 무지함에서 나온 막연한 지지 혹은 반대가 아니라는 것을 전하고 싶어서일 것이다. 다른 방식의 시작을 고민했으나 결국 이 글 역시 나를 입증(?)하는 것으로 시작할 수밖에 없을 것 같다. 사지는 게으르고 손가락만 부지런한 나는 교육부 소프트웨어(SW) 교육 선도 교원 경력이 있고 2023년에는 악명 높은 DNA(데이터, 네트워크, AI) 기반 창의 교육 연수도 들었다. 학생들과 인공지능 활용 스마트팜 수업이라든지 앱 개발 수업이라든지 하는 것도 해마다 ‘야매’지만 시도한다. 각종 디지털기기를 만져 보는 것을 재밌어하고 디지털 플랫폼도 중요한 흥밋거리 중 하나다. 일을 하거나 원고를 쓸 때 챗지피티(ChatGPT)를 켜 놓는 것도 일상이다. 하지만, 그럼에도 세계 최초로 AI 디지털교과서를 전면 도입하겠다는 정부에게 하고 싶은 말을 한마디로 압축하면 이렇다. 

“하지 마!” 

“그만 둬, 제발!” 



이유는 많다


2025년 3월부터 도입이라고 하는데 아직 개발이 끝나지 않아 아무도 아직 AI 디지털교과서를 확인하지 못했다. AI 디지털교과서 최종 선정이 11월 26일이라고 하니 학교에서 처음 보게 되는 것은 12월이다. 12월에 나온다면, 차라리 한 해 시범 적용해 보고 2026년에 도입하면 세상이 무너지기라도 하는 건가? 언제 교직원들이 활용을 익히고 교육과정 연구를 할 수 있을까. 세계 최초라서 앞선 사례도 없는데 말 그대로 너무 늦다. 아무리 좋은 정책이라도 시기가 맞지 않으면 사업 시기를 조정해야 한다. 

더구나 나라에 돈이 없다. “세수 펑크”라는 말도 부족해 언론에서 “세수 쇼크”라는 말을 쓰고 있다. 올해 세수가 30조 원 마이너스란다. 2년 연속, 즉 윤석열 정부 들어 지속적으로 세수가 대규모로 결손되어 나라에 돈이 없다. 아무리 갖고 싶은 물건이 있어도 통장에 돈이 없으면 사면 안 된다. 더구나 2025년 중앙 정부 예산에 AI 디지털교과서는 0원 책정되었다.❶ 즉 시·도교육청 예산으로 모두 감당해야 한다는 것이다. AI 디지털교과서의 예상 구독료는 권당 6만 원 정도이다. 학생 1명당 20만 원 내외, 전국적으로는 3조 정도의 재정이 추가로 투입되어야 할 것으로 추산되고 있다. 교육계에 시급히 돈이 필요한 곳이 어디 한두 군데이겠는가? 추석 때 시금치 가격이 한 단에 3만 원까지 치솟았다. 기후 위기로 채소 가격이 오르는 것은 학교 급식 예산의 추가 배정 요구로도 이어진다. 지금 예산으로 학교 급식 식단을 짤 수가 없다고 현장에서는 수년 전부터 아우성이다. 그뿐인가? 전국 시·도교육청 어디도 법으로 정해진 만큼의 특수 교사와 사서 교사를 배치한 곳은 없다. 모든 교사의 숫자가 법으로 정해져 있는 것은 아니지만, 특정한 이유가 더 있어서 일부 교사의 배치를 법으로 정한 것이다. 하지만 늘 예산 부족을 들어 우리나라 모든 지역이 법을 지키지 않고 있다. 예산 부족을 이유로 사라진 학생 지원 정책들도 많다. 정말 AI 디지털교과서가 이런 것들보다 더 우선적으로 필요한 건가? 

AI 디지털교과서가 정말 필요한지에 대한 갑론을박도 치열하다. 교육에 AI 도입이 필요한 것과 AI 디지털교과서가 필요한 것은 다르다. AI 도입의 필요성도 정돈되지 않았고 교육에서 AI를 어디서부터 어디까지 사용할지에 대한 것도 정해지지 않아 논의가 더 방만해지고 있다. 하지만 정부는 아랑곳하지 않고 있다. 심지어 선택권도 없다. 모든 교과서 회사들이 AI 디지털교과서를 만들어 내는 것은 아니고 ‘세계 최초’인 만큼 초등 수학의 경우 1차 선정을 통과한 AI 디지털교과서는 2개 회사뿐이었다. 교과서 선정 위원회는 학교마다 9월에 열렸고 아직 개발이 끝나지 않았기에 AI 디지털교과서를 고려해서 교과서를 고를 수는 없었다. 즉 대부분의 학교는 AI 디지털교과서 없이 종이책만 있는 교과서를 선택했다. 하지만 정부는 사용하는 종이책 교과서와 다르더라도 이후 AI 디지털교과서를 구입하라며 강요하고 있다. A사의 종이책 교과서를 사용하더라도 B사의 AI 디지털교과서를 구매해 사용하라는 것이다. 내용 구성이 전혀 다른 2종의 교과서를 따로 다루기엔 수업 시간이 턱없이 부족하다. 결국 사용 여부와 관련 없이 강매하는 것이다. 

교과서는 거의 대부분의 사회 구성원에게 영향을 끼치는 학교교육의 기본재다. 하지만 정치적 논의 과정은 거의 상실되었다. 국회에서도 지난 임기 말에 관련 법안 논의 때 며칠 다루어진 것이 전부다. 아무리 좋은 정책이라도 정책의 도입과 착근은 정치적 과정이며, 현재 AI 디지털교과서는 민주적으로 추진되고 있다고 보기 어렵기에 그 자체로 문제적이다. 



AI 디지털교과서의 빅데이터 수집과 축적


AI 디지털교과서 도입이 교육적 효과를 가져올 것이라고 이야기되는 가장 큰 이유는 학생 개개인에 대한 빅데이터 수집을 통해 맞춤형 교육을 지원할 수 있다는 것이다. 그래서 특히 수학과 같은 교과에서 학생의 학습 패턴을 분석하고 그에 맞는 교육 자료를 다르게 제공할 수 있다고 한다. 이를 통해 한 교실에 20명의 학생이 앉아 있다면 모두 다른, 20개의 교육과정을 운영하겠다는 주장이다. 하지만 결국 디지털 기기를 가지고 하는 학습지에 불과한 것이라는 반박도 거세다. 특히 먼저 도입이 추진되고 있는 교과가 수학과와 영어과, 정보과인데, 영어는 언어 활용 기회를 늘린다는 측면에서 그러니까 인공지능을 통해 서로 대화하는 연습을 할 수 있다는 장점이 있지만 수학은 학생이 문제를 풀다 틀리면 그 문제와 유사한 유형의 문제들을 제시하는, 그야말로 ‘문제 은행’에 불과하다는 비판이다. 적합성 테스트를 위해 지난 7월 공개된 시험판을 확인하고 이 비판은 더 거세어졌다. 

한편 이 논란을 보면서 궁금해진 것은 학생들을 대상으로 데이터 축적을 어떻게 하겠다는 걸까 하는 것이었다. 내가 모든 교사의 표본은 아니겠지만, 나는 학생들이 수학 문제를 잘 모르겠다고 하거나 반복해서 틀리는 경우 내 눈앞에서 문제를 처음부터 풀어 보라고 요청한다. 문제의 풀이 과정을 다 써 보라고 하는 것이 아니다. 언제 학생이 망설이는지, 어느 단계는 빠르게 넘어가는지를 관찰하고 또 언제 처음으로 실수나 오개념(誤槪念)이 나타나는지를 확인하기 위한 것이다. 대부분의 학생들은 어떤 내용을 알거나 모르거나 둘 중 하나가 아니라, 알거나 모르는 그 스펙트럼 어딘가에 존재하고 있고 자신이 어느 위치에 있는지 알지 못한다. 흔히 말하듯, 자신이 무엇을 모르는지는 알기 어렵다. 그래서 관찰과 진단이 필요하다. 학생의 문제 푸는 모습을 보며 이 학생의 머릿속에서 벌어지고 있는 일들을 추측하고 간혹 이 부분에서는 왜 이렇게 판단했는지 질문하기도 해야 진단할 수 있다. 그러니까 문제를 틀리거나 맞히는 것으로 학생을 진단할 수 없다는 것이다. 

이를테면, ‘54+98=’이라는 같은 문제를 틀리더라도 아예 덧셈에 대한 이해가 없는 경우는 한 자리 수 덧셈 혹은 수 세기부터 학습의 기회를 다시 제공하여야 할 것이지만 받아올림을 이해하지 못해 답을 찾지 못한 ‘학생 1’과 ‘일의 자리, 십의 자리, 백의 자리 등 십진법 개념이 명확히 자리 잡지 않은 ‘학생 2’에게는 이후에 제시해야 할 교육 활동이 완전히 다르다. 받아올림과 십진법 개념을 다 이해하고 있지만 수 감각이 너무 좁아 5 이하의 숫자들은 잘 계산해도 8, 9 등의 수가 등장하면 계속 실수하는 ‘학생 3’의 경우에는 큰 수를 다루는 경험을 늘려야 하는 식이다. 학생 3과 같은 경우는 데이터 수집을 통해 패턴이 파악될 수 있을 것 같은데 학생 1과 학생 2는 AI 디지털교과서를 통해서 어떻게 데이터를 수집할 수 있을까? 카메라를 이용해 학생의 눈동자와 연필 끝의 움직임을 정보화하는 것까지 기능으로 포함되어 있을까? 아마도 아닐 것이다. 결국 판단의 근거가 되는 데이터를 수집하기 위해 학생에게 더 많은 문제를 풀게 해서 판단하는 방법을 AI 디지털교과서는 채택할 것이다. 이 노동을 학생에게 요구하는 것은 효과적인가? 그리고 교육적으로 정당한가?

학생이 문제를 틀렸을 때만 데이터 축적을 위한 노동이 요구되는 것도 아니다. 한국의 교육과정은 모든 수업이 다 다른 내용으로 구성되어 있다. 그러니까 매시간 학생들에게는 새로운 과제가 주어지고 새롭게 도전할 개념이나 실천이 제시된다. 40~50분의 시간 동안 할 수 있는 시행착오의 횟수는 그리 많지 않다. 초등 수학의 경우, 1차시 수업에서 학생이 동일 유형의 문제를 푸는 횟수는 2~3번 정도다. 즉, 일반적인 수업에서 학생 개별 맞춤형 데이터를 획득하기 어렵다는 것이다. 이럴 경우 두 가지가 예상된다. 개인별 맞춤형 교육과정 운영이라는 것이 사기에 불과하거나 혹은 별도의 시험과 같은 과정을 거쳐 학생들이 인공지능을 학습시켜야 한다는 것이다. 생각해 보라. 얼굴 인식이나 지문 인식조차도 6~8번씩은 방향을 돌려 가며 조건에 따른 데이터를 학습시켜야 한다. 교육 활동 진행과 학생 성장에 대한 맞춤형 지원을 할 수 있을 정도의 데이터는 얼마만큼이나 학습이 필요할 것인가. 학생들은 이 데이터 축적 노동에 동의했는가? 데이터 활용에 대한 동의는 지금 AI 디지털교과서 도입의 대상인 초등학교 3, 4학년이 이해할 수 있는 내용과 방법으로 구해질 것인가. 

인공지능은 마법이 아니기에 유의미한 데이터가 저절로 축적되지 않는다. 빅데이터가 조명받기 시작했을 때부터 ‘데이터 눈 붙이기’ 노동이 이야기되었다. 과거 인형 눈알 붙이기 부업이 흔했던 것처럼, 인공지능이 학습하기 위한 데이터를 입력하는 아르바이트 일자리가 늘어나고 있어서다. 교육 활동에서 데이터 눈 붙이기 노동은 학생들과 교육 노동자들의 몫이 될 것이고 데이터 활용으로 인한 이윤 창출은 교육 활동이 아닌 다른 곳, 다른 이들이 취하게 될 것이다. 이미, 수능 데이터는 2025학년도 고사부터 모두 공개되어 기업들이 활용할 수 있게 되었고 그 과정에서 정보 주체인 수능 응시생들의 동의 과정은 없었다. 

축적의 불균형도 문제다. 빅데이터는 사람들의 편향에 따라 축적되기에 사람들의 관심이나 반응이 적은 영역은 데이터가 부족할 수밖에 없다. 이런 영역을 ‘희소 데이터’라고 말하는데, 희소 데이터 영역이 커질수록 빅데이터의 논리와 판단은 신뢰성이 낮아지게 된다. 그래서 최근 이 문제를 해결하기 위해 데이터와 데이터를 합성해 가상 데이터를 만들어 내서 인공지능을 학습시키는 방법이 시도되고 있다. 합성된 데이터는 합성을 거듭하면 질이 낮아지지만 – 실제와 크게 달라지지만 – 합성되고 나서 빅데이터 무리에 섞이고 나면 구별해 내기 어렵다. 즉 희소 데이터 영역에서 인공지능의 신뢰도가 낮아지는 문제는 여전히 해결되지 않고 있다. 그런데 어린이와 청소년에 대한 정보는 희소 데이터 영역이 넓은 편이다. 빅데이터가 스스로 잘 쌓이고 빅데이터를 기반으로 인공지능이 잘 판단할 것이라는 건 아직은 신화다. 



준비 없는 도입


AI를 전 학교에 도입하겠다면 지금 AI 활용과 관련되어 있는 각종 문제에 대한 대책들도 준비되어야 한다. 그런 준비 없이 그저 사용할 때 주의해서, 착하게 쓰라는 것은 문제의 책임을 사용자인 학생들에게 떠넘기는 것이고 동시에 피해를 양산하는 일이다. 인공지능을 활용한 불법 합성 성 착취물(일명 딥페이크)이 이토록 사회적으로 문제인 상황에서라면 말이다. 더구나 불법 합성 성 착취물에 쓰인 사진 소스가 상당수 학교에서, 졸업 앨범에서 얻어지고 있는 지금과 같은 상황에서라면 더더욱 대책이 필요하다. 

정말 AI 디지털교과서를 도입하겠다면, 인공지능의 학습 모델에 대한 관리 방안이 필요하다. 학습 과정에서 악의적인 학습 데이터를 입력시키는 중독 공격(Poisoning attack), 학습 알고리즘에 혼란을 주는 회피 공격(Evasion attack), 모델을 역설계하여 원 데이터를 탈취하는 추출 공격(Model extraction attack, Inversion attack) 등 이미 인공지능의 학습 모델을 공격하는 사례는 많아지고 있다. 나이스(NEIS) 보안 체계도 만드는 데 4년씩 걸리는데 수십만 명의 데이터를 수집하고 축적하는 새로운 체제인 AI 디지털교과서에 인공지능 보안 전략은 마련되어 있지 않다. 2016년 마이크로소프트사(MS)는 인공지능 채팅봇 테이(Tay)를 출시 16시간 만에 운영 중단했다. 일부 극우 성향의 사용자들이 테이에게 악의적인 발언을 하도록 훈련시켜, 테이가 욕설, 인종차별, 성차별, 자극적인 정치적 발언을 남발했기 때문이었다.❷ 이것은 인공지능의 기술력이 부족해서 벌어지는 일이 아니다. 인공지능이 잘 학습하고 잘 반응하기 때문에, 즉 잘 만들어진 AI이기 때문에 벌어지는 일이다. 다만 중독 공격에 대한 보안이 미비했던 것이다. AI 디지털교과서에도 챗봇이 탑재될 것이고 이 챗봇은 적대적 공격에 대응할 수 있을 것인가. 이런 우려에 대해 AI 디지털교과서에서 사용자들의 반응을 인공지능이 학습하지 않도록 할 것이라는 이야기도 있는데, 데이터 학습 기능을 차단할 것이라면 왜 AI를 사용하는 것인가? 결국 그냥 문제 은행 기능뿐이라는 고백인가. 

한편, 위에 언급한 데이터 공격 방법 중 회피 공격은 안전 전략으로도 활용된다. 이를테면 사진이나 영상에 사람의 눈으로는 판별할 수 없는 특정한 노이즈를 삽입하는 방식인데, 이를 통해 해당 사진이나 영상을 합성(딥페이크)에 이용하면 결과물이 이상하게 나오도록 하는 것이다. 이와 비슷한 종류의 ‘적대적 스티커’라는 기술도 개발되어 있다. 이 스티커는 사진이나 영상에 붙이면 바나나를 토스터 기기로 인식시킬 수 있을 정도다. 즉 이런 기술을 활용하면 사진과 영상을 불법 합성의 소스로 활용될 수 없게 처리할 수 있는 것이다. 최근의 학교 교육과정에는 글로 쓰는 활동만큼이나 사진이나 영상으로 결과물을 만들어 내는 활동이 많다는 점을 고려할 때, 회피 공격을 활용한 노이즈가 AI 디지털교과서에서 만들어지는 사진과 영상에는 자동으로 삽입되도록 하는 정도의 안전 장치는 마련되어야 한다. 이런 상황에서 불법 합성의 대책으로, 스마트폰 기본 카메라 앱에서도 삭제할 수 있는 워터마크 삽입이 이야기되는 것은 우습다.



위기를 저격해 해결할 수 있는 교육 문제는 없다


2020년대의 시작을 달구었던 말은 ‘4차 산업 혁명’이었다. 이제는 들어 본 지 한참 되어 까마득한 느낌마저 드는 말이지만 기억을 떠올려 보면, 코로나19 대유행기까지만 해도 온갖 시사 교양 프로그램들이 알파고와 이세돌의 바둑 대결을 언급하며 4차 산업 혁명이 도래했다고, 시급하게 준비해야 한다고 호들갑을 떨었다. 처음 보는 모습은 아니다. 1999년에 밀레니엄 버그 우려에서도 당장 세상이 망할 것 같은 두려움이 우리를 엄습했다. 지금의 AI 광풍도 앞서 언급한 4차 산업 혁명이나 시트콤 소재로 전락한 밀레니엄 버그와 다를까? 세상이 변하지 않았다는 이야기는 아니다. 분명 세상은 변화했다. 하지만 우리가 주목해야 할 공통점은 밀레니엄 버그도, 4차 산업 혁명도, 인공지능 관련 최근 이슈도 우리가 모르는 미래가 다가오고 시급히 대비하지 않으면 ‘끝장’날 것이라는 위기 담론에 지배당하고 있다는 것이다.

인공지능이 가져오는 사회 전반의 변화는 이미 오래전부터 인류가 예상해 왔다. 가장 먼저 떠오르는 것이 아무래도 영화나 소설이다. 영화 〈A.I.〉가 개봉한 것이 2001년, 인공지능으로 인한 전쟁을 다룬 〈터미네이터〉는 1984년 영화다. 두 영화 다 경고라는 말이 어울리는 정도로 인공지능의 위험성이나 우려점 들을 제기하였고, 2024년인 지금도 인공지능에 대해 걱정하고 두려워하는 부분들은 크게 달라지지 않았다. 인간들의 노동을 로봇이 대체하는 인공지능의 활용 방식도 유사하다. 심지어 1950년에 출판된 아이작 아시모프의 소설 〈I, Robot〉(그 유명한 ‘로봇 3원칙’이 처음 등장한 소설)에서도 인공지능으로 인한 사회적 위기들이 다루어지고 있다. 즉, AI로 인한 위기 담론은 새로운 것이 아니다.

다만 지금의 미래 위기 담론이 더 심각하게 다가오는 것은, 이 위기가 바로 코앞에 닥쳤고 그래서 정말 당장 우리 모두 떨쳐 일어나 이 위기에 집중해야 한다고 모든 사람들을 독려하고 있어서다. 광풍이라는 말이 어울릴 정도로 몰아붙여 대고 있기에, AI로 인해 우리의 일자리가 사라질 것이고 인간들이 위협받을 것이니 우리 모두 AI를 열심히 공부해야 한다는 동어 반복의 논리라는 점도 잘 부각되지 않는다. 특히 매우 빈번히 문제의 해결책으로 소환되곤 하는 교육은 여기서도 매우 중요하게 부각된다. 미래 사회를 대비하고 ‘미래의 먹거리’를 만들어 낼 수 있도록 인공지능 관련 산업을 육성하고 그를 발판 삼아 한국이 더 부유한 강국이 될 수 있는 기회를 마련하기 위해 인공지능을 다른 국가들보다 먼저, 선도적으로 발전시키고 교육해야 한다는 주장이다. 그래서, 전 세계 최초로 AI 디지털교과서를 전면적으로 도입하겠다는 것이다. 정부의 조급한 말들과 달리 AI 디지털교과서는 아직 만들어지지 않았다. 1차 선정 심사를 통과한 회사들 중 한 회사인 Y사는 선정 결과 발표 당일, 그 하루에만 주가가 22% 올랐다. 최종 선정이 되고 나면 얼마나 더 오를까. AI 디지털교과서가 기여하고 있는 것은 무엇인가. 

우리는 이미 알고 있다. 우리가 알 수 없기 때문에 미래이고, 그 알 수 없는 미래의 문제들을 콕콕 집어 저격하듯 우리가 대응할 수 있을 것이라는 생각은 판타지에 불과하다는 것을. 교육은 기네스 기록이 아니다. 세계 최초에 집착할 필요가 없다. 세계 최초라는 말과 위기 담론으로 포장된 사기극에 속지 않아야 한다.  



“시도에 전가한 AI 디지털교과서 구독료… 시도교육청 재정 어려움 커진다”, 〈교육플러스〉, 2024년 9월 12일. 

LG CNS 블로그, “머신러닝 보안 취약점! 적대적 공격의 4가지 유형”, 2020년 2월 13일.

www.lgcns.com/blog/cns-tech/ai-data/9616/


0

《오늘의 교육》에 실린 글 중 일부를 공개합니다.

《오늘의 교육》에 실린 글 중 이 게시판에 공개하지 않는 글들은 필자의 동의를 받아 발행일로부터 약 2개월 후 홈페이지 '오늘의 교육' 게시판을 통해 PDF 형태로 공개하고 있습니다.