C7

글 대화 AI 챗봇 다음 말 맞히기

수업 교안(슬라이드) 열기새 창

핵심 비유

스마트폰 자동완성 비유: 카카오톡에서 '오늘 날씨가'를 치면 키보드가 '좋네', '너무 덥다', '흐려'를 추천하는 것처럼, 챗봇 AI도 지금까지 나온 단어들을 보고 '다음에 올 확률이 가장 높은 단어'를 하나 고른다. 그 과정을 수백 번 반복하면 한 문단의 답변이 완성된다. 차이는 하나뿐이다 — AI는 인터넷 전체만큼 방대한 글을 읽고 학습했기 때문에 추천이 훨씬 정교하다.

핵심 포인트

  • 챗봇 AI는 '다음 단어 맞히기'를 수백억 번 반복해서 학습한 프로그램이다. 문장을 완성하는 방향을 확률로 계산해 가장 그럴듯한 단어를 하나씩 고른다.
  • AI가 처리하는 글자 단위는 '토큰'이다. '안녕하세요'는 한 단어지만 AI에게는 여러 조각(토큰)으로 나뉠 수 있다. 컴퓨터는 이 토큰을 숫자로 바꿔서 계산한다.
  • AI는 답을 '알고 있어서' 말하는 게 아니라 '다음에 올 확률이 가장 높은 토큰'을 계속 골라낸 결과를 출력한다. 그래서 같은 질문에 매번 조금씩 다른 답이 나올 수 있다.
  • 스마트폰 키보드의 자동완성 기능과 작동 원리가 같다. 다만 챗봇은 훨씬 더 많은 글을 학습해서 훨씬 긴 문장을 자연스럽게 이어갈 수 있다.
  • AI가 그럴듯한 오답을 자신 있게 내놓는 이유도 같은 원리다. 가장 '자연스러운' 다음 토큰을 고를 뿐이므로, 사실과 다르더라도 문장이 매끄럽게 이어지면 그 단어를 선택할 수 있다.

관련 개념

교사 팁

수업 도입 활동으로 '릴레이 문장 완성 게임'을 활용하라. 칠판에 '오늘 점심에 나는'을 적고 학생들에게 다음 단어를 돌아가며 하나씩 말하게 한다(3~5명). 그런 다음 같은 시작 문장을 ChatGPT에 입력하고 AI 답변과 비교한다. "사람마다 다른 단어를 골랐는데, AI는 어떤 기준으로 단어를 골랐을까?" 질문으로 확률과 학습 데이터 개념을 자연스럽게 끌어낼 수 있다. Hugging Face 인터랙티브 데모(영어)를 프로젝터에 띄워 확률 분포 막대그래프를 직접 보여주면 추상적인 '확률'이 시각적으로 구체화된다.

참고 자료

  • LLM 모델의 작동 원리 이해하기 — 브런치ko / article

    LLM이 '다음 단어를 예측하는 자동완성 기계'임을 핵심 비유로 설명하는 한국어 글. 토큰화 → 임베딩 → 다음 토큰 예측 → 문장 완성까지 4단계를 순서대로 다루며, 축구선수 능력치 비유로 벡터 개념을 소개. 교사가 수업 자료로 발췌·각색하기 좋은 구조.

  • LLM(대규모 언어모델)의 작동 원리와 구조 총정리 — Swart Techko / article

    한국어로 LLM 구조를 8개 섹션으로 총정리. '고양이가 소파에 ___' 빈칸 예시를 사용해 다음 단어 확률 계산을 구체적으로 설명. 자동완성 비유와 확률 선택 과정이 중학생 수업 도입부 활동에 직결.

  • But what is a GPT? Visual intro to transformers — 3Blue1Brown (YouTube)en / video

    수학 교육 채널 3Blue1Brown의 27분 애니메이션 영상. 토큰화 → 단어 임베딩 → 다음 토큰 확률 예측 → 문장 생성 전 과정을 시각적으로 설명. 언어 이해 없이도 그림만으로 핵심 흐름을 파악 가능해 영어 자료 중 중학생에게 가장 적합.

  • Next Token Prediction with GPT — Hugging Face (인터랙티브 데모)en / interactive

    GPT-2 모델이 'One, two,' 다음에 ' three'를 39.71% 확률로 예측하는 실제 데모 링크를 포함한 Hugging Face 블로그 글. 학생이 직접 문장을 입력하고 다음 토큰의 확률 분포를 확인하는 인터랙티브 실험이 가능해 '수업 중 체험 활동'으로 활용하기 좋음.