B5
대화하는 AI 시대 트랜스포머 GPT ChatGPT 2017~현재
수업 교안(슬라이드) 열기새 창핵심 비유
트랜스포머의 '어텐션'을 독서실 공부 모둠으로 비유할 수 있다. 예전 AI는 책을 처음부터 한 줄씩 읽는 학생처럼, 앞에서 읽은 내용을 잊어버리며 뒤로 나아갔다. 트랜스포머는 마치 모둠 전원이 책의 모든 페이지를 동시에 펼쳐 놓고 "이 단어는 저 단어랑 관계있어!"라고 서로 손가락으로 가리키며 중요한 연결을 찾는 것과 같다. "나는 사과를 먹었다"에서 '먹었다'가 '나'와 '사과' 모두에 동시에 주목(어텐션)할 수 있어, 문장 전체 의미를 한번에 파악한다.
핵심 포인트
- 2017년 구글 연구자 8명이 '어텐션이 전부다(Attention Is All You Need)' 논문을 발표하며 트랜스포머 구조를 세상에 내놓았다. GPT의 T가 바로 이 Transformer(트랜스포머)의 약자다.
- 트랜스포머의 핵심 아이디어는 '어텐션(Attention)' — 문장 속 모든 단어가 서로 얼마나 관련 있는지 동시에 살펴보는 방식이다. 예전 AI는 단어를 한 개씩 순서대로 읽었지만, 트랜스포머는 문장 전체를 한눈에 보며 중요한 관계를 잡아낸다.
- OpenAI는 2018년 GPT-1(파라미터 1.2억 개)을 시작으로 GPT-2(1.5억), GPT-3(1,750억)을 차례로 발표했다. 파라미터 수는 AI의 '기억력·사고력 단위' — 숫자가 클수록 더 복잡한 문장과 맥락을 이해한다.
- 2022년 11월 30일 조용히 공개된 ChatGPT는 5일 만에 100만 명, 두 달 만에 월 1억 명을 돌파했다. 마케팅 없이 이런 속도를 기록한 서비스는 역사상 없었다.
- ChatGPT는 단순히 다음 단어를 예측하는 것에서 멈추지 않고, 사람이 직접 답변의 좋고 나쁨을 평가해 AI를 다시 훈련시키는 RLHF(인간 피드백 강화학습) 방식으로 '대화에 친절한 AI'가 됐다. 기술은 새것이 아니었지만, 사람 피드백을 더한 것이 핵심이었다.
관련 개념
교사 팁
수업 도입에서 학생들에게 "ChatGPT의 C, h, a, t, G, P, T — 각 글자가 무슨 뜻인지 아는 사람?"을 질문으로 시작하면 효과적이다. Chat(대화) + G(생성형, Generative) + P(사전학습, Pre-trained) + T(트랜스포머, Transformer) 풀이를 함께 하면, 수업 전체 키워드(생성·학습·구조)가 제목 한 줄에 담겨 있다는 사실이 자연스럽게 드러난다. 이후 "2022년 11월 30일부터 두 달 만에 월 1억 명" 숫자 카드를 보여주며 '왜 갑자기?'라는 질문을 던지면, 트랜스포머→GPT→RLHF 흐름을 탐구하는 동기가 자연스럽게 생긴다.
참고 자료
- ChatGPT의 개발 과정과 배경 — 트랜스포머부터 ChatGPT까지 타임라인ko / article
2017년 트랜스포머 등장부터 GPT-1/2/3, ChatGPT 출시(2022)까지 연도별 타임라인을 한국어로 정리한 블로그 글. 파라미터 수 변화(1.2억 → 1.5억 → 1,750억)와 제로샷/퓨샷 학습 개념 포함. 역사 흐름 도입 수업에 적합.
- ChatGPT의 핵심 기술 — 트랜스포머(Transformer) 쉬운 설명ko / article
셀프 어텐션 메커니즘의 3단계(위치 정보 부여 → 단어 관계 분석 → 다음 단어 예측)를 한국어로 설명한 글. 위치표 비유, 8개 관점 병렬 분석 등 중학생이 이해할 수 있는 서술 포함. 트랜스포머 원리 수업 본론에 활용 가능.
- ChatGPT 원리 — 학습 3단계(RLHF) 쉬운 설명 (SK DevOcean)ko / article
ChatGPT가 '다음 단어 예측' 게임으로 학습하는 과정을 3단계(기초학습 → 사람이 답변 순위 매기기 → 세부 조정)로 설명. 인터넷 텍스트 735GB 학습, GPU 수천 개 사용 등 구체적 수치 포함. RLHF(인간 피드백 강화학습) 개념을 중학생 눈높이로 풀어낸 한국어 자료.
- Transformers, explained: Understand the model behind ChatGPT (YouTube — Dale Markowitz / Google)en / video
Google 연구자가 트랜스포머 구조를 시각적으로 풀어낸 18분 분량 영상. 어텐션 메커니즘이 문장 속 단어 관계를 어떻게 파악하는지 애니메이션으로 설명. 영어 자막 제공. 교사가 수업 전 개념 이해용으로 시청하거나 고급 학생에게 추천 가능.
- Attention Is All You Need — Wikipedia (영문 위키백과)en / wiki
2017년 구글 연구자 8명이 발표한 논문의 역사적 의의를 정리한 위키 문서. 2025년 현재 17만 3천 회 이상 인용, 21세기 가장 많이 인용된 논문 Top 10 진입. ChatGPT 등장까지의 인과 관계(트랜스포머 → BERT → GPT → ChatGPT)를 시간순으로 확인하기 좋은 레퍼런스.