돌아가기 AI 백과사전
토큰이란 무엇인가요? 왜 AI가 단락을 여러 개의 작은 조각으로 잘라내는 걸까요?

토큰이란 무엇인가요? 왜 AI가 단락을 여러 개의 작은 조각으로 잘라내는 걸까요?

AI 백과사전 Admin 56 회 조회

토큰은 모델이 텍스트를 처리할 때 "가장 작은 작업 단위"로 이해할 수 있습니다. 반드시 단어나 구두점이 아니라, 모델 자체가 잘라낸 조각과 같습니다. 영어에서는 단어가 여러 토큰으로 나뉘기도 하고, 중국어에서는 짧은 문장이 여러 토큰으로 나눌 수 있습니다.

이것은 추상적으로 보일 수 있지만, 가장 현실적인 세 가지에 직접적으로 영향을 미칩니다: 얼마나 많은 내용을 담을 수 있는지, 대화 비용이 얼마인지, 그리고 왜 모델이 때때로 긴 텍스트를 잘라내는지. 왜냐하면 모델은 '단락'으로 세상을 이해하는 대신, 토큰으로 입력과 출력을 계산하기 때문입니다.

왜 사용자들은 항상 이런 문제를 겪게 되는가

  • 긴 문서를 업로드할 때, 시스템은 길이 제한을 안내하는데, 이는 종종 토큰 부족 때문입니다.
  • 짧은 단락일 것 같지만, 실제 토큰은 이미 많을 거예요.
  • 일부 모델은 명확히 말하기 싫어서가 아니라 사용 가능한 토큰 예산이 바닥나가기 때문에 짧게 답합니다.

많은 사람들이 토큰을 처음 접했을 때 단순히 청구 단위로 착각합니다. 사실, 이것은 모델의 '언어 세분성'에 더 가깝습니다. 모델은 먼저 텍스트를 토큰으로 분해한 뒤, 인코딩하고 주의를 기울이며 생성하므로, 토큰은 문맥 창을 이해하는 전제 조건이기도 합니다. 중국 사용자에게는 구두점, 약어, 숫자, 코드 블록 때문에 토큰 수가 직관적으로 많아질 수 있습니다. 이로 인해 동일한 중국어와 영어 콘텐츠가 실제로 차지하는 토큰은 상당히 다를 수 있습니다.

가장 실용적인 판단

긴 텍스트 처리, 지식 기반, 프롬프트 디자인을 다루고 있다면, 단어 수에만 집중하지 말고 토큰을 보는 습관을 들이는 것이 가장 좋습니다. 특히 중국어와 영어를 섞을 때는 코드, 표, 그리고 많은 구두점, 단어 수, 토큰 수가 종종 같지 않습니다.

요약: 토큰은 모델이 텍스트를 실제로 처리하는 측정 단위이며, 이를 이해해야만 맥락, 비용, 길이 제한을 진정으로 이해할 수 있습니다.

추천 도구

더보기