이 장의 목표

같은 질문에 다른 컨텍스트를 던져 답이 어떻게 달라지는지 직접 봅니다. 사내 문서 5건이 미리 적재돼 있고, 질문을 던지면 TF-IDF + 코사인 유사도로 관련 문서를 검색합니다 (실제 시스템은 신경망 임베딩 사용).

상태 확인 중

사내 문서 5건 (미리 적재됨)

실습 1 — 질문을 던지고 RAG 결과 보기

실습 2 — 같은 질문 × 컨텍스트 3종

위에서 검색된 RAG 결과를 가지고, 컨텍스트의 을 더해 가며 같은 질문을 모델에 던집니다. 토큰 사용량과 답변의 결이 어떻게 달라지는지 비교하세요.

A — 시스템 프롬프트만

토큰 추정0
결과가 여기 표시됩니다.

B — A + RAG 2건

토큰 추정0
결과가 여기 표시됩니다.

C — B + 메모리 + 도구

토큰 추정0
결과가 여기 표시됩니다.
관찰 포인트 — A는 일반론이 됩니다. B는 우리 회사 자료에 근거합니다. C는 사용자(김지영 차장)에 맞춰 좁혀집니다. 같은 질문에 컨텍스트의 층이 더해질수록 답이 어떻게 좁아지는지 보세요.

실습 3 — Lost in the Middle (정렬 효과)

같은 RAG 결과 5건의 순서만 바꿨을 때 답이 달라지는지 확인합니다. 6장에서 본 Liu 2023의 발견 — 모델은 중간에 묻힌 정보를 놓친다 — 의 실증.

관련도 내림차순 (권장)

결과가 여기 표시됩니다.

관련도 오름차순

결과가 여기 표시됩니다.

무작위 순서

결과가 여기 표시됩니다.
실증 포인트 — 같은 정보, 다른 순서, 다른 결과. 세 답변을 비교해 *구조가 양보다 강하다*를 직접 봅니다.