BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT
최신 리포트 다운로드 지금 바로 문의하기
BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT
최신 리포트 다운로드 지금 바로 문의하기
BESPIN Tech Blog
BESPIN Tech Blog
  • Tech
    • CSP
      • AWS
      • GCP
      • NCP
    • Cloud
      • Migration
      • LZ, Control Tower
      • Backup
      • Monitoring
      • Container
    • Infra
      • OS
      • Middleware
    • Data
      • RDB
      • Big Data Platform
    • Application
      • CI/CD
  • Trend
  • IT
  • Contact US
AI

AI 이것만은 알고가자 5편 : LLM을 똑똑하게 Text Splitters & Embedding

by 민우 서 2025년 04월 25일
2025년 04월 25일
16

안녕하세요 오늘은 BESPIN GLOBAL AX실 양재현님이 작성해주 AI 이것만은 알고가자 5편 : LLM을 똑똑하게 Text Splitters & Embedding’ 대해 소개해드리도록 하겠습니다.

4편에서는  RAG의 주요 구성 요소 중 하나인 Document Loader에 대해 알아보았는데요, 이번 편에서는 Text Splitters를 알아보도록 하겠습니다.

목차

  1. Text Splitters
  2. Text Embeddings

1. Text Splitters

문서에서 데이터를 읽고나서 문서도 사이즈가 큰 문서가 있다 보니 컴퓨터에서도 이를 효율적으로 검색하고 정리하는 과정이 필요할 겁니다. 이 작업을 보통 임베딩 과정이라고 합니다.

이 임베딩 과정을 하기 전에 문서에 있는 내용을 Text Splitters 그대로  한국말로 해석하면 텍스트를 나누는 작업을 Text Splitters 라고 합니다. 이렇게 텍스트를 나누는 이유(인공지능에서는 Chunk 작업이라고 합니다)는 나중에 텍스트를 효율적으로 검색하기 위해서입니다.

텍스트를 나누는 이유(인공지능에서는 Chunk 작업이라고 합니다)는 나중에 텍스트를 효율적으로 검색하기 위해서 이렇게 잘개 쪼개는 작업을 합니다.

쪼개는 단위는 Chunk Size 라고 이야기 합니다.  해당 사이트에서 테스트도 해볼 수 있습니다. (https://chunkviz.up.railway.app/)

쪼개는 단위는 또한 Chunk Size 라고 이야기 합니다.  해당 사이트에서 테스트도 해볼수 있습니다

2. Text Embeddings

왜 텍스트를 쪼개야하는 지에 대해 설명드리자면, 너무 많은 텍스트를 한번에 담아 놓게 되면 나중에 지식기반에서 자료를 찾을때 검색 속도가 현저하게 떨어 지기 때문입니다. 그리고 이 텍스트 Chunk 한 내용을 바탕으로 임베딩 벡터를 만들게 됩니다. 이 작업을 Text Embeddings(텍스트 임베딩) 작업이라고 합니다. 이 단계에서는 텍스트를 숫자로 변환하여서 문장 간의 유사성을 비교할수 있도록 합니다. 

이 임베딩 모델 과정에서 사용하는 유료 임베딩 모델은 aws bedrock 같은 경우는 titan-embed-text-v1을 사용하며 허깅페이스같은 무료 임베딩 모델에서는 ko-Sentence-BERT (한국어 문장 임베딩 위해 개발된 모델 ) 을 사용합니다. 따라서 이 임베딩 모델을 고르는것도 RAG 를 구성할때 가장 중요한 부분 입니다.

이렇게 임베딩 모델을 사용하여 벡터 저장소 ( aws opensearch – 유료 ) , Milvus , FAISS  – 무료를 사용합니다.

이렇게 임베딩 모델을 사용하여 벡터 저장소


이렇게 벡터 저장소에 저장되며 이 벡터 저장소에서 조회 할때는 prompt에서의 질문이 벡터화 되어 유사도 측정을 통해( cosine similarity ) 적절한 답변을 찾게 됩니다. 이렇게 임베딩되어 벡터에 저장을 잘해야 좋은 성능을 낼 수 있습니다. 하지만 이 방법도 단점이 있기에 임베딩 모델은 의미적 관계를 포착하는 데 뛰어나지만, 중요한 정확한 일치 항목을 놓칠 수 있습니다. 

이러한 한계점을  극복하고자 도움되는 기술이 있는데 BM25(Best Matching 25) 어휘적 일치를 사용하여 정확한 단어나 구문 일치 항목을 찾는 순위 함수를 사용하여 어느정도 해결할 수 있습니다. 이건 RAG 응용편으로 마지막 시간에 배우도록 하겠습니다.

지금까지의 내용을 정리하면 아래와 같습니다.

  1. 일반적으로 수백 개의 토큰을 넘지 않는 작은 텍스트 청크로 나눕니다.
  2. 임베딩 모델을 사용하여 이러한 청크를 의미를 인코딩하는 벡터 임베딩으로 변환합니다.
  3. 의미적 유사성에 따른 검색을 가능하게 하는 벡터 데이터베이스에 이러한 임베딩을 저장합니다.
  4. 런타임 시 사용자가 모델에 쿼리를 입력하면 벡터 데이터베이스가 쿼리와의 의미적 유사성에 따라가장 관련성 있는 청크를 찾는 데 사용됩니다. 
  5. 그런 다음 가장 관련성 있는 청크가 생성 모델에 전송된 프롬프트에 추가됩니다. 

여기까지 ‘AI 이것만은 알고가자 5편 : LLM을 똑똑하게 Text Splitters & Embedding’에 대해 소개해드렸습니다. 다음 시간에는 Vector Stores 에 대해서 자세히 알아 보도록 하겠습니다. 유익한 정보가 되셨길 바랍니다. 감사합니다. 

Written by 양 재현/ AX실

BESPIN GLOBAL

LLMText Splitters & EmbeddingTextSplitters[ AI 이것만은 알고가자 ]5편-LLM을 똑똑하게 Text Splitters & Embedding

HOT Trend

Recent Posts

  • 딜로이트도, 맥킨지도, 베스핀글로벌도: AI 에이전트로 일 바꾸는 시대

    2025년 07월 04일 클라우드베스핀글로벌clouddata데이터AI인공지능HelpNow AIbespinglobalAI에이전트helpnow업무자동화딜로이트
  • ⚔️데이터센터에서 시작된 전쟁? 요즘 뜨는 AIDC 개념부터 트렌드까지!

    2025년 06월 27일 클라우드clouddata데이터AI데이터센터클라우드 데이터센터bespinglobalAIDCAI 인프라베스핀글로벌
  • 구글부터 엔비디아까지, 빅테크 기업들의 AI 전략 최신본📖

    2025년 06월 20일 cloud베스핀글로벌클라우드data데이터AI구글마이크로소프트엔비디아AI에이전트google I/ONVIDIA GTC 2025Microsoft build 2025
  • AI를 연결한다고? 업계가 주목하는 ‘MCP’ 알아보기🔍

    2025년 06월 13일 베스핀글로벌클라우드cloudAIMCP
  • [WhaTap] RDS Failover/Reboot 관제 2 – RDS Failover

    2025년 05월 30일 RDSRDS FailoverRebootFailoverbespin global

베스핀글로벌은 모든 기업의 AI 혁신을 실현하기 위해, 세상에서 가장 혁신적이고 자동화된 AI 서비스와 솔루션을 만들어갑니다.
상호 : 베스핀글로벌 주식회사 ㅣ 대표자명 : 김써니, 허양호 ㅣ 사업자등록증번호 : 638-87-00223 ㅣ 통신판매번호 : 2019-서울서초-0347 ㅣ 대표전화 : 1668-1280
사업장주소지 : 서울특별시 서초구 강남대로 327, 13,14,15,16층(서초동,대륭서초타워) ㅣ 이메일 : info@bespinglobal.com ㅣ 개인정보 처리방침 ㅣ 개인정보 처리방침 안내

© 2026 BESPIN GLOBAL, All Rights Reserved.

BESPINGLOBAL
패밀리 사이트
China MEA SEA US

BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT