안녕하세요, 구독자 여러분. 2주 휴식 후 청사🐍의 해에 돌아온 베스픽입니다. 새해 복 많이 받으세요📢 오늘은 새해 첫 베스픽인 만큼, 너나 할 것 없이 올해 가장 대세라고 말하는 그것, ‘AI 에이전트(AI Agent)’에 대해 이야기해보려고 합니다. AI 에이전트란 데이터를 기반으로 환경을 인식하고 목표를 달성하기 위해 스스로 판단하여 작업을 수행하는 자율적인 AI 시스템을 가리키는 말인데요. OTT나 비디오 플랫폼이 다음에 볼 콘텐츠를 추천하고, 스마트폰 비서가 알람을 맞추며, 자율주행차가 목적지를 찾아가는 이 모든 과정에 AI 에이전트가 숨어 있습니다! 오늘은 다양한 형태와 역할을 가진 AI 에이전트에 대해 알아보겠습니다.
AI 에이전트의 가장 기본적인 형태는 반응형 에이전트(Reactive Agent)입니다. 현재 상황에 즉각 반응하는 방식으로 작동하는데요. 체스 게임에서 상대의 수를 예측하는 등 단순한 조건에 따라 응답하는 챗봇이 대표적 사례입니다. 그 후 점차 기술이 발전하며 목적 지향 에이전트(Goal-based Agents)와 유틸리티 기반 에이전트(Utility-based Agent)가 등장했죠.
목적 지향 에이전트는 가장 빠른 길을 찾는 GPS 지도 앱처럼 명확한 목표를 설정하고 이를 달성하기 위해 계획을 세우고 실행합니다. 자동차가 스스로 목적지로 이동하는 자율주행 기술에도 이 원리가 적용되죠.
유틸리티 기반 에이전트는 효율성을 극대화하는 방향으로 행동을 선택하는데요. 온라인 쇼핑몰이 고객 맞춤형 제품을 추천하거나 플랫폼이 소비자의 취향에 맞는 콘텐츠를 보여주는 시스템이 이에 해당합니다. 음원 스트리밍 플랫폼 Spotify는 사용자의 청취 패턴을 분석하는 유틸리티 기반 에이전트를 통해 이용자에게 맞춤형 플레이리스트를 제공하죠.
학습 에이전트(Learning Agent)는 데이터를 통해 스스로 학습하며 경험을 통해 지속적으로 성능을 개선하는 에이전트를 의미합니다. 잘 알려진 사례로는 이세돌과 세기의 바둑 대결을 겨뤘던 알파고(AlphaGo)가 있습니다. 현재는 게임을 넘어, 의료 진단이나 금융 분석 등 다양한 산업에서 쓰이고 있죠.
또한 사람과의 소통에 특화된 상호작용형 에이전트(Interactive Agent)는 사용자와 대화를 나누고 요청을 처리하는 데 중점을 둡니다. 애플의 Siri나 아마존의 Alexa 같은 가상 비서나 사용자의 음성을 분석해 스마트 가전제품을 제어하는 Google Assistant가 상호작용형 에이전트의 대표적인 사례인데요. 단순히 정보를 제공하는 것을 넘어, 사용자와의 대화 속에서 맥락을 이해하고 문제를 해결합니다.
이처럼 AI 에이전트는 이미 우리의 일상과 친숙한 존재인데요. 이외에도 정말 다양한 AI 에이전트가 있습니다. AI 에이전트를 구분하는 기준을 정리하면 아래와 같습니다.
작동 방식 – 어떻게 작동하느냐
목적 – 무엇을 하느냐
기술 구현 방식 – 설계와 기술적 구조가 어떻게 되어 있느냐
1. 작동 방식
‘작동 방식’을 기준으로 한 AI 에이전트는 크게 규칙 기반(Rule-Based)과 데이터 기반(Data-Based), 지식 기반(Knowledge-Based) 등이 있습니다. 규칙 기반 AI 에이전트는 말 그대로 정해진 규칙에 따라 작동합니다. “이런 상황에서는 이렇게 반응한다”는 고정된 구조로 설계되었죠. 특정 키워드를 감지해 준비된 답변을 제공하는 초기 챗봇이나 버튼에 따라 설정대로 응답하는 자동 전화 응답 시스템이 이런 고정된 행동 규칙에 따라 움직이는 대표적인 예입니다. 반면에 데이터 기반 AI 에이전트는 훨씬 유연합니다. 데이터를 학습하고 분석해 스스로 결정을 내리며, 상황에 따라 행동을 바꿀 수 있죠. 머신 러닝이나 딥 러닝을 기반으로 한 경우가 많습니다. 넷플릭스, PayPal, 구글 딥마인드, 월마트, 테슬라 등 웬만한 AI 에이전트는 전부 데이터 기반 AI 에이전트라고 해도 과언이 아닙니다. 지식 기반 AI 에이전트는 데이터 기반과 달리 기존 데이터를 학습하는 것이 아니라, 각 도메인의 지식을 체계적으로 정리한 데이터베이스와 논리적 추론을 활용해 작동합니다. 규칙 기반보다 복잡한 문제를 해결할 수 있으며, 명확하게 정의된 지식을 통한 결과를 제공합니다. 학술 연구 플랫폼인 시맨틱 스칼라의 AI 에이전트(Semantic Scholar AI Agent)는 의학학술정보분류체계인 메쉬(MeSH) 키워드를 통해, 보다 쉽게 논문을 이해하고 활용할 수 있도록 지원하고 있습니다.
2. 목적
AI 에이전트는 ‘목적’에 따라 분류할 수도 있습니다. 정보 처리형 AI 에이전트(Information Processing AI Agent)는 데이터를 검색하고 정리하며, 필요한 정보를 사용자에게 제공하는 데 초점을 맞춥니다. 우리가 매일 사용하는 포탈의 검색 엔진이나 뉴스 추천 시스템이 바로 이런 유형이죠. 의사결정형 AI 에이전트(Decision-Making AI Agent)는 자율주행차나 투자 분석 AI처럼 여러 선택지 중에서 최적의 결정을 내려야 하는 경우에 사용됩니다. 예측 및 분석형 AI 에이전트(Predictive and Analytical AI Agent)는 과거 데이터를 기반으로 미래를 예측하거나 트렌드를 분석합니다. NASA는 기후 변화 데이터를 분석해 미래의 지구 온난화와 그 영향을 예측하는 AI 에이전트를 활용하고 있다고 하죠.
3. 기술 구현 방식
마지막으로 ‘기술 구현 방식’에서도 AI 에이전트는 다양하게 나뉩니다. 멀티모델 AI 에이전트(Multi-Model AI Agent)는 여러 AI 모델을 조합해 복잡한 작업을 수행하는 시스템입니다. 멀티모델 에이전트를 사용하면 음성 인식 모델이 사용자의 요청을 텍스트로 변환, 자연어 처리 모델이 이를 분석하고, 시각화 모델이 분석 결과를 그래프로 표현할 수 있게 되는 거죠. 복잡한 작업에 매우 유용합니다. 반대로 하나의 AI 모델에 기반하는 단일 모델 기반 AI 에이전트(Single-Model AI Agent)도 있고요. 이름이 비슷한 멀티모달 AI 에이전트(Multi-Modal AI Agent)는 텍스트, 이미지, 음성 등 여러 종류의 데이터를 동시에 처리할 수 있는 능력을 갖추고 있습니다. GPT-4처럼 텍스트와 이미지를 함께 이해할 수 있는 AI가 대표적입니다. 멀티모‘델’ AI 에이전트는 여러 모델이 협력해 복잡한 작업을 처리하는 ‘기술적 구성’에 중점을 두고, 멀티모‘달’ AI 에이전트는 처리하는 ‘데이터의 유형’을 중시한다고 생각하시면 이해가 빠를 것 같네요. 베스핀글로벌은 세계 최초 교사 주도형 생성형 AI인 울산교육청의 ‘우리 아이(AI) 서비스’에는 멀티모델 AI 에이전트를, 세계 최초 원전 특화형 생성형 AI 서비스를 구축하는 한국수력원자력의 경우에는 단일 모델 기반 AI 에이전트를 토대로 수행하고 있습니다. 모두 베스핀글로벌의 LLM 기반 AI 에이전트 플랫폼 ‘헬프나우 AI(HelpNow AI)’를 활용했답니다.
오늘은 다양한 AI 에이전트의 분류에 대해 말씀드렸는데요. AI 에이전트 도입의 실패 확률을 낮추기 위해선 어떤 역할과 기능이 필요한지 여러 각도에서 분석해야 합니다. 앞서 소개드린 분류 방법을 참고해서 내가 속한 영역과 산업군에 가장 적합한 AI 에이전트가 무엇인지 꼼꼼히 살펴보시는 것은 어떨까요? 오늘의 베스픽은 이렇게 마무리하도록 하겠습니다. 모두 평안하고 건강한 한 해 보내시기를 소망합니다. 다음에 뵐게요.
⛅ 안쓰면 클나우
AI 시대 대응 전략 가이드가 필요하신가요? 2025년 AI 인사이트를 단 한편의 영상으로 해결할 수 있습니다! 생성형 AI의 활용 사례들과 AI 도입 준비 사항 그리고 AI 시대에 성공하려면 어떤 직업을 가져야 하는지까지 흥미롭게 전달드립니다.
<제가 만든 GPT는 당신이 만든 GPT와 전혀 다릅니다>의 저자이자, 라이즈모먼트 AI를 운영하시는 유호석 대표님과 함께 AI 여정의 필수 노하우를 알아보시면 어떨까요?