BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT
최신 리포트 다운로드 지금 바로 문의하기
BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT
최신 리포트 다운로드 지금 바로 문의하기
BESPIN Tech Blog
BESPIN Tech Blog
  • Tech
    • CSP
      • AWS
      • GCP
      • NCP
    • Cloud
      • Migration
      • LZ, Control Tower
      • Backup
      • Monitoring
      • Container
    • Infra
      • OS
      • Middleware
    • Data
      • RDB
      • Big Data Platform
    • Application
      • CI/CD
  • Trend
  • IT
  • Contact US
TECHCSPAWS

[2022 AWS re:Invent] Introducing AWS Inferentia2-based Amazon EC2 Inf2 instances

by 미선 정 2023년 09월 26일
2023년 09월 26일
2
세션 유형

Break out

세션명

Introducing AWS Inferentia2-based Amazon EC2 Inf2 instances

강연자

Ben Perak, Tatiana Cooke

세션요약자

조영욱(Youngwook Cho)

핵심내용 요약
  • AWS 에서 설계한 세 번째 DL (Deep Learning)
  • Inf1 Typoe 대비 최대 4배 높은 처리량 및 10배 낮은 지연시간
  • 저렴한 비용
키워드
  1. DL
  2. 자연어 처리
상세내용

EC2 Inf2 Instance Type 대한 상세 세션

EC2 Inf2

  • Inf2 인스턴스는 AWS에서 설계한 세 번째 DL(deep learning) 가속기인 Instance 이며, 최대 12개의 AWS Inferentia2로 구동
  • Inf1 타입 대비 최대 4배 높은 처리량 및 10배 낮은 지연 시간과 10TB의 집계 메모리 대역폭을 제공하며, 가장 큰 인스턴스 크기인 Inf2.48xlarge 에서 175B의 파라미터 모델이 배포가 가능

Inf2 성능 비교

  • 자연어 처리 애플리케이션에 사용되는 RoBERTa 를 기반으로한 벤치마크
  • G5 타입 대비 처리량은 2.6배 지연 시간은 8.1배 개선


EC2 Inf2 에너지 효율

  • GPU 인스턴스에 최적화된 G5 인스턴스보다 와트 당 최대 50% 절감.

Inf2 분산 밴치마크

  • OPT 30B 기준 Inf2는 초당 573개의 토큰 전달 / G5는 초당 181개의 토큰을 전달로 3배 넘는 처리량의 차이
  • OPT 66B기준 G5는 OOM 발생 / Inf2는 여전히 높은 성능을 제공
    사유는 가장 낮은 비용으로 높은 성능과 짧은 지연 시간 출력을 제공하도록 설계

사용 사례

  • Amazon Search 에서 Inf2 vs G5 비교 시 약 2배 빠른 성능을 보임
Bespin’s Comment
  1. AI/ML 관심이 많은 요즘 저비용 고성능 Instance Type 각광 받는 것 같습니다.
  2. 아직은 Preview 단계로 us-east-1, us-east2 Region 에서만 서비스가 되며, GA 되면 Inf1 Type 사용 고객사들에게 좋은 대안이 되는 서비스 일 것 같습니다.

관련

HOT Trend

Recent Posts

  • 딜로이트도, 맥킨지도, 베스핀글로벌도: AI 에이전트로 일 바꾸는 시대

    2025년 07월 04일 클라우드베스핀글로벌clouddata데이터AI인공지능HelpNow AIbespinglobalAI에이전트helpnow업무자동화딜로이트
  • ⚔️데이터센터에서 시작된 전쟁? 요즘 뜨는 AIDC 개념부터 트렌드까지!

    2025년 06월 27일 클라우드clouddata데이터AI데이터센터클라우드 데이터센터bespinglobalAIDCAI 인프라베스핀글로벌
  • 구글부터 엔비디아까지, 빅테크 기업들의 AI 전략 최신본📖

    2025년 06월 20일 cloud베스핀글로벌클라우드data데이터AI구글마이크로소프트엔비디아AI에이전트google I/ONVIDIA GTC 2025Microsoft build 2025
  • AI를 연결한다고? 업계가 주목하는 ‘MCP’ 알아보기🔍

    2025년 06월 13일 베스핀글로벌클라우드cloudAIMCP
  • [WhaTap] RDS Failover/Reboot 관제 2 – RDS Failover

    2025년 05월 30일 RDSRDS FailoverRebootFailoverbespin global

베스핀글로벌은 모든 기업의 AI 혁신을 실현하기 위해, 세상에서 가장 혁신적이고 자동화된 AI 서비스와 솔루션을 만들어갑니다.
상호 : 베스핀글로벌 주식회사 ㅣ 대표자명 : 김써니, 허양호 ㅣ 사업자등록증번호 : 638-87-00223 ㅣ 통신판매번호 : 2019-서울서초-0347 ㅣ 대표전화 : 1668-1280
사업장주소지 : 서울특별시 서초구 강남대로 327, 13,14,15,16층(서초동,대륭서초타워) ㅣ 이메일 : info@bespinglobal.com ㅣ 개인정보 처리방침 ㅣ 개인정보 처리방침 안내

© 2026 BESPIN GLOBAL, All Rights Reserved.

BESPINGLOBAL
패밀리 사이트
China MEA SEA US

BESPIN Tech Blog
  • Home
  • Tech
    • CSP

      AWS

      GCP

      NCP

      Cloud

      Migration

      LZ, Control Tower

      Backup

      Monitoring

      Container

      Infra

      OS

      Middleware

      Data

      RDB

      Big Data Platform

      Application

      CI/CD

      BESPICK 구독하기 ㅣ 1668-1280

  • Trend
  • IT