기존보다 4배 빠르다?… 엔비디아, 속도·비용 다 잡은 '이것' 출시

2025-12-26 11:38

에이전트 AI 구축의 새로운 기준, 네모트론 3 공개

엔비디아는 투명하고 효율적인 에이전트형 AI(Agentic AI) 개발을 지원하기 위해 나노(Nano), 슈퍼(Super), 울트라(Ultra) 세 가지 사이즈로 구성된 오픈 모델 제품군 네모트론 3(Nemotron 3)과 관련 데이터 및 라이브러리를 발표했다. 이번에 공개된 네모트론 3 모델들은 하이브리드 잠재 전문가 혼합(MoE) 아키텍처를 도입해 개발자들이 대규모 멀티 에이전트 시스템을 안정적으로 구축하고 배포할 수 있도록 돕는다.

네모트론 3` / 엔비디아
네모트론 3` / 엔비디아

네모트론 3 제품군은 총 3가지 모델로 구성된다. 먼저 네모트론 3 나노는 300억 개의 파라미터를 보유한 소형 모델로, 작업 시 최대 30억 개의 파라미터를 활성화하여 소프트웨어 디버깅이나 콘텐츠 요약 같은 작업에 최적화됐다. 특히 네모트론 3 나노는 기존 네모트론 2 나노 대비 4배 높은 처리량을 제공하며, 추론 비용을 획기적으로 낮췄다. 100만 토큰의 컨텍스트 윈도우를 지원해 긴 다단계 작업에서도 높은 정확도를 유지한다.

네모트론 3 슈퍼는 약 1,000억 개의 파라미터(토큰당 최대 100억 개 활성화)를 가진 고정확도 추론 모델로, 다수의 에이전트가 협업해야 하는 애플리케이션에 적합하다. 가장 큰 규모인 네모트론 3 울트라는 약 5,000억 개의 파라미터(토큰당 최대 500억 개 활성화)를 갖춘 대형 추론 엔진으로, 깊이 있는 연구와 전략적 기획이 필요한 복잡한 AI 워크플로우를 담당한다. 슈퍼와 울트라 모델은 엔비디아 블랙웰 아키텍처 기반의 4비트 NVFP4 훈련 포맷을 사용해 메모리 요구량을 줄이고 훈련 속도를 높였다.

젠슨 황 엔비디아 CEO는 "오픈 이노베이션은 AI 발전의 토대"라며 "네모트론을 통해 첨단 AI를 오픈 플랫폼으로 전환하고, 개발자들이 에이전트 시스템을 구축하는 데 필요한 투명성과 효율성을 제공하겠다"라고 밝혔다. 액센츄어, 딜로이트, 오라클 클라우드 인프라스트럭처, 서비스나우 등 주요 기업들이 이미 네모트론 제품군을 도입해 제조, 사이버 보안, 소프트웨어 개발 등 다양한 산업 분야에서 AI 워크플로우를 통합하고 있다.

젠슨 황 / 뉴스1
젠슨 황 / 뉴스1

엔비디아는 모델뿐만 아니라 도메인 특화 에이전트 개발을 위한 3조 토큰 분량의 사전 훈련 및 사후 훈련 데이터셋과 네모 에이전트 안전 데이터셋(Nemotron Agentic Safety Dataset)도 함께 공개했다. 또한 개발 가속화를 위해 훈련 환경과 사후 훈련 기반을 제공하는 네모 짐(NeMo Gym)과 네모 RL(NeMo RL) 오픈소스 라이브러리, 모델의 안전성과 성능을 검증하는 네모 이밸류에이터(NeMo Evaluator)도 출시했다. 이 모든 도구와 데이터셋은 깃허브(GitHub)와 허깅페이스(Hugging Face)에서 이용 가능하다.

현재 네모트론 3 나노는 허깅페이스와 여러 추론 서비스 제공업체를 통해 즉시 이용할 수 있으며, 네모트론 3 슈퍼와 울트라 모델은 2026년 상반기에 출시될 예정이다. 나노 모델은 퍼블릭 클라우드 고객을 위해 AWS, 구글 클라우드, 마이크로소프트 파운드리 등에서도 지원될 예정이다.

home 조희준 기자 chojoon@wikitree.co.kr