[Startup 분석] Etched – 프론티어 AI 추론 클러스터를 만드는 반도체 스타트업

AI 인프라 시장의 병목은 이제 모델을 학습시키는 GPU만이 아니다. ChatGPT, Claude, Gemini 같은 모델이 일상적인 제품 안으로 들어가면서, 매일 수십억 번의 요청을 싸고 빠르게 처리하는 “추론 인프라”가 더 큰 전장이 되고 있다. Etched가 지금 흥미로운 이유는 이 시장에서 가장 위험한 선택을 했기 때문이다. 범용 GPU를 조금 더 빠르게 만드는 대신, 트랜스포머와 프론티어 모델 추론에 맞춘 칩, 랙, 소프트웨어, 생산 방식을 한꺼번에 만들겠다는 회사다.

2026년 7월 1일 Bloomberg를 인용한 Economic Times 보도에 따르면 Etched는 총 8억 달러를 조달했다고 밝혔다. Jane Street, TSMC와 전략적 관계를 가진 VentureTech Alliance, Geoffrey Hinton, Fei-Fei Li, Stanley Druckenmiller 등이 투자자로 언급됐다. 더 중요한 숫자는 회사가 이미 10억 달러 규모의 고객 계약을 확보했고, 올여름 일부 고객에게 첫 랙을 출하하겠다고 밝힌 점이다. 아직 검증은 초기지만, Etched는 “AI 칩 스타트업”에서 “엔비디아 이후 추론 클러스터를 노리는 하드웨어 인프라 회사”로 포지션을 넓히고 있다.

Etched는 무엇을 만드는 회사인가?

Etched는 2022년 Gavin Uberti, Chris Zhu, Robert Wachen 등이 창업한 미국 산호세 기반 AI 반도체 스타트업이다. 초기에는 Sohu라는 트랜스포머 전용 ASIC으로 알려졌다. 2024년 공개 당시의 메시지는 단순했다. 대부분의 AI 워크로드가 트랜스포머 구조로 수렴한다면, 모든 모델을 다 돌리는 범용 GPU보다 트랜스포머에 최적화한 칩이 더 빠르고 싸질 수 있다는 주장이다.

2026년 현재 공식 사이트의 표현은 한 단계 더 커졌다. Etched는 자신을 “frontier inference clusters”를 만드는 회사로 설명한다. 즉 칩 하나만 파는 것이 아니라, 칩, 패키지, 보드, 냉각판, 랙, 인터커넥트, 컴파일러와 추론 소프트웨어, 공급망까지 함께 설계한다는 의미다. 엔비디아가 GPU만 파는 회사가 아니라 DGX, HGX, NVLink, CUDA 생태계로 돈을 버는 것처럼, Etched도 단품 칩보다 랙 단위 추론 시스템을 팔려는 방향에 가깝다.

왜 지금 Etched인가: AI의 비용 중심이 추론으로 이동한다

AI 붐의 초기에는 “누가 더 큰 모델을 학습시키느냐”가 핵심이었다. 하지만 모델이 제품으로 들어가면 비용 구조가 달라진다. 사용자가 버튼을 누를 때마다 토큰이 생성되고, 에이전트가 백그라운드에서 여러 번 추론을 돌리며, 긴 컨텍스트와 멀티모달 요청이 반복된다. 이때 기업이 매일 지불하는 것은 학습비가 아니라 추론비다.

Etched가 노리는 지점이 바로 여기다. 공식 사이트에 따르면 Etched는 프리필과 디코드 양쪽에서 처리량, 지연시간, 비용, 전력 효율을 개선하기 위해 하드웨어와 소프트웨어를 함께 설계한다고 설명한다. 특히 수조 개 파라미터 규모의 sparse MoE, 긴 컨텍스트, 에이전트형 워크로드를 주요 타깃으로 삼고 있다. 이 말은 “현재 모델”만 보겠다는 것이 아니라, 앞으로 더 크고 더 자주 호출될 모델의 추론 병목을 겨냥한다는 뜻이다.

투자 유치와 밸류에이션: 8억 달러 조달, 50억 달러 보도 밸류에이션

Etched의 자금 조달 스토리는 빠르게 커졌다. 2024년 6월에는 Reuters와 CNBC 등이 1억2000만 달러 Series A 조달을 보도했다. 당시 핵심은 Sohu를 TSMC에서 생산하고, 엔비디아 GPU에 대한 특화형 대안을 만들겠다는 것이었다.

2026년 7월 Bloomberg/ET 보도에서는 Etched가 총 8억 달러를 조달했고, 과거에는 50억 달러 밸류에이션의 5억 달러 라운드가 있었다고 전해졌다. Etched 측은 Jane Street가 과거 비공개 라운드를 리드했고 이후 추가 투자도 했다고 밝혔다. 다만 2026년 7월 기준 최신 라운드의 정확한 post-money valuation은 공개 자료만으로 확인하기 어렵다. 따라서 이 글에서는 50억 달러 밸류에이션을 “이전 보도 기준”으로만 다루는 것이 맞다.

핵심 기술: Low Voltage Inference와 Cluster Scale Memory

Etched가 공식 사이트에서 강조하는 기술 축은 두 가지다. 첫째는 Low Voltage Inference, 줄여서 LVI다. 회사 설명에 따르면 기존 AI 칩은 FLOPs 활용률을 높일수록 전력과 발열이 늘고, 결국 클럭을 낮추면서 실제 지속 처리량이 피크 성능보다 크게 떨어질 수 있다. Etched는 칩의 연산 블록을 일반 AI 칩보다 낮은 전압에서 구동하는 아키텍처를 설계해, 수조 파라미터급 sparse MoE에서도 80% 이상의 피크 FLOPs 활용을 목표로 한다고 설명한다.

둘째는 Cluster Scale Memory, CSM이다. 오늘날 AI 칩은 HBM을 많이 쓰지만, 디코드 단계에서는 메모리 지연과 인터커넥트 병목이 응답 속도를 제한한다. 반대로 SRAM만 쓰면 빠르지만 용량과 FLOPs 밀도가 낮아진다. Etched는 HBM과 SRAM을 섞은 구조, 그리고 칩 간 초저지연 고대역 인터커넥트를 통해 랙 전체가 더 낮은 지연시간으로 메모리 풀을 공유하도록 만들겠다고 말한다.

중요한 점은 이 주장이 아직 독립 벤치마크로 넓게 검증된 것은 아니라는 점이다. 공식 사이트는 초기 고객 테스트에서 최신 수준의 처리량, 지연시간, 전력 효율을 보였다고 설명하지만, 구체적인 모델별 공개 벤치마크는 여름에 더 공유하겠다고 했다. 지금은 “검증된 우위”라기보다 “검증해야 할 대담한 아키텍처 베팅”에 가깝다.

돈은 어디서 버는가?

Etched의 사업 모델은 단순 칩 판매보다 랙 단위 추론 인프라 판매에 가까워 보인다. 공식 사이트는 첫 랙이 올여름 출하될 예정이고, 10억 달러 이상의 고객 계약을 이행하기 위해 생산에 들어갔다고 밝혔다. Bloomberg/ET 보도 역시 회사가 10억 달러 규모의 sales contracts를 체결했다고 전했다.

추론 랙 판매: AI 기업, 클라우드 사업자, 하이퍼스케일러에 랙 단위 하드웨어를 판매하는 구조다.
소프트웨어와 컴파일러: 특화 칩은 소프트웨어 스택이 없으면 팔기 어렵다. 장기적으로는 추론 최적화, 모델 서빙, 컴파일러, 운영 도구가 중요한 반복 수익원이 될 수 있다.
공급망·생산 역량: Etched는 대만 공장, 산호세 데이터센터, 테스트 하우스, NPI 프로토타이핑 랩을 구축했다고 설명한다. 대형 고객에게는 성능만큼 납기와 생산 신뢰성이 구매 이유가 된다.

다만 고객명은 공개되지 않았다. 또한 10억 달러 계약이 확정 매출인지, 조건부 구매 약정인지, 장기 공급 계약인지 세부 구조는 공개 자료만으로 확인되지 않는다. 따라서 이 숫자는 회사 발표와 보도 기준의 “계약 수요”로 보는 것이 안전하다.

경쟁 구도: 엔비디아를 정면으로 이기는 게임이 아니다

Etched를 “엔비디아 킬러”로 부르는 것은 쉽지만, 실제 경쟁 구도는 더 복잡하다. 엔비디아는 GPU 성능만으로 지배하는 회사가 아니다. CUDA 생태계, 네트워킹, 랙 설계, 공급망, 클라우드 파트너, 개발자 습관까지 모두 해자다. Etched가 모든 AI 워크로드에서 엔비디아를 대체하기는 어렵다.

Etched의 현실적인 길은 특정 추론 워크로드에서 압도적인 경제성을 보여주는 것이다. 예를 들어 frontier model serving, 긴 컨텍스트 처리, sparse MoE, 대규모 에이전트 요청처럼 비용과 지연시간이 매우 민감한 영역에서 “이 워크로드는 Etched 랙이 훨씬 싸다”는 증거를 만들어야 한다. 범용 GPU 시장 전체가 아니라, 추론비가 손익계산서의 핵심인 고객부터 파고드는 전략이다.

경쟁자는 엔비디아만이 아니다. Google TPU는 이미 하이퍼스케일러 내부에서 강력한 대안이고, Cerebras, Groq, AMD, AWS Trainium/Inferentia, 자체 ASIC을 설계하는 대형 AI 기업들도 같은 문제를 보고 있다. 특히 Groq의 기술 라이선스·인수성 거래 보도와 Google의 추론 중심 TPU 방향은 이 시장이 얼마나 빠르게 움직이는지를 보여준다.

이 밸류에이션은 말이 되는가?

50억 달러 보도 밸류에이션은 아직 제품 출하 초기인 하드웨어 회사에는 매우 공격적이다. 하지만 Etched가 실제로 10억 달러 규모 고객 계약을 보유하고 있고, 첫 랙 출하가 예정대로 진행되며, 공개 벤치마크에서 전력 대비 추론비 우위를 보여준다면 설명 가능한 가격이 된다. AI 기업 입장에서 추론비가 매출총이익률을 갉아먹는다면, 몇 퍼센트가 아니라 몇 배의 비용 절감은 곧바로 구매 이유가 되기 때문이다.

반대로 Etched가 칩은 잘 만들었지만 소프트웨어 호환성, 생산 수율, 납기, 데이터센터 운영 안정성에서 막히면 밸류에이션 논리는 빠르게 약해진다. 반도체 스타트업은 데모 성능과 양산 성능 사이의 거리가 멀다. 엔비디아가 강한 이유도 칩 설계만이 아니라 매년 대량으로 만들고, 고객 데이터센터에 넣고, 개발자가 쓰게 만드는 전체 실행력에 있다.

가장 큰 리스크는 “너무 좁게 맞춘 칩”이다

Etched의 강점과 리스크는 같은 곳에서 나온다. 트랜스포머와 프론티어 추론에 깊게 최적화할수록 특정 워크로드에서는 매우 빠를 수 있다. 하지만 모델 아키텍처가 크게 바뀌거나, 고객의 실제 워크로드가 예상보다 다양하면 특화 칩의 장점은 줄어든다.

2024년 Etched가 Sohu를 공개했을 때 가장 큰 질문도 이것이었다. “트랜스포머가 계속 지배할 것인가?” 2026년에도 트랜스포머 계열은 여전히 중심에 있지만, sparse MoE, 멀티모달, 장기 메모리, 추론 중 도구 사용, 에이전트 orchestration처럼 실제 시스템은 점점 복잡해지고 있다. Etched가 칩만이 아니라 랙과 소프트웨어까지 함께 설계하는 이유는 이 변화를 어느 정도 흡수하기 위해서일 것이다.

개인적 판단: Etched는 AI 인프라의 가장 날카로운 베팅이다

Etched를 좋게 보는 이유는 문제 설정이 분명하기 때문이다. AI 제품의 사용량이 늘수록 추론비는 계속 중요해지고, 범용 GPU만으로 모든 요청을 처리하는 구조는 비용 압박을 받을 가능성이 높다. 이때 특정 워크로드에 특화된 추론 클러스터는 충분히 큰 시장을 만들 수 있다.

다만 이 회사는 “성공하면 거대하고, 실패하면 매우 비싼” 유형의 스타트업이다. 소프트웨어 SaaS처럼 빠르게 피벗하기 어렵고, 칩 설계와 생산은 한 번의 실수가 1~2년 지연으로 이어질 수 있다. 공식 사이트와 보도에 나온 400명 이상의 팀, TSMC N4P A0 실리콘, 10억 달러 계약, 8억 달러 조달은 강한 신호다. 하지만 투자자와 고객이 정말 보고 싶은 것은 올여름 이후의 실제 출하, 운영 안정성, 공개 성능 데이터다.

결론적으로 Etched는 엔비디아를 한 번에 대체하는 회사라기보다, 추론비가 가장 아픈 고객에게 “다른 경제성”을 제안하는 회사다. AI 앱이 늘어날수록 토큰은 계속 생성되고, 그 토큰을 싸고 빠르게 만드는 인프라는 점점 더 중요해진다. Etched가 그 비용 곡선을 실제로 꺾을 수 있다면, AI 반도체 시장에서 보기 드문 독립 플레이어가 될 수 있다.

[Startup 분석] Etched – 프론티어 AI 추론 클러스터를 만드는 반도체 스타트업

Etched는 무엇을 만드는 회사인가?

왜 지금 Etched인가: AI의 비용 중심이 추론으로 이동한다

투자 유치와 밸류에이션: 8억 달러 조달, 50억 달러 보도 밸류에이션

핵심 기술: Low Voltage Inference와 Cluster Scale Memory

돈은 어디서 버는가?

경쟁 구도: 엔비디아를 정면으로 이기는 게임이 아니다

이 밸류에이션은 말이 되는가?

가장 큰 리스크는 “너무 좁게 맞춘 칩”이다

개인적 판단: Etched는 AI 인프라의 가장 날카로운 베팅이다

참고 자료

Donghun Ryou

Popular Categories

Search the website

Comments

답글 남기기 응답 취소