[Startup 분석] Fractile – 긴 AI 추론을 빠르게 만드는 칩 스타트업

AI 인프라 시장에서 지금 가장 큰 병목은 더 이상 학습만이 아니다. 모델이 길게 생각하고, 에이전트가 수십 단계의 작업을 이어가고, 코딩·리서치·신약개발 같은 업무가 긴 추론 체인으로 바뀌면서 추론 속도와 추론 비용이 새로운 전쟁터가 됐다. Fractile을 지금 봐야 하는 이유가 여기에 있다. 이 회사는 “GPU를 조금 더 싸게 빌려주는 회사”가 아니라, 프런티어 모델 추론을 위해 메모리와 연산 구조 자체를 다시 설계하겠다는 영국 AI 반도체 스타트업이다. 2026년 5월 회사 발표와 Wall Street Journal 보도 기준으로 Fractile은 2억2000만 달러 Series B를 유치했다.

왜 지금 Fractile인가?

최근 AI 인프라 논의는 대부분 데이터센터, GPU 공급, 전력, HBM에 집중돼 있다. 그런데 실제 애플리케이션 레벨에서 보면 더 직접적인 문제는 토큰을 얼마나 빠르고 싸게 생성하느냐다. 추론이 느리면 에이전트는 오래 기다려야 하고, 추론이 비싸면 제품 마진은 무너진다.

Fractile의 메시지는 이 문제를 정면으로 건드린다. 회사는 공식 사이트에서 프런티어 모델 추론을 최대 25배 빠르게, 비용은 10분의 1 수준으로 낮추는 것을 목표로 한다고 설명한다. 아직 실제 상용 칩으로 널리 검증된 수치는 아니므로 투자자용 비전과 회사 주장으로 봐야 한다. 다만 이 방향성 자체는 매우 중요하다. AI 시장이 “누가 더 큰 모델을 만들었나”에서 “누가 더 많은 추론을 감당할 수 있나”로 이동하고 있기 때문이다.

기업 개요: Fractile은 무엇을 만드는 회사인가?

Fractile은 2022년 영국 런던에서 설립된 AI 반도체 스타트업이다. 창업자이자 CEO인 Walter Goodwin은 옥스퍼드에서 박사 학위를 받은 엔지니어로 소개된다. 회사는 런던과 브리스톨을 중심으로 운영되며, 미국 샌프란시스코와 대만 타이베이에서도 채용을 진행하고 있다.

핵심 제품은 프런티어 AI 모델 추론을 위한 전용 프로세서와 시스템이다. Fractile은 기존 GPU 구조에서 병목이 되는 메모리 이동 문제를 줄이기 위해 메모리와 연산을 더 가깝게 배치하는 구조를 내세운다. 공식 설명만 보면 단순 칩 설계 회사라기보다, 칩 마이크로아키텍처부터 클라우드 추론 서버 로직까지 묶는 풀스택 AI 가속기 회사에 가깝다.

2억2000만 달러 Series B가 말해주는 것

2026년 5월 Fractile은 2억2000만 달러를 조달했다고 발표했다. 회사 발표 기준으로 Accel, Factorial Funds, Founders Fund가 라운드를 이끌었고 Conviction, Gigascale, 01A, Felicis, Buckley Ventures, 8VC 등이 참여했다. WSJ도 같은 라운드를 보도하며 Factorial Funds, Accel, Peter Thiel의 Founders Fund가 투자했다고 전했다.

이 라운드의 의미는 두 가지다. 첫째, AI 칩 스타트업 투자가 다시 “학습용 대형 GPU 대체”보다 추론 최적화 쪽으로 이동하고 있다는 점이다. 둘째, 아직 대량 상용 매출이 확인된 회사가 아님에도 대형 투자자가 베팅했다는 점이다. 이건 현재 매출보다 향후 추론 수요의 폭발을 선반영한 가격이다.

Fractile이 푸는 문제: 긴 추론은 왜 비싼가?

Fractile의 투자 발표에서 가장 흥미로운 문장은 “추론은 AI 산업의 revenue engine이자 확장의 rate-limiting factor”라는 취지의 설명이다. 쉽게 말하면, AI 기업은 사용자가 모델을 호출할 때 돈을 벌지만, 동시에 그 호출을 처리하는 추론 비용 때문에 마진이 흔들린다.

특히 reasoning model과 에이전트형 워크로드에서는 이 문제가 더 커진다. 짧은 답변 하나를 생성하는 수준이라면 기존 GPU 클러스터로도 충분히 감당할 수 있다. 하지만 코드베이스를 읽고, 여러 가설을 세우고, 중간 결과를 검증하고, 다시 계획을 바꾸는 작업은 토큰이 길어진다. Fractile은 오늘날 LLM이 어려운 문제를 풀기 위해 최대 1억 토큰에 가까운 출력을 만들 수 있고, 기존 칩에서 초당 약 40토큰 수준이면 이런 출력은 한 달 가까이 걸릴 수 있다고 주장한다. 이 숫자는 회사가 제시한 문제 정의로 봐야 하지만, 방향은 맞다. 앞으로 AI 제품의 경쟁력은 모델 성능만큼이나 긴 작업을 현실적인 시간과 비용 안에 끝내는 능력에 달려 있다.

제품의 핵심: 메모리와 연산을 더 가깝게

AI 추론에서 느린 부분은 단순히 계산량만이 아니다. 큰 모델은 가중치와 KV cache 같은 데이터를 계속 읽고 써야 한다. 이때 연산 유닛과 메모리 사이를 오가는 데이터 이동이 병목이 된다. Nvidia GPU가 강한 이유도 HBM과 소프트웨어 생태계의 결합에 있지만, 동시에 이 구조는 비용과 전력의 한계를 만든다.

Fractile은 이 병목을 줄이기 위해 메모리와 연산을 물리적으로 더 촘촘히 엮는 새로운 프로세서 세대를 만들고 있다고 설명한다. Tom’s Hardware는 The Information 보도를 인용해 Fractile이 SRAM 기반 또는 near-memory 구조로 추론 칩을 개발한다고 전했다. 다만 WSJ 보도에서는 회사가 구체적인 기술 사양을 공개하지 않았고, 전통적인 HBM이나 온칩 SRAM 의존 방식과 다르다고 설명한 대목도 있다. 따라서 세부 아키텍처는 아직 완전히 공개된 상태가 아니다.

정리하면, Fractile의 기술 주장은 아직 “검증된 제품 스펙”이라기보다 메모리 병목을 깨려는 설계 방향이다. 이 방향이 맞으면 추론 비용 구조를 바꿀 수 있지만, 실제 칩 양산과 소프트웨어 호환성까지 증명해야 한다.

돈은 어디서 벌 수 있나?

Fractile의 수익 모델은 아직 공개적으로 세분화돼 있지 않다. 다만 AI 반도체 회사의 일반적인 경로를 보면 세 가지 가능성이 있다.

  • 칩과 서버 시스템 판매: 프런티어 모델 기업, 클라우드, 대형 연구소에 추론 시스템을 공급한다.
  • 클라우드형 추론 서비스: 자체 하드웨어 위에서 API 형태로 빠른 추론을 제공한다.
  • 전략적 고객·라이선스: 대형 AI 기업 또는 클라우드 사업자와 공동 설계·공급 계약을 맺는다.

가장 매력적인 모델은 단순 칩 판매를 넘어서 “cost per token”을 직접 낮춰주는 추론 인프라 플랫폼이 되는 것이다. AI 기업 입장에서는 칩 벤더 이름보다 총소유비용, 지연시간, 소프트웨어 안정성, 모델 호환성이 중요하다. Fractile이 이 네 가지를 동시에 잡으면 하드웨어 회사보다 높은 멀티플을 받을 수 있다.

경쟁 구도: Nvidia만 상대하면 되는 싸움이 아니다

Fractile의 가장 큰 경쟁자는 당연히 Nvidia다. Nvidia는 GPU, CUDA, 네트워킹, HBM 공급망, 클라우드 파트너십까지 한 번에 쥐고 있다. 고객 입장에서는 “새 칩이 빠르다”는 주장보다 “기존 모델과 프레임워크가 문제없이 돌아간다”는 안정성이 훨씬 중요하다.

하지만 Fractile이 마주한 경쟁자는 Nvidia 하나가 아니다. Groq, Cerebras, Etched, Tenstorrent, Google TPU, AWS Trainium·Inferentia, AMD, 그리고 최근 부상하는 여러 커스텀 ASIC 회사가 모두 추론 비용을 낮추겠다고 말한다. 영국·유럽 관점에서는 Graphcore의 실패 사례도 그림자처럼 남아 있다. 훌륭한 칩을 만드는 것과 대규모 고객을 확보하는 것은 완전히 다른 문제다.

그래서 Fractile의 차별화는 아키텍처만으로 끝나면 부족하다. 실제 승부는 프런티어 모델 회사가 직접 쓰고 싶을 만큼 빠른 개발자 경험과 운영 안정성을 제공하느냐에 달려 있다.

밸류에이션은 정당한가?

Financial Times는 2026년 3월 Fractile이 10억 달러 밸류에이션 이상에서 2억 달러 이상 조달을 논의 중이라고 보도했다. 이후 회사와 WSJ가 확인한 숫자는 2억2000만 달러 Series B다. 정확한 최종 밸류에이션은 공개 자료만으로 단정하기 어렵다.

그럼에도 투자 논리는 분명하다. 추론 비용은 앞으로 AI 기업 손익계산서의 핵심 항목이 된다. 모델이 더 많이 쓰이고, 에이전트가 더 오래 생각하고, 기업 고객이 실시간 업무에 AI를 붙일수록 “빠른 토큰”의 가치는 올라간다. Fractile이 실제로 지연시간과 비용을 크게 낮추면 10억 달러 이상의 기대는 설명 가능하다.

반대로 아직 칩 스타트업 특유의 실행 리스크가 크다. 실제 실리콘, 제조 수율, 공급망, 컴파일러, 모델 지원, 고객 신뢰를 모두 통과해야 한다. 지금의 밸류에이션은 실적보다 추론 시장의 미래 옵션에 가깝다.

가장 큰 리스크는 “좋은 칩”만으로 부족하다는 점

Fractile의 리스크는 세 가지로 볼 수 있다.

  • 상용화 시간: Tom’s Hardware는 Fractile 칩의 상용 준비 시점을 2027년 전후로 언급했다. AI 인프라 시장은 1년 사이에도 표준이 바뀐다.
  • 소프트웨어 생태계: Nvidia의 진짜 해자는 칩 성능만이 아니라 CUDA와 개발자 경험이다.
  • 대형 고객 의존: 프런티어 모델 회사 몇 곳을 잡지 못하면 고성능 추론 칩의 시장은 생각보다 좁을 수 있다.

특히 세 번째가 중요하다. Fractile의 제품은 범용 SaaS처럼 수천 고객에게 작게 팔기 어렵다. 초기에는 대형 AI 연구소, 클라우드, 국가 AI 인프라 프로젝트 같은 소수 고객이 결정적이다. 이 고객들이 테스트는 해도 실제 배포까지 가는 데는 시간이 걸린다.

개인적 판단: Fractile은 “AI의 속도”에 베팅한 회사다

나는 Fractile을 단순한 AI 칩 스타트업보다 조금 더 흥미롭게 본다. 이유는 이 회사가 GPU 공급 부족이라는 단기 이슈가 아니라, AI 애플리케이션의 구조적 변화에 베팅하고 있기 때문이다. 앞으로 좋은 AI 제품은 한 번 답하는 챗봇이 아니라, 오래 생각하고 여러 단계를 실행하는 시스템이 된다. 그럴수록 추론은 더 많이, 더 길게, 더 자주 일어난다.

다만 지금 단계에서 Fractile을 “Nvidia를 이길 회사”로 부르는 것은 이르다. 더 정확한 표현은 추론 병목이 커질수록 옵션 가치가 커지는 회사다. 실제 칩이 고객 손에 들어가고, 긴 컨텍스트·고동시성·낮은 비용을 동시에 증명하면 이야기는 달라진다. 반대로 제품 출시가 늦거나 소프트웨어 호환성이 약하면, 좋은 아키텍처도 시장에서 묻힐 수 있다.

한국 독자에게도 이 회사는 의미가 있다. Rebellions, FuriosaAI, DeepX 같은 국내 AI 반도체 회사도 결국 같은 질문을 받게 된다. “GPU보다 싸고 빠른가?”보다 더 중요한 질문은 “고객의 실제 추론 비용과 지연시간을 얼마나 줄였는가?”다. Fractile은 이 질문을 가장 공격적인 방식으로 던지는 해외 사례다.

한 줄 요약

  • Fractile은 프런티어 모델 추론을 위한 영국 AI 반도체 스타트업이다.
  • 2026년 5월 회사 발표와 WSJ 보도 기준 2억2000만 달러 Series B를 유치했다.
  • 핵심 주장은 메모리-연산 병목을 줄여 추론을 훨씬 빠르고 싸게 만들겠다는 것이다.
  • 가장 큰 기회는 에이전트·reasoning model 시대의 cost per token 절감이다.
  • 가장 큰 리스크는 실제 칩 상용화, 소프트웨어 생태계, 대형 고객 확보를 모두 증명해야 한다는 점이다.

참고 자료

Donghun Ryou



Search the website


today visits :

79

total visits :

89317


Comments

답글 남기기