상편(2026년 3월 30일자)에서는 AI 코딩 시장이 범용 완성에서 생태계·런타임 특화로 기우는 세 가지 이유—락인, 하이브리드 과금, MCP 이후의 오케스트레이션—을 짚었습니다. 하편에서는 그 위에 올라탄 네 가지 대표 플랫폼을 실무·아키텍처 관점에서 나란히 놓고, 마지막으로 조직과 보안, 노동 시장까지 연결해 보겠습니다.
역시 한 가지 짚고 갑니다. 아래의 기능 설명·수치·유출 관련 서술은 벤더 공식 발표, 기술 미디어, 커뮤니티 분석 등 제3자 정리에 기대는 부분이 있습니다. 도입·보안 검토는 최신 공식 문서와 내부 컴플라이언스를 우선하세요.
1. 네 플랫폼, 네 개의 ‘정답’ — 런타임부터가 다르다
같이 “소프트웨어 개발을 돕는다”고 해도, 제품 철학이 다릅니다. 저는 이걸 어디에서 돌아가는가(런타임) 와 무엇과 한 줄로 이어지는가(생태계) 로 먼저 나눕니다.
| 비교 항목 | Claude Code | Cursor | GitHub Copilot | Google Antigravity |
|---|---|---|---|---|
| 타깃 워크플로 | 대규모 다중 파일·터미널 오케스트레이션 | 빠른 편집·시각적 다중 파일 리팩터 | GitHub 이슈·PR·엔터프라이즈 DevSecOps | Firebase/GCP 풀스택·멀티 에이전트 |
| 주요 런타임 | 터미널 CLI(보고된 스택: Bun·React 기반 UI 등) | VS Code 하드 포크 AI 네이티브 IDE | VS Code·JetBrains 등 익스텐션 | 브라우저·클라우드 IDE(멀티 윈도우) |
| 특화 축(요약) | 장기 계획·대용량 컨텍스트·백그라운드 | Composer·코드베이스 인덱싱·자동화 | 플랫폼 네이티브 PR·Azure SRE·정책 | 병렬 에이전트·Artifacts 피드백·브라우저 에이전트 |
| 팀이 신경 쓸 리스크 | CLI 학습·(보도된) 공급망·유출 이슈 | 사용량 과금 변동 | 확장 모델의 자율성 한계 | 구글 내 툴 파편화·생태계 종속 |
이 표는 “승자 한 명”을 고르라는 뜻이 아닙니다. 워크플로가 다르면 최적 도구도 다르다는 뜻에 가깝습니다.
2. Claude Code (Anthropic) — 터미널을 운영체제에 붙인다
Claude Code는 전통적 GUI IDE 중심을 비껴, 터미널 안에서 파일 시스템·쉘·멀티 스텝 작업을 아우르는 에이전틱 하네스에 가깝게 포지셔닝됩니다. “에디터 안의 플러그인”이 아니라 개발자 머신에 가깝게 붙는 층이라고 보면 이해가 빠릅니다.
2.1 기술 지표로 보는 축
시장 자료·벤더 발표에 흔히 인용되는 스펙은 대략 다음과 같습니다(시점·모델 버전에 따라 변동).
- 컨텍스트 윈도우: Sonnet / Opus 계열에서 대규모(예: 1M 토큰 급) 를 전면에 내세움 — “한 번에 많은 파일을 메모리에 올려 이해한다”는 내러티브와 맞물립니다.
- 벤치마크: SWE-bench 계열에서 상위권 수치가 자주 인용됩니다.
- 런타임: 공개된 논의 기준으로는 Bun 등으로 CLI 시작 속도를 노린다는 분석, 터미널 UI에 React 계열을 쓴다는 분석이 있습니다.
2.2 보도된 ‘유출’과 로드맵 추정 — 읽을 때의 주의점
2026년 전후, NPM 배포 과정에서 소스맵이 노출되었다는 식의 보도가 이어지며, 대량의 TypeScript 코드와 미출시로 추정되는 기능 플래그가 외부에서 분석되었다는 이야기가 많았습니다. 이런 재료는 공식 로드맵이 아니며, 악의적 재해석·루머와 섞일 수 있습니다.
그럼에도 아키텍트가 주목할 만한 건 “어떤 종류의 기능이 상품화되려 하는가”입니다. 예를 들어 분석 글들에서反復 등장하는 테마는 다음과 같습니다.
- 장기·비동기 계획(예: Ultra Plan 등으로 불리는 모드): 사용자와 동시에 채팅만 주고받는 대신, 수 분 단위의 추론·계획을 클라우드 쪽에 올리고 사람은 승인만 한다는 식의 내러티브.
- 백그라운드·유휴 시간 활용(보도명: Kairos, AutoDream 등): 세션이 끊겨도 짧은 예산 안에서 뭔가 돌리거나, 야간에 컨텍스트를 정리한다는 운영체제에 가까운 상상.
- 멀티 에이전트 조율: 단일 어시스턴트가 아니라 역할을 나눈 에이전트가 병렬로 일한다는 구조.
한편 윤리·컴플라이언스 측면에서 논란이 될 만한 코드(예: 오픈소스에 출처를 숨긴 채 기여하도록 설계했다는 식의 주장)는, 공개 커뮤니티에서도 “가짜 뉴스/과장” 여부가 갈립니다. 조직에서 실제로 쓰기 전에 반드시 정책·법무와 상의해야 할 영역입니다.
아키텍처로 읽기
터미널 네이티브 도구는 권한이 곧 위험입니다. 어떤 디렉터리에 쓰기 권한을 줄지, 시크릿을 어디까지 노출할지, CI와 동일한지 별도인지—에이전트용 IAM을 따로 그려야 합니다.
3. Cursor (Anysphere) — 에디터 자체가 AI 시스템
Cursor의 차별점은 잘 알려진 대로 VS Code를 하드 포크해, 코어에 가깝게 AI를 박아 넣었다는 점입니다.
익스텐션 모델에서는 익스텐션 호스트와 에디터 코어 사이에 IPC가 끼어 지연이 생깁니다. Cursor는 파일 트리·터미널 출력·Diff 렌더링 등에 더 직접 붙는 그림을 지향합니다.
3.1 2026년 전후로 자주 언급되는 특화 축
- Composer(2.x): 다중 파일 변경을 한 번의 지시로 묶고, UI에서 Diff를 훑으며 승인하는 흐름. “코드 전용/코딩 특화 모델” 내러티브와 함께 비용 대비 품질을 내세움.
- 코드베이스 인덱싱: 열린 탭이 아니라 리포지토리 전체를 시맨틱하게 검색한다는 점이 초기 세대 Copilot 경험과 대비됩니다.
- 자동완성(예: Supermaven 통합): 줄 단위가 아니라 블록 단위 예측·높은 수락률 같은 지표가 마케팅·커뮤니티에서 반복됩니다.
- 자동화·클라우드 에이전트: GitHub 웹훅·Slack 등 외부 이벤트로 백그라운드 작업이 돈다는 식의 확장.
- 관측 가능성 연동: Datadog 등과 MCP로 엮어 로그·트레이스를 에디터 맥락으로 끌어온다는 사례가 소개됩니다.
아키텍처로 읽기
“빠르다”는 체감 뒤에는 인덱스·원격 큐·모델 라우팅이 있습니다. 사내에서는 코어가 나가도 되는 코드 경계와 자동 머지 금지 구역을 정해 두는 편이 안전합니다.
4. GitHub Copilot (Microsoft) — 익스텐션 퍼스트와 엔터프라이즈 SDLC
Copilot은 Cursor와 정반대 축에 가깝습니다. 이미 쓰는 에디터를 부수지 않고, VS Code·JetBrains·Visual Studio 위에 지능 층을 얹는다는 전략입니다.
다중 파일 자율 작업에서 일부 벤치마크·체감 평가는 상대적으로 밀린다는 말도 나오지만, 대신 GitHub·Azure·조직 정책과의 결합에서는 강점으로 묘사됩니다.
4.1 특화 축
- GitHub 네이티브: 이슈·PR·Actions와 이어지는 코딩 에이전트 내러티브—백그라운드 VM에서 구현하고 PR까지 올린다는 엔드투엔드 그림.
- 2026년 보안 로드맵(보도 기준): CI 러너 네트워크 경계, 재사용 워크플로 상속, 스코프된 시크릿 등 파이프라인 거버넌스 강화 방향.
- Azure SRE·운영: AKS 등에서 장애를 감지하고 이슈·런북 형태로 이어준다는 Agentic DevOps 서사.
- 정액형 안정성: 토큰 폭주형 청구보다 예측 가능한 예산을 내세우는 포지셔닝이 자주 비교됩니다.
아키텍처로 읽기
이미 GitHub Enterprise·Azure를 쓰는 조직에는 정책 일체화 비용이 낮습니다. 반대로 멀티 클라우드·셀프호스팅이 강하면 이점이 줄어듭니다.
5. Google Antigravity & Firebase Studio — 멀티 에이전트와 Artifacts
구글은 Gemini·AI Studio·IDX·Jules 등 이름이 많아 혼란스럽다는 말이 늘 나옵니다. 그 위에 Project IDX → Firebase Studio 흡수, 그리고 Antigravity라는 멀티 에이전트 런타임이 얹혔다는 식으로 이해하는 자료가 많습니다.
5.1 철학 네 가지를 내세운다는 설명
신뢰(Trust)·자율성(Autonomy)·피드백(Feedback)·자가 개선(Self-improvement) — 블랙박스만 보여주거나 반대로 모든 API 호출을 쏟아내는 극단을 피하겠다는 프레임으로 소개됩니다.
5.2 기능 축(자료상)
- 에이전트 매니저·병렬 스레드: 한 창 한 봇이 아니라 여러 에이전트가 동시에 다른 작업을 한다는 폼팩터.
- Artifacts: 계획서·체크리스트·스크린샷 등 중간 산출물을 두껍게 남기고, 사람이 부분 드래그로 코멘트하면 에이전트가 궤도 수정—비동기 협업 UI에 가깝습니다.
- 브라우저 에이전트: 내장 브라우저로 UI를 직접 조작·검증한다는 서사.
- Firebase/GCP 연동: 스키마·호스팅·배포를 한 생태계 안에서 묶는 풀스택 스토리.
아키텍처로 읽기
“구글 안에서 끝나는 앱”에는 강하고, AWS만 쓰는 레거시와는 마찰이 날 수 있습니다. 팀 표준 클라우드와 맞는지 먼저 보는 게 좋습니다.
6. 산업·보안·노동 — 에이전틱 시대의 부작용과 기회
6.1 플랫폼 엔지니어링과 역할 이동
보일러플레이트·문서 초안을 AI가 빨아들이면, 사람의 시간은 코드 타자에서 에이전트 감독·아키텍처·표준 운영으로 이동합니다. 채용 시장에서도 플랫폼 엔지니어·AI Fluency 가격이 붙는다는 분석이 반복됩니다.
동시에 PR·커밋 절대량은 늘어난다는 통계(예: GitHub 월간 PR 증가율)가 인용되곤 합니다. “개발자가 줄었다”기보다 같은 인원이 더 많은 변경을 밀어낸다에 가깝게 읽는 편이 현실적입니다.
6.2 보안 패러다임 — 쏟아지는 코드와 자동 거버넌스
모델은 “동작하는 코드” 쪽에 최적화되기 쉽고, 안전한 코드는 별도 층에서 봐야 합니다. 레거시 취약 패턴이 훈련 데이터에 스며 있고, 자동 승인·과도한 권한 같은 에이전트 리스크가 더해집니다.
그래서 2026년 전후 논의는 사후 리뷰에서 파이프라인 상 자동 격리·스코프 제한·정책 강제 쪽으로 기울어진다는 분석이 많습니다.
6.3 서비스 시장 — “대체”가 아니라 “현대화” 수요
에이전트가 외주를 없앤다기보다, 레거시 현대화·MCP 표준화·거버넌스 설계를 도와줄 SI·컨설팅 수요가 붙는다는 내러티브(BCG 등)도 함께 등장합니다.
7. 결론 — 만능 도구는 없다, 하이브리드와 MCP가 답인가
네 플랫폼은 각자 다른 생태계 최적점에 서 있습니다.
- 장기 계획·터미널·대규모 컨텍스트에는 Claude Code 축이 자주 거론되고,
- 로컬 IDE에서의 속도·시각적 다중 파일 작업에는 Cursor,
- GitHub·Azure·조직 통제에는 Copilot,
- 구글 풀스택·멀티 에이전트 UI에는 Antigravity 쪽 서사가 붙습니다.
그래서 엔터프라이즈에서는 한 벤더에 올인하기보다, 하이브리드 워크플로—예를 들어 일상 이슈·PR 루프는 Copilot, 대규모 리팩터는 Cursor/Claude Code를 제한적으로 투입—같은 그림이 자주 권고됩니다.
동시에 MCP를 사내 표준으로 받아들이고, “어떤 도구가 붙어도 데이터·시크릿·감사는 우리 층에서 통제한다”는 플랫폼 엔지니어링 조직이 있어야 이탈 비용과 그림자 IT를 동시에 줄일 수 있다는 게 상편·하편을 관통하는 메시지입니다.
참고로 더 읽을 것 (일부)
상·하편 모두 다음과 같은 공개 자료·리포트·미디어를 참고했습니다. 나열은 전부가 아니며, 링크는 시간이 지나면 깨질 수 있습니다.
- Anthropic — Model Context Protocol 소개
- GitHub Blog — Copilot 코딩 에이전트, Actions 보안 로드맵
- Google — Antigravity 소개, Firebase Studio·IDX 관계
- MarketsandMarkets 등 — AI code assistants 시장 전망
- BCG 등 — 에이전틱 AI와 기술 서비스 시장 논의
- Cursor, Claude Code 문서·커뮤니티 비교 글
- Claude Code 관련 소스 유출 보도 및 분석 글(비공식, 해석 주의)
본 글은 정보 공유 목적이며 특정 제품의 공식 입장·투자·법률 자문을 대체하지 않습니다. 도입·보안 결정은 반드시 내부 검토와 최신 공식 문서를 따르시기 바랍니다.