에이전틱 엔지니어링이란? Andrej Karpathy가 제시한 AI 개발의 5가지 패러다임 전환
"프로그래머로서 이렇게 뒤처진 느낌을 받은 적이 없습니다."
OpenAI 공동창업자이자 Tesla AI 총괄을 역임했던 Andrej Karpathy가 2026년 Sequoia AI Ascent 컨퍼런스에서 한 말입니다. '바이브 코딩(Vibe Coding)'이라는 용어를 만들었던 바로 그 사람이, 이제 에이전틱 엔지니어링이라는 완전히 새로운 개발 패러다임을 선언한 것입니다.
에이전틱 엔지니어링, 왜 지금 모든 AI 엔지니어가 주목하는가
2026년 초, Karpathy는 "에이전틱 엔지니어링"이라는 새로운 용어를 제시했습니다. 이는 AI 에이전트가 계획, 작성, 테스트, 배포를 수행하고 인간은 구조화된 감독을 하는 시스템 설계 학문입니다. 최근 업계의 화두는 단연 에이전틱 AI이며, 단순히 질문에 답하는 수준을 넘어 스스로 판단하고 워크플로우를 완수하는 '에이전트'는 기업의 생산성을 비약적으로 높일 게임 체인저로 주목받고 있습니다.
이 글에서는 Karpathy의 AI Ascent 2026 강연 핵심 내용을 분석하고, 에이전틱 엔지니어링이 왜 AI 개발의 미래를 좌우하는 키워드인지 살펴보겠습니다.
바이브 코딩에서 에이전틱 엔지니어링으로: 무엇이 달라졌나
Karpathy는 2025년 2월 "바이브 코딩"이라는 용어를 만들어 AI 보조 코딩의 트렌드를 정의했습니다. 하지만 불과 1년 만에 스스로 그 개념을 '구식'이라 선언했습니다.
바이브 코딩은 비기술자를 포함한 수백만 명이 웹앱과 프로토타입을 빠르게 만들 수 있도록 민주화했지만, 전문 환경에서는 심각한 기술 부채, 보안 취약점, 문서화되지 않은 비즈니스 로직 등의 문제가 빠르게 드러났습니다.
Karpathy는 강연에서 자신의 경험을 토대로 전환점을 명확하게 짚었습니다. 2025년 12월부터 최신 모델들을 사용하면서 코드를 수정할 일이 거의 없어졌고, 에이전트에 점점 더 많은 것을 맡기게 되었다고 합니다. 이 과정에서 단순한 '바이브'가 아닌 체계적인 관리 역량이 필요하다는 것을 깨닫게 된 것입니다.
Karpathy는 X에서 에이전틱 엔지니어링을 이렇게 정의했습니다. "Agentic"은 에이전트 오케스트레이션이 코드를 작성하고 인간 개발자가 출력을 감독·검증하는 것이며, "Engineering"은 코드 품질을 저해하지 않는 의미 있는 코드 생산을 위한 전문성 수준이 요구된다는 것입니다.
IBM의 AI 수석 설계자 Gabe Goodhart도 같은 맥락에서 "2026년의 경쟁은 AI 모델이 아닌 시스템에서 결정될 것"이라며 "모델 자체가 주요 차별화 요소가 아니라, 모델·도구·워크플로우를 결합하는 오케스트레이션이 중요하다"고 강조했습니다.
Software 3.0: LLM이라는 새로운 컴퓨터
Karpathy가 강연에서 제시한 핵심 프레임워크는 소프트웨어 진화의 3단계입니다.
- Software 1.0: 개발자가 직접 명시적 코드를 작성하는 전통 방식
- Software 2.0: 데이터셋을 구성하고 신경망을 훈련시켜 학습된 가중치가 곧 프로그램이 되는 방식
- Software 3.0: 자연어 프롬프트가 곧 프로그래밍이 되는 방식
우리는 이제 프로그램이 자연어로 표현되고 AI 모델이 실행하는 Software 3.0 시대에 진입하고 있으며, 실질적으로 "코드"란 LLM이 작업을 수행하도록 안내하는 영어 프롬프트를 의미합니다.
Karpathy는 이를 'OpenClaw 설치 사례'로 설명합니다. 기존에는 다양한 플랫폼을 지원하기 위해 복잡한 쉘 스크립트를 작성해야 했지만, 이제는 에이전트에게 설치 지침 텍스트를 붙여넣기만 하면 됩니다. 에이전트가 사용자의 환경을 스스로 파악하고, 지능적으로 설치를 수행하며, 오류가 생기면 디버깅까지 처리합니다.
더 극적인 예시는 그의 'Menu Gen' 프로젝트입니다. 레스토랑 메뉴를 촬영하면 각 음식의 사진을 보여주는 앱을 바이브 코딩으로 만들었는데, Software 3.0 방식으로는 단순히 메뉴 사진을 Gemini에 넣고 "이미지 위에 음식 사진을 오버레이해줘"라고 요청하면 끝이었습니다. 기존 앱의 모든 코드가 불필요해진 것입니다.
Karpathy는 이를 두고 "기존에 빨라진 것만이 아니라, 이전에는 불가능했던 완전히 새로운 것들이 가능해졌다"고 강조했습니다.
검증가능성(Verifiability)과 들쭉날쭉한 지능
에이전틱 엔지니어링을 실무에 적용하려면, LLM의 특성을 정확히 이해해야 합니다. Karpathy가 집중적으로 다룬 개념이 바로 검증가능성(Verifiability)과 들쭉날쭉한 지능(Jagged Intelligence)입니다.
이 새로운 프로그래밍 패러다임에서 가장 예측력이 높은 특성은 검증가능성입니다. 작업이 검증 가능하면 강화학습을 통해 직접 최적화할 수 있고, 신경망이 매우 잘 작동하도록 훈련될 수 있습니다. 이는 AI가 얼마나 '연습'할 수 있느냐의 문제입니다.
이것이 바로 LLM 성능이 "들쭉날쭉한" 이유입니다. Karpathy는 강연에서 강력한 대조 사례를 들었습니다. 최첨단 모델이 10만 줄짜리 코드베이스를 리팩토링하고 제로데이 취약점을 찾아낼 수 있으면서도, "세차장이 50미터 거리인데 걸어갈까요, 차를 몰고 갈까요?"라는 질문에 "걸어가세요"라고 답합니다. 세차를 하러 가는 것인데 말입니다.
검증 가능한 도메인에서 RLVR이 적용되면서 LLM은 해당 영역 근처에서 능력이 "급상승"하며, 전반적으로 재미있을 정도로 들쭉날쭉한 성능 특성을 보입니다. 동시에 천재 박학다식자이면서도 혼란스러운 초등학생 수준이 됩니다.
이 들쭉날쭉함의 패턴을 이해하는 것이 에이전틱 엔지니어링의 핵심 역량입니다. 에이전틱 엔지니어링은 시스템을 감독할 수 있을 만큼 충분히 이해하는 것을 요구합니다. 바이브 코딩이 프로토타이핑을 민주화했다면, 에이전틱 엔지니어링은 경험 많은 엔지니어에게 전례 없는 레버리지를 제공합니다.
에이전틱 엔지니어링 실전: 엔지니어의 새로운 역할
에이전틱 엔지니어링 시대의 개발자는 더 이상 코드를 직접 작성하는 벽돌공이 아닙니다.
2026년의 개발자는 엔지니어링 매니저나 Tech Lead처럼 기능하며, 이 감독자 주도 모델에서 인간의 감독이 품질의 핵심 병목이 됩니다. 워크플로우는 다음과 같이 변화합니다:
- 전략적 계획: 인간이 제품 사양, 시스템 아키텍처, 가드레일을 정의
- 에이전트 오케스트레이션: 병렬 AI 에이전트에 기능 단위로 작업을 위임
- 코드 리뷰 및 검증: 에이전트가 완성한 모듈을 인간이 검토·테스트
이 구조화된 접근 방식을 통해 엔지니어링 팀은 품질의 변동성을 줄이고, 아이디어에서 구현까지의 피드백 루프를 단축하며, 복잡한 시스템 유지 비용을 낮출 수 있습니다.
Gartner의 전망도 이를 뒷받침합니다. Gartner는 2026년까지 전체 기업 애플리케이션의 40%가 작업 특화 AI 에이전트를 통합할 것으로 예측했으며, 2025년 현재 5% 미만인 것을 고려하면 단 1년 만에 8배 증가하는 셈입니다.
시장 규모 역시 폭발적입니다. 글로벌 시장조사 업체 옴디아에 따르면, 기업용 AI 에이전트 소프트웨어 시장은 2025년 15억 달러에서 2030년 418억 달러로, 불과 5년 만에 약 28배 성장하며 이는 생성형 AI 초기 성장률의 두 배에 해당합니다.
에이전틱 엔지니어링을 시작하기 위한 3가지 행동 지침
Karpathy의 강연과 최신 업계 동향을 종합하면, AI 엔지니어가 지금 바로 실천할 수 있는 핵심 행동 지침은 다음과 같습니다.
1. 검증 가능한 작업부터 에이전트에 위임하라
모든 작업을 한 번에 맡기는 것이 아니라, 결과를 명확하게 검증할 수 있는 작업부터 시작하세요. 테스트 작성, 리팩토링, 보일러플레이트 생성 등이 대표적입니다. 검증 가능한 출력을 가진 수동 작업 하나를 식별하고, 에이전트에게 넘기고, 루프에서 자신을 빼는 것이 첫 번째 단계입니다.
2. 토큰 처리량을 극대화하라
Karpathy의 핵심 조언 중 하나는 "유휴 토큰은 당신이 병목임을 의미한다"는 것입니다. 충분히 많은 에이전트를 병렬로 실행하지 못하고, 하나의 에이전트 작업을 끝낸 뒤 다음을 시작하는 것은 병렬 세계에서 직렬로 일하는 것입니다. 승리하는 운영자들은 코드만이 아니라 판단을 병렬화하는 법을 배우고 있습니다.
3. Software 3.0 관점에서 기존 솔루션을 재검토하라
기존 앱이나 워크플로우가 이전 패러다임의 산물인지 점검하세요. Menu Gen 사례처럼, 신경망이 대부분의 작업을 처리할 수 있다면 그 코드 자체가 불필요할 수 있습니다.
자주 묻는 질문 (FAQ)
Q1. 에이전틱 엔지니어링과 바이브 코딩의 가장 큰 차이점은 무엇인가요?
바이브 코딩은 기능을 설명하고 구현을 수락한 뒤 바로 배포하는 방식으로, 빠르고 마찰이 적지만 복잡한 작업에서는 높은 오류율을 보입니다. 에이전틱 엔지니어링은 작업을 명확히 정의하고, 제약 조건을 설정하고, 에이전트를 작동시킨 뒤 출력을 검토하며, 에이전트가 스스로 볼 수 없는 실패 모드를 포착합니다. 에이전트가 95%의 키 입력을 처리하고, 인간이 판단을 담당합니다.
Q2. 에이전틱 엔지니어링 시대에 개발자의 기술 전문성은 여전히 중요한가요?
오히려 더 중요해졌습니다. 이 전환이 깊은 기술 전문성을 쓸모없게 만드는 것이 아니며, Karpathy는 최상위 수준에서 기술적 숙달이 "이전보다 더 큰 배율기(multiplier)"가 된다고 언급했습니다. 에이전트를 감독하려면 시스템에 대한 깊은 이해가 필수적입니다.
Q3. 검증가능성(Verifiability)이 왜 에이전틱 엔지니어링에서 중요한가요?
작업의 검증가능성이 높을수록 자동화에 적합하며, 검증이 불가능한 작업은 신경망의 일반화 능력이나 모방 같은 약한 수단에 의존해야 합니다. 이것이 바로 LLM 발전의 "들쭉날쭉한" 최전선을 만들어내는 원인입니다. 따라서 에이전트에게 위임할 작업의 우선순위를 정할 때 검증가능성 프레임워크가 핵심 판단 기준이 됩니다.
Q4. 기업 환경에서 에이전틱 엔지니어링 도입 현황은 어떤가요?
전 세계 기업의 3분의 2가 AI 에이전트를 실험하고 있지만, 실제로 가치 있는 규모로 확장하는 데 성공한 기업은 10% 미만에 불과합니다. McKinsey & Company의 2026년 4월 보고서는 에이전틱 AI의 대규모 확장을 위해 강력한 데이터 토대 위에 고영향 워크플로 선정, 데이터 아키텍처 현대화, 데이터 품질 관리, 거버넌스 모델 혁신이라는 4가지 핵심 전략을 제안합니다.
출처: 본 글은 Andrej Karpathy의 Sequoia AI Ascent 2026 강연 "From Vibe Coding to Agentic Engineering"을 기반으로 분석·정리한 콘텐츠입니다.