시리즈 안내 — 이 글은 두 부작 중 1편입니다.
Part 1 (이 글) — 멀티 CLI · 온디바이스 LLM · 하이브리드 전략
Part 2 — 그 아래의 엔진룸 — Akka.NET 액터 모델, Gemma 4 + GBNF, AgentReactorActor FSM, STT/LLM/TTS 3계층 합주 → 액터가 LLM을 Agent로 만든다 — AgentZero Lite 깊이 읽기 (Part 2)
English version (영어판) — AgentZero Lite — Bringing Multi-CLI and On-Device LLM to Windows (Part 1, EN)
AI 시대의 미니멀 IDE — 여러 개의 CLI Agent를 한 화면에서 다루고, 똑똑한 큰 모델과 가벼운 온디바이스 LLM을 한 자리에서 조합한다.
1. 왜 또 다른 터미널인가 — CLI의 전성시대
2026년 개발 워크플로우의 가장 흥미로운 변화는 한 줄로 요약된다. 사람이 IDE를 쓰던 시대에서, AI Agent가 터미널을 쓰는 시대로 넘어가고 있다.
하루의 작업 단위가 더 이상 "셸 하나"가 아니다. Claude Code 가 한 탭에서 큰 리팩토링을 돌리는 동안, 다른 탭의 Codex는 PR 리뷰를 만들고, 또 다른 탭은 빌드 로그를 tail 한다. 사람은 이 셋을 동시에 감독하면서 가끔 끼어든다. 이 트렌드는 통계로도 확인된다 — 지난 12개월간 AI 터미널 멀티플렉서라는 새 카테고리가 생겼다. macOS·Linux 진영에는 cmux, amux, agent-of-empires 같은 도구가 줄지어 등장했고, tmux는 단일 프롬프트가 아니라 AI 에이전트 팀을 띄우는 무대로 다시 주목 받았다.
flowchart LR classDef plat fill:#1e293b,stroke:#06b6d4,color:#e2e8f0 classDef new fill:#312e81,stroke:#a855f7,color:#e9d5ff classDef gap fill:#7f1d1d,stroke:#ef4444,color:#fecaca subgraph mac["macOS / Linux"] direction TB A1["tmux"]:::plat A2["cmux"]:::new A3["amux"]:::new A4["agent-of-empires"]:::new end subgraph win["Windows"] direction TB B1["Windows Terminal"]:::plat B2["wmux (신생)"]:::new B3["?? 빈 자리 ??"]:::gap end mac -.대안 풍부.-> goal["멀티 AI Agent<br>같은 화면"] win -.오랜 공백.-> goal B3 ==> agentzero["AgentZero Lite"]:::new
문제는 Windows 진영이다. WSL 없이 Windows에서 멀티 AI 에이전트를 한 화면에 띄울 수 있는 도구는 한동안 비어 있었다. 최근 wmux 같은 시도가 등장했지만, 대부분은 여전히 터미널 분할에만 집중한다. AgentZero Lite 는 이 빈 자리를 다른 방식으로 메우려는 시도다. 단순 멀티플렉서가 아니라, 멀티 AI Agent + 온디바이스 LLM + WASM 플러그인 + 음성 입력 + 자체 하네스 프레임을 한 실행 파일에 묶는 Windows 데스크톱 셸이다.
2. AgentZero Lite — 한 줄 요약
AgentZero Lite 는 여러 개의 CLI 에이전트를 한 화면에서 다루는 Windows 데스크톱 셸이다. 핵심은 단순하다.
- 진짜 ConPTY 터미널을 N개 띄울 수 있다 (의사 PTY 흉내가 아님).
- 워크스페이스로 탭들을 폴더 단위로 묶는다 — 프로젝트마다 별도 CLI 세트 유지.
- AgentBot 채팅 패널이 포커스된 터미널로 텍스트나 키스트로크를 전달한다.
- 온디바이스 LLM (Gemma 4) 이 그 채팅 패널 안에서 터미널 AI들을 조율한다.
- WASM 샌드박스 플러그인으로 사용자가 기능을 직접 탑재할 수 있다.
- 음성 입력은 Whisper.net + Vulkan 으로 오프라인 동작.
- 단일 실행 파일, .NET 10 외 의존성 없음, 빌드 ~60 MB.
flowchart TB classDef tab fill:#0f172a,stroke:#06b6d4,color:#e2e8f0 classDef bot fill:#312e81,stroke:#a855f7,color:#e9d5ff classDef ws fill:#1e293b,stroke:#f59e0b,color:#fde68a user(("👤 User")) subgraph win["AgentZero Lite (단일 .exe)"] direction TB subgraph tabs["탭 (ConPTY 터미널 N개)"] direction LR T1["Claude tab"]:::tab T2["Codex tab"]:::tab T3["pwsh tab"]:::tab T4["build-log"]:::tab end subgraph side["사이드바"] direction TB W1["▸ monorepo"]:::ws W2["▸ blog"]:::ws end subgraph bottom["하단 패널"] direction LR P1["AGENT BOT<br>(Chat / Key / AI)"]:::bot P2["NOTE"]:::tab P3["LOG"]:::tab end end user --> tabs user --> bottom side -.컨텍스트.-> tabs P1 -.포커스 탭.-> tabs
3. AI ↔ AI 대화 — Lite 에디션의 시그니처 기능
AgentZero Lite 가 만들어진 핵심 이유는 한 문장으로 정리된다 — "두 AI CLI가 서로 대화하게 만들고 싶다."
방법은 의외로 간단하다. 같은 워크스페이스에 Claude 탭과 Codex 탭을 띄우고, 각 탭에 한 줄을 가르치면 끝이다.
AgentZeroLite.ps1 help를 학습하고,terminal-list로 탭을 보고,terminal-send <grp> <tab> "..."로 다른 탭의 AI 에게 말을 걸어.
이제 사용자가 "Codex 라는 이름의 탭에 인사하고, REST 엔드포인트를 함께 설계하자고 제안해" 라고 말하면, Claude 탭은
terminal-send 0 1 "안녕 Codex, ..." 를 실행한다. Codex 탭은 자기 프롬프트에서 그 메시지를 보고 답을 구성한 뒤 terminal-send 0 0 "..." 로 회신한다. 두 탭에서 대화가 실시간으로 흐른다.sequenceDiagram autonumber actor U as 👤 User participant C as Claude tab (탭 0) participant IPC as AgentZero IPC<br>(WM_COPYDATA + MMF) participant X as Codex tab (탭 1) U->>C: "Codex에게 인사하고 REST 설계 제안해" C->>IPC: terminal-send 0 1 "안녕 Codex, ..." IPC->>X: 텍스트 자동 입력 X->>X: 응답 구성 X->>IPC: terminal-send 0 0 "안녕 Claude, ..." IPC->>C: 응답 자동 입력 Note over C,X: 클라우드 중계 없음<br>로컬 IPC만 통과
이 구조가 신기한 이유는 통신이 모두 AgentZero 의 IPC (
WM_COPYDATA + 메모리 맵 파일) 위에서 일어난다는 점이다. 클라우드 중계 없음, 외부 서버 없음. 그리고 브로커가 그저 AI 가 이미 이해하는 셸 명령이기 때문에, claude 대신 Aider, Copilot CLI, 로컬 ollama 챗 등 CLI 네이티브 에이전트라면 어떤 것이든 같은 프로토콜로 끼어들 수 있다. 새 에이전트가 등장해도 AgentZero Lite 가 굳이 따라잡을 필요가 없는 구조다.터미널 멀티플렉서는 여러 프롬프트를 볼 수 있게 해주지만, AgentZero Lite 는 그들이 서로 말할 수 있게 해준다.
4. ChatMode 와 AIMode — 작은 비서가 큰 모델을 부린다
AgentBot 패널은 두 가지 모드를 가진다.
- ChatMode (CHT/KEY) — 입력한 텍스트나 키스트로크를 그대로 활성 터미널로 전달하는 입력 브로커. AI 가 아니다.
- AIMode —
Shift+Tab으로 전환하면 같은 채팅창이 온디바이스 LLM 코디네이터가 된다.
flowchart LR classDef cht fill:#0f172a,stroke:#06b6d4,color:#e2e8f0 classDef ai fill:#312e81,stroke:#a855f7,color:#e9d5ff user(("사용자")) subgraph cht1["ChatMode (입력 브로커)"] direction LR I1["채팅 입력"]:::cht --> O1["활성 터미널로<br>그대로 전달"]:::cht end subgraph aim["AIMode (LocalLLM 코디네이터)"] direction LR I2["채팅 입력"]:::ai --> L["Gemma 4<br>(온디바이스)"]:::ai L --> R{"라우팅 판단"}:::ai R -->|"무거운 추론"| T1["Claude tab"]:::ai R -->|"빠른 정리"| T2["Codex tab"]:::ai R -->|"즉답"| O2["사용자에게 직답"]:::ai end user --> I1 user --> I2
여기서 중요한 철학이 있다 — AIMode 의 LocalLLM 은 Claude 나 Codex 보다 똑똑해지려는 게 아니다. 목표는 작은 비서 다. 모호한 부탁("Codex 한테 토론 시작해", "오늘 작업한 PR 요약해")을 받아서, 적절한 터미널 AI 에게 라우팅하고, 결과를 정리해서 가져오는 안내 데스크 직원 역할. 무거운 추론은 더 큰 CLI 들에 살아있고, LocalLLM 은 모든 사람의 내선번호를 아는 직원이라는 비유가 정확하다.
이 작은 비서가 텍스트 자동완성 엔진에서 Agent 로 진화하는 핵심은 네 가지다.
- 출력 제약 — GBNF 문법으로 모든 출력이
{"tool": "<이름>", "args": { ... }}외엔 절대 나올 수 없도록 sampler 단계에서 강제.
- 도구 실행 —
list_terminals,read_terminal,send_to_terminal,send_key,wait,done6 종 도구 표면.
- 결과를 컨텍스트로 다시 주입 — 다음 user turn 으로.
- LLM 이
done을 emit 할 때까지 반복.
이 생성 → 도구 → 결과 → 다시 생성 루프가 텍스트 완성을 행동력(Agency)으로 바꾸는 본체다. 그리고 한 run = 한 사이클 규칙으로, LLM 이 5턴 토론을 거대 tool chain 으로 스크립트하지 않도록 막는다 — 사용자나 도착한 peer signal 이 다음 사이클을 트리거한다.
stateDiagram-v2 [*] --> Idle Idle --> Thinking: StartReactor(text) Thinking --> Generating: prompt prefill Generating --> Acting: tool_call JSON Acting --> Generating: tool_result 주입 Acting --> Done: done 호출 Done --> Idle: 한 사이클 완료 Idle --> Idle: peer signal 또는<br>사용자 다음 입력
PM 을 누구에게 위임할 것인가? 이게 AgentZero Lite 의 진짜 질문이다. 클라우드의 똑똑한 모델에게 PM 을 시킬 수도, 온디바이스 작은 모델이 직접 PM 을 할 수도 있다. 사용자가 그 선택지를 가질 수 있게 만드는 것이 핵심이다.
5. 음성 — 손과 입을 동시에 쓰는 듀얼 멀티태스킹
음성 입력은 AgentBot 에 직결돼 있다. 마이크에 말하면 오디오가 로컬에서 받아쓰여지고 (Whisper.net + Vulkan, 클라우드 안 거침), 그 텍스트는 사용자가 채팅창에 직접 타이핑한 것과 동일한 경로로 활성 AI CLI 탭에 흘러 들어간다.
sequenceDiagram autonumber actor U as 👤 사용자 participant K as 키보드 participant M as 마이크 participant T0 as 탭 0 (Claude) participant T1 as 탭 1 (Codex) par 키보드 채널 U->>K: 코드 작성 K->>T0: "이 함수 리팩토링" T0-->>U: diff 응답 and 음성 채널 U->>M: "오늘 PR 요약" M->>T1: Whisper 받아쓰기 → 자동 입력 T1-->>U: 음성 응답 (P3) end Note over T0,T1: 두 AI 대화가 동시에 흐름<br>사람 한 명이 둘 다 감독
핵심은 듀얼 멀티태스크다. 한 터미널이 키보드로 점령돼 있을 때(코드 작성, Claude diff 리뷰), 두 번째 터미널은 손을 대지 않고 음성으로 구동할 수 있다. 두 개의 AI 대화가 동시에 돌고, 사람 한 명이 둘 다 감독한다. AIMode 에서 모델 간 티키타카가 일어났다면, 이제는 본인의 두 입력 채널 (손/입) 사이의 티키타카가 가능해진 셈이다.
스택은 한국어 사용자에게 의미 있다.
- Whisper.net 오프라인 STT, GGML
small(~466 MB) /medium(~1.5 GB) 모델이 로컬 캐시. 한국어 인식이 강한 turbo 변종도 별도 채택 가능.
- CPU + Vulkan 동시 번들 — Vulkan 백엔드는 크로스 벤더다. AMD, Intel, NVIDIA 모두 같은 바이너리로 가속된다. CUDA 종속 없이.
- 멀티 GPU 노트북에서도 Auto 픽이 dGPU 를 정확히 잡고, 잘못 잡혔을 땐 수동 오버라이드 한 클릭.
- TTS 출력은 개발 중 — Windows SAPI / OpenAI tts-1 배관은 들어와 있지만 응답 스트리밍 파이프라인은 단계적 진행.
음성 출력 모델도 같은 전략을 따를 예정이다 — 무료 모델 중 한국어가 강한 것을 골라 조합한다. 클라우드 종속을 강제하지 않는다.
6. WASM 플러그인 — 내가 필요한 기능은 내가 탑재한다
AgentZero Lite 의 또 하나의 실험은 샌드박스 웹(WASM) 플러그인 이다.
flowchart LR classDef host fill:#1e293b,stroke:#06b6d4,color:#e2e8f0 classDef sand fill:#312e81,stroke:#a855f7,color:#e9d5ff classDef cap fill:#064e3b,stroke:#10b981,color:#a7f3d0 subgraph host["AgentZero 호스트"] direction TB LLM["LocalLLM API"]:::cap Term["터미널 액터 API"]:::cap Note["NOTE 패널 API"]:::cap end subgraph sandbox["WASM 샌드박스"] direction TB Plug["Voice Note 플러그인<br>(manifest + html + js)"]:::sand end Plug -.명시적 권한 부여.-> LLM Plug -.명시적 권한 부여.-> Term Plug -.명시적 권한 부여.-> Note Plug -.기본은 무능력.-> X1[("✗ 파일 시스템")] Plug -.기본은 무능력.-> X2[("✗ 네트워크")]
배경부터 짚자. 2026 년 들어 WebAssembly 가 AI 에이전트의 표준 격리 계층으로 자리 잡았다. NVIDIA, Cloudflare, Vercel, E2B, Firecrawl 모두 WASM 기반 sandbox 를 출시했고, 핵심 이유는 단순하다 — WASM 모듈은 기본적으로 무능력하다. 파일 시스템, 네트워크, 어떤 외부 자원에도 접근할 수 없다. 호스트가 명시적으로 권한을 부여한 것만 할 수 있다. 컨테이너나 microVM 으로는 구현하기 어려운 격리가 가능하다.
AgentZero Lite 도 같은 철학을 채택했다. 사용자는 자기에게 필요한 기능을 직접 만들어 탑재할 수 있다.
- AgentZeroCLI 에 설정된 온디바이스 AI 기능을 당겨 쓰기 가능 — 플러그인 안에서 LocalLLM 호출.
- 첫 번째 공식 플러그인은 Voice Note — STT 기반 음성 저널, VAD 게이트 캡처, 감도 슬라이더, 일시정지/재개, LLM 요약.
- 새 플러그인은
manifest.json+index.html+*.js/*.css만 있으면 끝. AgentBot[+]메뉴의 Install Plugin Picker 에서 한 클릭 설치.
사용자가 필요한 것을 직접 만들 수 있다 는 발상은 LLM 시대에 더 자연스럽다. AI 가 코드를 잘 짜기 시작했으니 플러그인 한 개 만드는 비용이 사라지고 있다.
7. 하네스뷰 — 프레임워크가 함께 자란다
AgentZero Lite 를 개발하면서 함께 발달한 것이 harness 하네스 프레임 이다. 보너스로 Note 패널 의 하네스뷰 를 통해, 이 프레임의 테크 요소와 구성을 직접 구경할 수 있다.
LLM 을 유용한 툴 체인으로 엮는 일은 어렵다. 매번 처음부터 추론하면 똑같은 실수를 반복한다. 하네스는 그 학습 루프를 명시적으로 만든다.
harness/ ├── agents/ — 전문가 평가자 (security-guard, code-coach, test-sentinel, tamer) ├── engine/ — 워크플로우 (release-build-pipeline, pre-commit-review) ├── knowledge/ — 도메인 노트 (LLM 프롬프트 컨벤션, tool-calling 서베이) └── logs/ — Mode 3 리뷰, RCA, 평가가 모두 여기 고정
피드백 루프는 네 가지다.
- 유닛 테스트 피드백 —
T1G..T7G라이브 + 헤드리스 TestKit 스위트가 회귀 대비 프로토콜·상태 머신을 검증.
- 실 수행 로그 —
%LOCALAPPDATA%\AgentZeroWpf\logs\app-log.txt가 매 Reactor turn, peer signal, JSON parse failure 캡처.
- Mode 3 RCA 로그 — 회귀마다 날짜별 사후 분석 (증상, 근본 원인, 패치, 평가, deferred 후속).
- 사람이 검토자 — 하네스 제안을 수용하거나 코스 보정. "AI 가 다 한다" 가 아니라 반복 개선자와의 페어 프로그래밍.
AIMode 프롬프트가 이번 iteration 에 6번 개정됐다 — one-cycle 규칙, 안티-수동성, 안티-거부, 핸드쉐이크 분리, peer-signal 트리거, ID 스킴 string 화. 각 시도가 같은 Mode 3 doc 에 무엇이 실패했고 다음 시도가 왜 그걸 해결하는지 기록됐다. 하네스가 그 시도들의 기억이라 같은 실수가 반복되지 않는다.
8. 오픈 모델 젬마로 시작된 온디바이스 LLM의 시대
AgentZero Lite 가 채택할 수 있는 LocalLLM 후보는 1년 사이 폭발적으로 늘었다.
온디바이스 LLM 타임라인 (출시 시점 기준)
- 2025-03 — Gemma 3 (1B/4B/12B/27B). 140+ 언어, 노트북·워크스테이션 타깃.
- 2025-08 — GPT-OSS 20B/120B (MXFP4 4-bit MoE). 20B는 16 GB RAM 엣지에서 동작.
- 2025 — Gemma 3n (PLE 기반 RAM 절감). 모바일·휴대 기기 특화.
- 2026-04 — Gemma 4 (소형 128K, 중형 256K context). 노트북 로컬 실행 최적화.
- 2026-04 — NVIDIA Nemotron 3 Nano Omni (30B-A3B Hybrid Mamba-MoE, 256K). 비전+오디오+텍스트, 9× 처리량.
여기서 던질 질문은 단순하다. "적당한 GPU 한 장으로 온디바이스 구동할 만한가?"
답은 부분적으로 그렇다. 16 GB 엣지에서 GPT-OSS 20B 가 돌아가고, Nemotron 3 Nano Omni 의 4-bit 양자화 버전은 25 GB VRAM 으로 멀티모달까지 처리한다. 컴퓨터 한 대로 비서 모델을 띄우는 비용이 한 자리수 단위 그래픽카드 가격으로 내려왔다.
여전히 큰 추론은 클라우드 모델이 잘한다. 하지만 비서 역할 은 명백히 온디바이스가 가능하다. AIMode 의 Gemma 4 가 정확히 이 자리에 들어간다.
9. 토큰은 정말 공기처럼 싸질 것인가
여기서 잠깐 시장의 분위기를 점검해야 한다. 토큰이 무한히 싸진다 는 가정이 흔들리고 있다.
Anthropic — Claude Pro/Max 플랜에 주간 한도가 도입됐다 (2025-08-28). 5시간 롤링 윈도 + 주간 캡 + Opus 별도 캡. 피크 시간(05:00~11:00 PT, 13:00~19:00 GMT)에는 세션 한도가 추가로 조정된다. 회사는 "인프라 투자 효과가 나타나려면 12~24개월" 이라고 공식 인정했다 — 한도는 당분간 더 빡빡해질 가능성이 높다.
GitHub Copilot — 2026-06-01 부터 사용량 기반 과금으로 전환. 모든 플랜에 GitHub AI Credits 월간 할당이 들어가고, 토큰(input/output/cached) 기준으로 차감된다. 2026-04-20 부터 Pro/Pro+/학생 플랜 신규 가입이 일시 중단됐다. 이유는 "agentic workflow 가 인프라 비용을 크게 끌어올렸다."
Agent 서버리스 비용 — 하네스 프레임워크가 N개 에이전트를 다루기 시작하면, CPU/메모리 사용 패턴이 AWS 서버리스보다 더 비싸질지 더 쌀지 아무도 모른다. 답을 정한 사람이 아직 없다.
요약하면 — 공급자 파워가 강한 시장이다. 약속을 하루아침에 철회하기도 한다. 소비자에게 선택권이 적다.
10. 하이브리드 전략 — 벤더락 프리, 소비자가 선택권
AgentZero Lite 가 채택한 답은 명확하다. 하이브리드 모드. 필요하면 무료/온디바이스 모델을 조합하고, 추론이 필요한 부분은 더 큰 클라우드 모델에게 위임한다. 벤더락에 묶이지 않고, 사용자가 선택권을 가진다.
flowchart LR classDef cloud fill:#1e3a8a,stroke:#3b82f6,color:#dbeafe classDef local fill:#064e3b,stroke:#10b981,color:#a7f3d0 classDef user fill:#7c2d12,stroke:#f97316,color:#fed7aa user(("👤 사용자<br>선택권 보유")):::user subgraph cloud["클라우드 (벤더)"] direction TB Cl["Claude"]:::cloud Cx["Codex"]:::cloud Gm["Gemini"]:::cloud end subgraph local["온디바이스 (무료)"] direction TB G4["Gemma 4"]:::local Wh["Whisper STT"]:::local Os["GPT-OSS"]:::local end user -->|"무거운 추론"| cloud user -->|"PM·정리·STT"| local cloud <-.AI ↔ AI 대화.-> local user -->|"WASM 플러그인 자작"| W["Voice Note 등"]:::local
구체적으로 어떻게 가능한가:
- 멀티 CLI — Claude, Codex, Gemini CLI 모두 동시 구동. 앞으로 또 다른 CLI 에이전트가 등장해도 같은 멀티뷰에 끼워 넣을 수 있다. 추가 작업 거의 없음.
- 온디바이스 ↔ 클라우드 라우팅 — AIMode 의 LocalLLM 이 PM 으로서 어느 모델에 일을 시킬지 결정. 추론이 무거우면 Claude 에게, 단순 정리면 Gemma 에게. Agent 사용비를 벤더 소속이 아닌 소비자가 선택하는 구조.
- 무료 음성 모델 조합 — STT 는 Whisper, TTS 는 한국어 강한 모델 별도. 각각 따로 채택해서 쓴다.
- WASM 플러그인 — 사내 도구·개인 워크플로우는 직접 만든다. 기능 추가에 벤더 승인 필요 없음.
- 하네스 뷰 — 어떤 에이전트가 어떻게 일하고 있는지 들여다 본다. 블랙박스 안 됨.
PlayGround 로서의 가치. AgentZero Lite 는 "온디바이스로 다 대체한다" 가 목표가 아니다. 작은 모델이 특수한 기능에 강하면 부분 채택하는 하이브리드 전략을 검증하는 실험장이다. Claude Code 와 경쟁하지 않는다.
11. 마치며 — Agent 서버리스 시장이 본격 전쟁이다
긴 호흡으로 정리하면 — 우리가 보고 있는 것은 단순한 IDE 의 위기 이상이다.
- 스킬·MCP 스펙은 인터페이스다. Anthropic 이 만들고 오픈한 스펙. 그 자체로는 과금 포인트가 작다.
- 하네스 프레임 + Agent 서버리스가 진짜 먹거리다. 토큰이 비용의 전부가 아니다. 토큰 × 툴 사용료 (Agent 서버리스) 같은 이중 과금 구조가 형성될 것이다. 하네스가 N 개 에이전트를 다루기 때문에, 에이전트 1개 단위의 경쟁이 아니라 시스템 단위 경쟁이다.
- 벤치마크는 이제 변별력이 약하다. LLM 이 더 높은 점수를 받는 것은 이제 중국 모델도 한다. 본격 전쟁은 Agent 서버리스 시장에서 일어난다.
- B2B 과금이 붙는 시장. 하네스 프레임워크는 그 위에 과금을 붙일 수 있는 영역이다.
이런 환경에서 AgentZero Lite 는 클라우드 종속 AI 사용 + 온디바이스 조합을 실험해 보는 PlayGround 다.
- IDE 가 점점 비싸지고 무거워지는 중. 웹·GUI 기반 도구들이 AI 기능을 탑재하며 구독료를 올리고 있다. 더 라이트하게 N 개를 제어하는 CLI/TUI 시도는 계속될 것이다.
- 한때 개발자의 전유물이었던 CLI 가, 최근에는 수준 높은 크리에이티브 진영과 제품 기획 진영에서도 잘 쓰기 시작했다. 사용자 층이 넓어지고 있다.
- AgentZero Lite 는 이 AI 격변기에 다양한 AI 모델 (오픈 × 벤더) 조합을 사용자가 선택할 수 있는 하이브리드 전략을 검증하는 PlayGround 로 자리잡는다.
부록 — 함께 보면 좋은 자매 저장소
함께 보면 좋은 자매 저장소
- harness-kakashi — 1인용 연습 하네스. 나루토 세계관으로 하네스의 감을 잡는 샌드박스.
- pencil-creator — 하네스로 디자인 시스템 템플릿을 자동 생성하는 실험.
- memorizer-v1 — 벡터 검색 기반 에이전트 메모리 MCP 서버. 하네스 공용 메모리로 진화 예정.
- DeskWeb — qooxdoo 기반 Windows XP 스타일 WebOS. 4종 Claude Code Skill 내장.
출처
- AgentZero Lite — <https://github.com/psmon/AgentZeroLite> (README · README-KR)