본문으로 건너뛰기

Model Matchmaker: AI 비용 50-70% 절감하는 로컬 훅

정석

Model Matchmaker

18개월간 AI 에이전트로 개발하면서 많은 개발자가 하는 실수를 발견했다. 가장 비싼 모델을 선택한 채로 두고 다시는 건드리지 않는 것.

자신의 프롬프트를 몇 주 치 분석해보니:

문제는 지식이 아니다. 우리 모두 모델을 바꿔야 한다는 걸 안다. 문제는 마찰이다. 몰입해 있을 때 드롭다운을 생각하고 싶지 않다.


Model Matchmaker란?

Model Matchmaker는 Cursor와 Claude Code용 로컬 훅이다. 각 프롬프트가 전송되기 전에 실행되어 적절한 모델을 추천한다.

핵심 기능:

특징:


작동 원리

두 레이어가 함께 작동한다:

  1. session-init.sh: 세션 시작 시 실행, 모델 인식 컨텍스트 주입
  2. model-advisor.sh: 모든 프롬프트 전 실행, 작업 분류, 잘못된 모델 시 추천

모델 라우팅 규칙

모델작업 유형패턴 예시
Haiku기계적, 단순git commit, git push, rename, move file, delete file, format, lint
Sonnet구현build, implement, create, fix, debug, add feature, write, component, test
Opus아키텍처, 분석architect, evaluate, tradeoff, strategy, deep dive, redesign, analyze

Opus는 200단어 이상 프롬프트나 100단어 이상 분석 질문에도 추천된다.

분류기는 보수적이다. 높은 신뢰도일 때만 차단한다. 거짓 허용(약간의 돈 낭비)이 거짓 차단(잘못된 추천으로 흐름 방해)보다 낫다.


설치 방법

# 1. 클론
git clone https://github.com/coyvalyss1/model-matchmaker.git

# 2. Cursor 설정에 복사
cp model-matchmaker/hooks.json ~/.cursor/
mkdir -p ~/.cursor/hooks
cp model-matchmaker/hooks/*.sh ~/.cursor/hooks/

# 3. 실행 권한 부여
chmod +x ~/.cursor/hooks/session-init.sh ~/.cursor/hooks/model-advisor.sh

# 4. Cursor 재시작

패키지 없음, 빌드 단계 없음, 설정 파일 편집 없음.


실제 절감 효과

작성자가 두 제품(DoMoreWorld, Art Ping Pong) 개발 중 수 주간 프롬프트를 회고 분석했다. Opus를 거의 모든 것에 사용했다.

결과:


Cursor Auto 모드와 비교

Cursor의 Auto 모드는 서버 사이드에서 GPT-4.1, Claude 4 Sonnet, Gemini 2.5 Pro 중 선택한다. 하지만:

Model Matchmaker는 보완적 로컬 레이어다. 선택한 모델 위에서 작동하며 양방향으로 넛지한다.


보안 장점

프록시 기반 라우팅은 실제 위험이 있다:

Model Matchmaker는 완전 로컬 실행:


로컬 모델에도 적용 가능

Claude 모델용으로 설정되어 있지만, 로컬 모델에도 적용 가능:


마치며: 비용 절감의 역설

AI 비용 절감은 기술 문제가 아니라 행동 문제다. 우리는 알면서도 가장 비싼 모델을 계속 쓴다. 몰입의 흐름을 깨고 싶지 않기 때문이다.

Model Matchmaker는 이 마찰을 없앤다. 생각할 필요 없이 자동으로 적절한 모델을 추천한다. 12/12 테스트 프롬프트가 튜닝 후 정확히 분류되었다.

로그 파일을 검토해보면 자신의 패턴을 발견할 수 있다. 대부분의 “build” 프롬프트는 실제로 Opus가 필요 없다.


🔗 관련 정보

이전
Open Claude Cowork: 500+ SaaS 연동으로 무장한 오픈소스 AI 데스크톱 에이전트
다음
nanobot: 4,000줄로 구현한 초경량 AI 어시스턴트