Posts
작성한 모든 게시물.
-
ProofShot: AI 코딩 에이전트에게 눈을 주다 — 브라우저 녹화, 스크린샷, 에러 수집을 한 번에
AI 에이전트가 만든 UI가 제대로 동작하는지 어떻게 검증할까? ProofShot은 브라우저 세션을 녹화하고 에러를 수집해서 인간이 쉽게 검증할 수 있게 해주는 오픈소스 CLI다.
-
Last30Days: AI 세계가 한 달 만에 어떻게 바뀌는지 추적하는 에이전트 스킬
10개 소스를 병렬로 검색하고, 커뮤니티가 실제로 업보팅/공유/베팅하는 것을 찾아내는 AI 에이전트 스킬. 프롬프트 리서치부터 트렌드 파악까지.
-
AI Token Monitor: Claude Code와 Codex 토큰 사용량을 실시간으로 추적하는 메뉴바 앱
Claude Code와 Codex의 토큰 사용량과 비용을 메뉴바에서 실시간으로 모니터링하는 오픈소스 앱. Tauri v2로 만든 가볍고 아름다운 UI.
-
Claude Code Game Studios: Claude Code를 게임 개발 스튜디오로
48명의 AI 에이전트, 37개 워크플로우, 실제 스튜디오 계층 구조. Claude Code 하나로 완전한 게임 개발 스튜디오를 구축하는 방법.
-
expect-cli: 에이전트가 실제 브라우저에서 코드를 테스트
하나의 명령어로 코드 변경사항을 스캔하고, 테스트 계획을 생성하고, 실제 브라우저에서 실행까지. AI 에이전트 기반 E2E 테스트의 새로운 접근.
-
Claude Code Auto Mode: 권한 승인 없이 안전하게 작동하는 방법
Anthropic이 공개한 auto mode는 모델 기반 분류기로 위험한 행동을 차단하면서도 99.6%의 작업은 자동으로 진행. 승인 피로 없이 안전한 자율 실행의 중간 지점.
-
Feynman: 오픈소스 AI 리서치 에이전트
논문 검색, 문헌 리뷰, 실험 복제까지. Feynman은 AI 연구를 위한 종합 리서치 에이전트로, 모든 출력에 출처 URL이 포함된다.
-
Memento-Skills: 에이전트가 스스로 스킬을 진화시키는 시스템
LLM 파라미터를 업데이트하지 않고도 에이전트가 실패에서 학습하고 스킬을 재작성하며 지속적으로 진화. '에이전트가 에이전트를 설계하는' 새로운 패러다임.