Posts

작성한 모든 게시물.

212 posts Page 4/27

DeepEval: 코딩 에이전트 평가를 개발 루프 안으로 넣는 LLM eval harness

2026년 5월 14일

Pytest처럼 LLM 앱을 테스트하는 DeepEval을 딥다이브한다. 4.0 릴리스가 보여준 건 단순한 평가 도구가 아니라 코딩 에이전트용 피드백 루프다.
에이전트 스택의 성숙: Skills Framework가 정착되고 있다

2026년 5월 13일

GitHub TrendingDaily에서 mattpocock/skills(3,372★)과 obra/superpowers(189K★)가 동시에 급상승하며 에이전트 스킬 프레임워크 생태계가 성숙 단계에 진입했음을 보여줍니다.
NousResearch Hermes Agent: 하루 2,229 스타의 폭발적 성장, 그리고 자기 성장 에이전트의 시대

2026년 5월 12일

GitHub Trending 1위에 오른 Hermes Agent가 보여주는 자기 성장(self-improving) AI 에이전트의 핵심 철학과 실무 구조를 뜯어봅니다.
TradingAgents: 금융을 멀티에이전트 조직으로 다루는 법

2026년 5월 11일

TradingAgents는 시장 예측을 자동화하는 봇이 아니라, 분석가-연구원-트레이더-리스크 팀으로 의사결정을 분해하는 금융용 에이전트 하네스다.
GitHub Trending 2026-05-10: 에이전트 하네스가 에이전트보다 빠르게 뜬다

2026년 5월 10일

anthropics/financial-services, everything-claude-code, agent-skills, 9router가 보여준 오늘의 신호를 정리한다. 모델 자체보다 에이전트를 잘 쓰게 만드는 레이어가 더 빠르게 성장하고 있다.
Multica: 코딩 에이전트를 팀원처럼 운영하는 managed agents 플랫폼

2026년 5월 9일

Multica는 코딩 에이전트를 일회성 실행기가 아니라 보드, 상태, 런타임, 스킬을 가진 팀원으로 다루게 만든다.
GitHub Trending 2026-05-08: 실행면보다 중요한 건 우회·표준화·도메인화다

2026년 5월 8일

DeepSeek-TUI, agent-skills, CloakBrowser, 9router, AI-Trader, local-deep-research가 보여준 건 에이전트의 지능보다 실행면·탐지 회피·라우팅·절차 패키징·도메인 자동화가 더 중요해졌다는 신호다.
DeepSeek-TUI: 터미널을 AI 작업면으로 바꾸는 Rust 코딩 에이전트

2026년 5월 7일

DeepSeek-TUI는 DeepSeek V4를 터미널 안의 코딩 에이전트로 묶어 reasoning streaming, auto routing, worktree 롤백, MCP까지 한 번에 제공하는 Rust 기반 런타임이다.

Posts

DeepEval: 코딩 에이전트 평가를 개발 루프 안으로 넣는 LLM eval harness

에이전트 스택의 성숙: Skills Framework가 정착되고 있다

NousResearch Hermes Agent: 하루 2,229 스타의 폭발적 성장, 그리고 자기 성장 에이전트의 시대

TradingAgents: 금융을 멀티에이전트 조직으로 다루는 법

GitHub Trending 2026-05-10: 에이전트 하네스가 에이전트보다 빠르게 뜬다

Multica: 코딩 에이전트를 팀원처럼 운영하는 managed agents 플랫폼

GitHub Trending 2026-05-08: 실행면보다 중요한 건 우회·표준화·도메인화다

DeepSeek-TUI: 터미널을 AI 작업면으로 바꾸는 Rust 코딩 에이전트