Tag: LLM
All the articles with the tag "LLM".
-
Kanana-o API: 카카오가 공개한 한국 최초 옴니모달 AI
텍스트, 이미지, 오디오를 모두 이해하고 말하는 카카오의 옴니모달 모델 Kanana-o가 드디어 API로 공개되었습니다. GPT-4o와 견주는 성능, 한국어 특화 능력, 그리고 풍부한 감정 표현까지.
-
ClawRouter: 에이전트가 ‘결제·인증’까지 자율로 처리하는 LLM 라우터
API 키와 신용카드가 전제인 라우팅 시대에서, 지갑 서명 + USDC 마이크로페이먼트로 ‘에이전트 네이티브’ 라우팅을 실현하는 ClawRouter를 해부합니다.
-
Flash‑MoE: 397B MoE를 노트북에서 굴리기 — SSD 스트리밍 + Metal로 만든 ‘진짜 온디바이스’ 실험
209GB 모델을 SSD에서 스트리밍하고 Metal 커널을 손으로 튜닝해, 48GB M3 Max에서 Qwen3.5‑397B‑A17B를 4.4 tok/s로 돌린 C/Metal 추론 엔진 Flash‑MoE를 뜯어봅니다.
-
CowAgent: 4만 스타를 돌파한 중국의 대표적 에이전트 프레임워크
위챗·비서·딩딩 등 중국 메신저와 완벽하게 연동되는 멀티모달 에이전트. 장기 기억, 스킬 시스템, 자율 작업 계획까지 갖춘 오픈소스 프로젝트를 분석한다.
-
OpenEvals: LangChain의 LLM 애플리케이션 평가 오픈소스 라이브러리
LangChain의 OpenEvals를 분석해 LLM 애플리케이션의 품질, 안전성, RAG 성능, 코드 품질을 평가하는 오픈소스 라이브러리의 다양한 평가자와 사용 방법을 살펴봅니다.
-
Claude-Mem: Claude Code를 위한 지속적 메모리 압축 시스템
thedotmack의 Claude-Mem을 분석해 Claude Code 세션 간 컨텍스트를 자동으로 보존하고 의미적 요약으로 검색 가능하게 만드는 지속적 메모리 시스템을 살펴봅니다.
-
NVIDIA NemoClaw: OpenClaw 어시스턴트를 안전하게 실행하는 샌드박스 스택
NVIDIA의 NemoClaw를 분석해 OpenShell 런타임과 NVIDIA 클라우드 인퍼런스로 OpenClaw 어시스턴트를 샌드박스 환경에서 안전하게 실행하는 방법을 살펴봅니다.
-
OpenJarvis: Stanford SAIL의 로컬 우선 개인 AI 프레임워크
Stanford SAIL의 OpenJarvis를 분석해 에너지, FLOPs, 지연 시간, 비용을 일급 제약으로 다루는 로컬 우선 개인 AI 프레임워크의 아키텍처와 철학을 살펴봅니다.