Tag: LLM

All the articles with the tag "LLM".

Kanana-o API: 카카오가 공개한 한국 최초 옴니모달 AI

2026년 3월 25일

텍스트, 이미지, 오디오를 모두 이해하고 말하는 카카오의 옴니모달 모델 Kanana-o가 드디어 API로 공개되었습니다. GPT-4o와 견주는 성능, 한국어 특화 능력, 그리고 풍부한 감정 표현까지.
ClawRouter: 에이전트가 ‘결제·인증’까지 자율로 처리하는 LLM 라우터

2026년 3월 21일

API 키와 신용카드가 전제인 라우팅 시대에서, 지갑 서명 + USDC 마이크로페이먼트로 ‘에이전트 네이티브’ 라우팅을 실현하는 ClawRouter를 해부합니다.
Flash‑MoE: 397B MoE를 노트북에서 굴리기 — SSD 스트리밍 + Metal로 만든 ‘진짜 온디바이스’ 실험

2026년 3월 19일

209GB 모델을 SSD에서 스트리밍하고 Metal 커널을 손으로 튜닝해, 48GB M3 Max에서 Qwen3.5‑397B‑A17B를 4.4 tok/s로 돌린 C/Metal 추론 엔진 Flash‑MoE를 뜯어봅니다.
CowAgent: 4만 스타를 돌파한 중국의 대표적 에이전트 프레임워크

2026년 3월 18일

위챗·비서·딩딩 등 중국 메신저와 완벽하게 연동되는 멀티모달 에이전트. 장기 기억, 스킬 시스템, 자율 작업 계획까지 갖춘 오픈소스 프로젝트를 분석한다.
OpenEvals: LangChain의 LLM 애플리케이션 평가 오픈소스 라이브러리

2026년 3월 17일

LangChain의 OpenEvals를 분석해 LLM 애플리케이션의 품질, 안전성, RAG 성능, 코드 품질을 평가하는 오픈소스 라이브러리의 다양한 평가자와 사용 방법을 살펴봅니다.
Claude-Mem: Claude Code를 위한 지속적 메모리 압축 시스템

2026년 3월 17일

thedotmack의 Claude-Mem을 분석해 Claude Code 세션 간 컨텍스트를 자동으로 보존하고 의미적 요약으로 검색 가능하게 만드는 지속적 메모리 시스템을 살펴봅니다.
NVIDIA NemoClaw: OpenClaw 어시스턴트를 안전하게 실행하는 샌드박스 스택

2026년 3월 17일

NVIDIA의 NemoClaw를 분석해 OpenShell 런타임과 NVIDIA 클라우드 인퍼런스로 OpenClaw 어시스턴트를 샌드박스 환경에서 안전하게 실행하는 방법을 살펴봅니다.
OpenJarvis: Stanford SAIL의 로컬 우선 개인 AI 프레임워크

2026년 3월 17일

Stanford SAIL의 OpenJarvis를 분석해 에너지, FLOPs, 지연 시간, 비용을 일급 제약으로 다루는 로컬 우선 개인 AI 프레임워크의 아키텍처와 철학을 살펴봅니다.

Tag: LLM

Kanana-o API: 카카오가 공개한 한국 최초 옴니모달 AI

ClawRouter: 에이전트가 ‘결제·인증’까지 자율로 처리하는 LLM 라우터

Flash‑MoE: 397B MoE를 노트북에서 굴리기 — SSD 스트리밍 + Metal로 만든 ‘진짜 온디바이스’ 실험

CowAgent: 4만 스타를 돌파한 중국의 대표적 에이전트 프레임워크

OpenEvals: LangChain의 LLM 애플리케이션 평가 오픈소스 라이브러리

Claude-Mem: Claude Code를 위한 지속적 메모리 압축 시스템

NVIDIA NemoClaw: OpenClaw 어시스턴트를 안전하게 실행하는 샌드박스 스택

OpenJarvis: Stanford SAIL의 로컬 우선 개인 AI 프레임워크