harness 2 AI 에이전트는 자기 일을 채점하지 못한다 — Anthropic이 제시한 Generator·Evaluator 하네스 설계 May 14, 2026 AI 에이전트가 한 시간 뒤에 길을 잃는 이유 — Anthropic이 제시한 '세션 경계' 설계법 Apr 8, 2026