Jewoo Sin
Preview Image

AI 에이전트는 자기 일을 채점하지 못한다 — Anthropic이 제시한 Generator·Evaluator 하네스 설계

이전 두 글에서는 AI 에이전트의 병목 두 가지를 짚었습니다. 1편은 작업 머리가 가득 차면서 앞 내용을 잃어버리는 문제, 2편은 기억 공간이 비어 있는데도 성능이 무너지는 문제였습니다. 처방은 각각 하네스와 컨텍스트 엔지니어링이었습니다. 그런데 두 처방을 모두 깔아둬도 더 복잡한 작업에서는 에이전트가 슬쩍 궤도를 벗어났습니다. 결과물은 그럴듯해 보...

Preview Image

CLAUDE.md가 11줄에서 1줄로 줄어들 때까지 — 8개 문제풀이로 정제한 에이전트 운영 메뉴얼

“AI Agent를 어떻게 사용하는게 잘 쓰는 걸까?” 내가 최근에 갖는 고민이다. 답을 찾으려고 AI TOP 100 대회의 8문제를 풀었다. 결과는 이렇다. 60점 → 80점 → 40점 → 50점 → 81점 → 56점 → 79점 → 92점 각 점수를 100점 만점 비율로 계산한 결과 어떤게 점수에 영향을 준 걸까? 문제를 풀면서 변한...

Preview Image

AI 에이전트가 '기억이 충분한데도' 흐려지는 이유 — Anthropic이 제시한 컨텍스트 엔지니어링

이전 글에서 세션 경계 문제를 해결하는 방법을 이야기했다. 그런데 곧 다른 병목을 마주했다. 그건 컨텍스트 윈도우에 여유가 남아 있는데도 에이전트가 흐려지는 현상이었다. 이전에 명시했던 규칙을 30분 뒤에 무시하고, 도구를 늘렸더니 답이 더 두루뭉술해지고, 같은 질문에 두 번째 답이 첫 번째보다 흐려졌다. Anthropic은 이 현상을 컨텍스트 부패...

Preview Image

AI 에이전트가 한 시간 뒤에 길을 잃는 이유 — Anthropic이 제시한 '세션 경계' 설계법

AI 코딩 에이전트에게 “이 기능 만들어줘”라고 던져놓고, 한 시간 뒤에 돌아와서 결과물을 보다가 머리를 짚어본 적이 있을 것이다. “어딘가 중간부터 길을 잃었다…” 는 생각이 뇌를 지배한다. 화면에는 절반쯤 고친 코드, 절반쯤 만든 테스트, 그리고 무엇보다 그 다음에 뭘 해야 하는지 모르는 상태가 있다. 이런 현상은 에이전트와의 대화가 길어졌을 때 ...

MongoDB 성능이 RDBMS 보다 뛰어난 이유

MongoDB는 ‘MongoDB는 대용량 데이터 처리에 적합하다.’라고 표현되며 설명되곤 한다. RDBMS와 어떤 차이점이 있길래 그런 수식어가 붙는걸까? 궁금증에 그런 이유들을 알아보기 위해 서칭해보면 “스키마가 유연하다”, “대규모 분산 데이터를 효율적으로 처리할 수 있는 구조이다” 등등 그 이유에 관련된 키워드가 나오지만, 그래서 왜 더 뛰어난...

Dev Club 알고리즘 스터디, 이진 탐색

이번 포스팅에선 Dev Club 에서 참여한 알고리즘 스터디에서 함께 공부 했던 알고리즘 중, 이진 탐색에 대한 내용을 설명한다. 이 스터디는 코딩 테스트에서 일가견이 있으신 Jason 멘토님과 함께 했다. 멘토님께선 초등학교 때부터 알고리즘 문제를 취미로 푸셨고, 커리어에서 많은 코딩 테스트 경험, 라이브 코딩 테스트 경험을 가지고 계신 분이시다...