Tackling Big Tasks
Dugotrajna tema u AI-asistiranom inženjeringu jeste da veličina ubija. LLM može da završi malu, fokusiranu izmenu za nekoliko sekundi, ali isti model na više-dnevnom epic-u tiho proizvede drift, slop i kod koji nigde ne vodi. Rešenje nije pametniji model — već manja jedinica rada.
Ovaj članak pokriva tri ideje koje, zajedno, čine velike taskove isporučivim: smart zone context window-a, podelu na PRD i plan, i tracer bullets za vertical slicing.
The smart zone of the context window
Moderni frontier modeli reklamiraju ogromne context window-e — 200K, 1M, čak i više tokena. U praksi, efektivni kvalitet rezonovanja modela degradira znatno pre navedenog limita. Uobičajena heuristika u zajednici je da model ostaje u svojoj "smart zone" otprilike kroz prvih 60–80% prozora od 200K — recimo ~120K–160K tokena — i počinje da pravi suptilne greške iznad toga.
To je rule of thumb, a ne merenje. Ali efekat ispod toga je stvaran i dobro dokumentovan. Chroma-in 2025. "context rot" rad testirao je 18 frontier modela i pronašao pad tačnosti od 30%+ u sredini prozora kod svakog. HumanLayer izveštava isto: čak i unutar smart zone modela od 200K, planovi su bili manje precizni, instrukcije su bile ignorisane, a trivijalne greške su se pojavljivale kako se kontekst punio.
Praktičan zaključak. Tretirajte context window kao budžet za kvalitet, ne samo za dužinu. Dugačak kontekst nije besplatan — svaki dodatni token razvodnjava pažnju ka onima do kojih vam je najviše stalo.
Zato veliki feature ne može jednostavno da se ubaci u jedan prompt. Čak i kada stane, model postaje sve gori što dublje ide.
PRD as destination, plan as journey
Rešenje je isto ono koje developeri koriste decenijama: razbiti rad na komade. Dva artefakta to rade čisto:

| Artefakt | Uloga | Šta sadrži |
|---|---|---|
| PRD (Product Requirement Document) | Destinacija | Precizna specifikacija šta gradite — feature-i, user stories, acceptance criteria. Bez putanja fajlova, bez imena funkcija, bez implementacijskih detalja. |
| Plan | Putovanje | Ruta od "prazan repo" do "PRD ispunjen", razbijena u chunk-ove od kojih svaki staje u jedan smart-zone context window. |
PRD je isti artefakt koji bi product manager istorijski predao developeru. U ovom workflow-u, "developer" je LLM, a PRD je način na koji mu objašnjavate šta da gradi. User stories imaju posebnu leverage vrednost — svaka linija "As a uloga, I want sposobnost, so that ishod" daje modelu zašto, na koje može da se vraća kada kasnije bude morao da donosi implementacijske odluke.
Matt Pocock-ov skill to-prd je korisna polazna tačka: pretvara labav razgovor u strukturisan PRD sa user story-ima.
The trap: implementing layer by layer
Kada predate plan LLM-u i kažete mu "izgradi feature", njegov prirodan refleks je da ide horizontalno: završi ceo backend, pa ceo frontend, pa QA. Kroz mikroservise radi isto — završi servis A, pa servis B.

Ovo izgleda uredno ali pravi pravi problem: feedback ne dobijate sve do poslednje faze. Dok shvatite da je contract između backend-a i frontend-a bio pogrešan, tri layer-a posla su već izgrađena na njemu. Rane faze — gde su greške najjeftinije za popravku — su one bez ikakvog signala.
Plan u ovom obliku je i previše specifičan prerano. Referencira funkcije i varijable koje još uvek ne postoje, pa čim se neki implementacijski detalj promeni, plan mora da se prepisuje. To je plan za vibe coding, ne za isporuku.
Tracer bullets and vertical slices
Rešenje je koncept iz knjige The Pragmatic Programmer koji postoji decenijama: tracer bullets. (aihero.dev)
Umesto završavanja horizontalnog layer-a po layer-a, svaka faza plana seče vertical slice kroz svaki layer sistema — minimalan end-to-end put koji zaista radi. Prva faza je mala i ružna, ali dodiruje backend, frontend i testove. Dobijate ranu povratnu informaciju da critical path drži. Svaka naredna faza širi slice.

Mantra je: integrate early, seek feedback often. Svaki vertical slice je mali MVP za zadatak. Verifikujete contract end-to-end pre nego što ga proširite.
"AI's natural inclination is to build big layers in isolation. You need to make it do an end-to-end slice across all the vertical layers."
Matt Pocock-ov skill prd-to-issues ovo operacionalizuje: uzima PRD i izbacuje plan čije faze jesu vertical slice-evi, svaki dovoljno mali da stane u smart-zone context window. Da li slice-evi žive kao faze unutar jednog plana ili kao odvojeni issue-i nije bitno — bitno je da je svaki tanak, end-to-end rez.
How this fits together
- Napišite PRD — šta gradite, zašto i za koga. Bez code-level detalja.
- Generišite plan vertical slice-eva — svaki end-to-end tracer bullet.
- Izvršite jedan slice u svom svežem context window-u, dobro unutar smart zone.
- Posle svakog slice-a, pregledajte feedback — testovi, tipovi, ponašanje — i podesite naredni slice.
Ljudska uloga se menja: umesto da držite ceo zadatak u glavi, vodite agenta slice po slice, korigujete kurs na stvarnom feedback-u i sprečavate ga da gradi previše.
Further reading
- Context Rot: How Increasing Input Tokens Impacts LLM Performance — Chroma-in rad iz 2025; empirijska osnova za "smart zone" — tačnost opada kako se kontekst puni, kroz 18 modela.
- Effective context engineering for AI agents — Anthropic o tretiranju context window-a kao konačnog budžeta: just-in-time retrieval, kompakcija, vođenje beleški.
- Building effective agents — Anthropic-ov temeljni vodič kroz obrasce agenata i držanje svake jedinice rada malom i dobro definisanom.
- 12-Factor Agents — HumanLayer-ovi principi za produkcijske agente: vladaj context window-om, biraj male fokusirane agente.
Sledeće: kako dizajnirati inženjersko okruženje tako da slice-evi sleću u codebase koji pomaže agentu — vidite Software Quality in the AI Era.
Pozadinsko čitanje: Context window limits.
Izmeni stranicu na GitHub-u