Agenci AI w praktyce: kiedy warto, a kiedy wystarczy prosta automatyzacja

„Potrzebujemy agenta AI” – słyszę to coraz częściej. Czasem to dobra decyzja. Częściej okazuje się, że ten sam efekt da prosta automatyzacja, która jest tańsza, szybsza i nie potrafi sobie niczego wymyślić. Oto rama, według której sama podejmuję tę decyzję.

Trzy poziomy – nie jeden

Między „skryptem” a „agentem” jest całe spektrum. Warto je rozróżnić, bo każdy poziom ma inny koszt i inne ryzyko:

Automatyzacja deterministyczna – sztywne reguły, zero AI. „Gdy przyjdzie X, zrób Y.” Przewidywalna i tania. 80% procesów biznesowych mieści się tutaj.
Workflow z LLM – stały przepływ, w którym model robi jeden konkretny krok: klasyfikuje, streszcza, wyciąga dane. Ty kontrolujesz kolejność, model dokłada „rozumienie języka”.
Agent – model sam decyduje, jakich narzędzi i w jakiej kolejności użyć, żeby osiągnąć cel. Najbardziej elastyczny, ale i najtrudniejszy do okiełznania.

Kiedy agent się opłaca

Zadanie jest wieloetapowe i rozgałęzia się zależnie od danych (np. research, który dla jednego klienta wymaga 3 kroków, dla innego 8).
Trzeba korzystać z wielu narzędzi i decydować w locie, którego użyć.
Wejście jest mocno nieustrukturyzowane, a oczekiwany efekt – konkretny (np. „z tej rozmowy zrób ofertę”).

Kiedy agent to przerost formy

Proces ma stałą, znaną kolejność kroków – wtedy agent tylko dokłada nieprzewidywalność i koszt.
Liczy się przewidywalność i audytowalność (finanse, compliance) – sztywny workflow jest bezpieczniejszy.
Wolumen jest ogromny, a marża na zadaniu mała – koszt tokenów zje korzyść.

Trzy ryzyka, o których trzeba pamiętać

Każdy poziom z LLM niesie te same trzy ryzyka – przy agencie są po prostu większe:

Halucynacje: model potrafi pewnie podać nieprawdę. Lekarstwo: retrieval z cytowaniami, walidacje, progi pewności.
Koszt i latencja: agent robiący 8 wywołań modelu jest wolny i drogi. Lekarstwo: budżety per zadanie, dobór modelu do kroku, cache.
Brak kontroli: im więcej swobody, tym trudniej przewidzieć zachowanie. Lekarstwo: guardrails, ograniczony zestaw narzędzi, human-in-the-loop w newralgicznych miejscach.

Jak ja do tego podchodzę

Zaczynam od najprostszego rozwiązania, które rozwiązuje problem – i podnoszę poziom tylko wtedy, gdy realnie tego potrzebuje. Często okazuje się, że „agent AI” z brief’u to w praktyce workflow z jednym dobrze opisanym krokiem LLM, wdrożony w tydzień zamiast w kwartał. A gdy agent faktycznie ma sens, buduję go z guardrails, evaluacją na zestawie testowym i monitoringiem od pierwszego dnia.