„Potrzebujemy agenta AI” – słyszę to coraz częściej. Czasem to dobra decyzja. Częściej okazuje się, że ten sam efekt da prosta automatyzacja, która jest tańsza, szybsza i nie potrafi sobie niczego wymyślić. Oto rama, według której sama podejmuję tę decyzję.
Trzy poziomy – nie jeden
Między „skryptem” a „agentem” jest całe spektrum. Warto je rozróżnić, bo każdy poziom ma inny koszt i inne ryzyko:
- Automatyzacja deterministyczna – sztywne reguły, zero AI. „Gdy przyjdzie X, zrób Y.” Przewidywalna i tania. 80% procesów biznesowych mieści się tutaj.
- Workflow z LLM – stały przepływ, w którym model robi jeden konkretny krok: klasyfikuje, streszcza, wyciąga dane. Ty kontrolujesz kolejność, model dokłada „rozumienie języka”.
- Agent – model sam decyduje, jakich narzędzi i w jakiej kolejności użyć, żeby osiągnąć cel. Najbardziej elastyczny, ale i najtrudniejszy do okiełznania.
Kiedy agent się opłaca
- Zadanie jest wieloetapowe i rozgałęzia się zależnie od danych (np. research, który dla jednego klienta wymaga 3 kroków, dla innego 8).
- Trzeba korzystać z wielu narzędzi i decydować w locie, którego użyć.
- Wejście jest mocno nieustrukturyzowane, a oczekiwany efekt – konkretny (np. „z tej rozmowy zrób ofertę”).
Kiedy agent to przerost formy
- Proces ma stałą, znaną kolejność kroków – wtedy agent tylko dokłada nieprzewidywalność i koszt.
- Liczy się przewidywalność i audytowalność (finanse, compliance) – sztywny workflow jest bezpieczniejszy.
- Wolumen jest ogromny, a marża na zadaniu mała – koszt tokenów zje korzyść.
Trzy ryzyka, o których trzeba pamiętać
Każdy poziom z LLM niesie te same trzy ryzyka – przy agencie są po prostu większe:
- Halucynacje: model potrafi pewnie podać nieprawdę. Lekarstwo: retrieval z cytowaniami, walidacje, progi pewności.
- Koszt i latencja: agent robiący 8 wywołań modelu jest wolny i drogi. Lekarstwo: budżety per zadanie, dobór modelu do kroku, cache.
- Brak kontroli: im więcej swobody, tym trudniej przewidzieć zachowanie. Lekarstwo: guardrails, ograniczony zestaw narzędzi, human-in-the-loop w newralgicznych miejscach.
Jak ja do tego podchodzę
Zaczynam od najprostszego rozwiązania, które rozwiązuje problem – i podnoszę poziom tylko wtedy, gdy realnie tego potrzebuje. Często okazuje się, że „agent AI” z brief’u to w praktyce workflow z jednym dobrze opisanym krokiem LLM, wdrożony w tydzień zamiast w kwartał. A gdy agent faktycznie ma sens, buduję go z guardrails, evaluacją na zestawie testowym i monitoringiem od pierwszego dnia.