Què és un sistema d'IA agèntic
I quan el teu producte el necessita de debò.
Tothom parla d'«agents d'IA» ara mateix. Cada proveïdor en té un. Cada pitch deck en menciona algun. I si li preguntes a tres enginyers diferents què és exactament un sistema d'IA agèntic, obtindràs tres respostes diferents.
El problema no és el terme en si, és el que genera: emprenedors que estan construint alguna cosa i ho anomenen agent quan no ho és, o emprenedors que eviten els agents del tot perquè el concepte els sembla més complex del que el seu problema requereix.
Tots dos errors són cars.
Un sistema d'IA agèntic és un patró arquitectònic específic, no un terme de màrqueting. Saber quan el teu producte el necessita de debò pot estalviar-te mesos de complexitat innecessària o fer-te perdre una capacitat que canvia el negoci.
1. Què vol dir «agèntic», sense la capa de hype
Comença pel comportament, no per la definició.
Una crida d'IA estàndard rep un input, el passa per un model i retorna un output. Un pas. Fi.
Un sistema agèntic fa una cosa diferent: rep un objectiu, el descompon en passos, decideix què fer en cada un, utilitza eines per actuar sobre el món i ajusta el seu comportament en funció del que troba, tot sense que una persona dirigeixi cada moviment.
Les tres propietats que defineixen un sistema agèntic
- Pot prendre accions, no només generar text. Pot cridar APIs, cercar a internet, llegir i escriure fitxers, llançar fluxos de treball, consultar bases de dades. Fa coses, no només les descriu.
- Pren decisions, a cada pas tria què fer a continuació en funció del context. No segueix un script fix. El camí d'input a output és dinàmic.
- Opera al llarg de múltiples passos, pot executar una seqüència d'accions, comprovar els resultats i decidir si continuar, reintentar o canviar de rumb. Té un bucle, no només una inferència.
El model mental més útil: Un chatbot respon preguntes. Un agent completa tasques.
Si li preguntes a un chatbot «quin és l'estat de la factura #4421?» et diu el que sap. Si li preguntes a un agent ell mateix, ho cerca al teu sistema de facturació, comprova si s'ha rebut el pagament, creua les dades amb els termes del contracte i retorna una resposta verificada, o assenyala una discrepància. Mateixa pregunta. Arquitectura completament diferent.
2. L'espectre: de l'automatització simple a l'autonomia real
Un dels errors més freqüents és assumir que «agent» significa IA totalment autònoma prenent decisions sense supervisió humana. La majoria dels sistemes agèntics en producció estan en algun punt intermedi de l'espectre.
Nivell 1, Pipeline de prompts encadenats
Una seqüència de crides a un LLM encadenades, on cada output alimenta el següent. Sense presa de decisions real, sense eines. Sovint s'etiqueta com a agent quan no ho és.
Exemple: un sistema que extreu clàusules clau d'un contracte, després classifica el risc, després genera un informe.
Nivell 2, Agent amb accés a eines
El model pot cridar eines externes, cerca, APIs, bases de dades, per completar una tasca. Decideix quina eina utilitzar i quan.
Exemple: un agent d'atenció al client que consulta l'historial de comandes, comprova l'estat de l'enviament i redacta una resposta.
Nivell 3, Agent amb raonament multi-pas
El model planifica, executa, avalua els resultats i s'ajusta. Pot reintentar passos fallits, gestionar outputs inesperats i recuperar-se d'errors.
Exemple: un agent de recerca que cerca en múltiples fonts, avalua la rellevància, sintetitza els resultats i assenyala contradiccions.
Nivell 4, Sistema multi-agent
Diversos agents especialitzats col·laboren: un orquestra, altres executen. Cada un gestiona un domini o tipus de tasca específic.
Exemple: un sistema de monitorització de compliance on un agent analitza trucades, un altre les contrasta amb documents de política i un tercer genera informes per a revisió.
Punt clau: La majoria de productes que es beneficien d'arquitectura agèntica comencen al Nivell 2 o 3, no al 4. L'objectiu és ajustar l'arquitectura al problema, no construir el sistema més sofisticat possible.
3. En què es diferencia del que probablement ja tens
Tres confusions freqüents entre emprenedors:
Agents vs. chatbots
| Dimensió | Chatbot | Agent |
|---|---|---|
| Acció principal | Respon preguntes | Completa tasques |
| Accés a eines | Normalment cap | Capacitat central |
| Presa de decisions | Script o crida única al LLM | Dinàmica, multi-pas |
| Estat / memòria | Sense estat o memòria curta | Manté context entre passos |
| Gestió d'errors | Retorna missatge d'error | Pot reintentar, redirigir, escalar |
Agents vs. automatització tradicional (Zapier, Make)
L'automatització segueix regles fixes: si X llavors Y, sempre. Es trenca quan l'input no encaixa amb el format esperat. Un agent gestiona la variabilitat, entèn el context, maneja els casos extrems i pren decisions de criteri. És la diferència entre un diagrama de flux i algú que pensa.
Agents vs. una crida simple al LLM
Una crida a un LLM és una inferència puntual. Ràpida, barata, sense estat. Un agent orquestra múltiples crides, eines i decisions al llarg del temps. Més potent per a tasques complexes, però també més car, més lent i més difícil de depurar. No facis servir un martell per cargolar un cargol.
4. Quan el teu producte necessita de debò un sistema agèntic
Aquesta és la part que importa. Cinc senyals clars.
Senyal 1: La tasca requereix informació que el sistema no té en començar
Si completar la tasca implica obtenir dades de fonts externes, CRMs, APIs, bases de dades, documents, i les fonts concretes depenen del context, necessites un agent. Un pipeline fix no pot decidir on buscar. Un agent sí.
Pregunta't: El meu sistema necessita anar a buscar informació, o sempre treballa amb informació que ja té?
Senyal 2: El camí d'input a output és variable
Si diferents inputs requereixen legítimament seqüències de passos diferents, uns simples, d'altres complexos, un flux fix o es trencarà o serà innecessàriament lent per als casos simples. Un agent enruta dinàmicament.
Pregunta't: Totes les tasques tenen la mateixa estructura, o els casos extrems requereixen un tractament diferent?
Senyal 3: La tasca implica múltiples sistemes o fonts de dades
Quan completar una tasca requereix tocar el teu CRM, el teu repositori de documents, el teu calendari i el teu correu, i coordinar el que retorna cadascun, aquesta lògica de coordinació pertany a un agent, no a codi d'integració personalitzat que es trenca cada cop que canvia un sistema.
Pregunta't: Quantes integracions toca aquesta tasca? Si en són més de dues, l'arquitectura agèntica comença a tenir sentit.
Senyal 4: El sistema necessita gestionar errors, no només fallar
Els sistemes d'IA en producció fallen. Els models al·lucinen. Les APIs cauen. Els documents estan mal formats. Un agent pot detectar què ha sortit malament i decidir què fer: reintentar, usar un fallback, escalar a revisió humana. Una crida simple al LLM simplement retorna una resposta incorrecta.
Pregunta't: Què passa quan el model s'equivoca? Si la resposta és «es trenca», necessites més que una inferència.
Senyal 5: La tasca triga més d'un torn a completar-se
Si l'usuari inicia alguna cosa i el sistema necessita treballar-hi, recopilant informació, prenent decisions, produint un resultat, durant segons o minuts sense que l'usuari intervingui a cada pas, això és un flux agèntic. No un intercanvi de chatbot.
Pregunta't: L'usuari espera una resposta o espera un resultat?
Quan no necessites un agent:
- Q&A d'un sol torn sobre una base de coneixement -> RAG és suficient
- Transformació documental fixa -> un pipeline amb prompts funciona
- Classificació o extracció amb inputs consistents -> model fine-tunejat o prompt estructurat
- Qualsevol cosa on la velocitat i el cost importin més que la flexibilitat -> comença simple
5. Un exemple real: com és un agent en producció
Concret, sense ser un cas d'estudi formal.
L'escenari
Un equip de compliance d'una empresa de serveis financers necessita monitoritzar trucades de vendes per detectar incompliments de política.
Sense agents
Un humà revisa les transcripcions manualment. O un model bàsic de NLP marca paraules clau, però perd el context, genera falsos positius i no pot explicar per què ha marcat alguna cosa.
Amb un sistema agèntic
1. La gravació de la trucada dispara el flux de treball. 2. L'Agent 1 transcriu i segmenta la trucada per interlocutor i tema. 3. L'Agent 2 recupera les polítiques de compliance rellevants per al producte que s'ha discutit. 4. L'Agent 3 creua la transcripció amb la política, no per paraules clau, sinó per raonament contextual. 5. L'Agent 4 genera un informe estructurat: què s'ha dit, quina política aplica, quin és el nivell de risc, quina acció es recomana. 6. Si el risc supera un llindar, escala a un revisor humà amb tot el context ja preparat.
El que fa que això sigui agèntic: obté informació externa (polítiques) basant-se en el contingut de la trucada, pren decisions a cada pas segons el que troba, gestiona la variabilitat (diferents productes, diferents polítiques, diferents nivells de risc) i produeix un output accionable, no només una classificació.
El resultat: el temps de revisió va passar de 45 minuts per trucada a menys de 3 minuts en les de baix risc. Els revisors humans es centren en els casos d'alt risc amb tot el context ja preparat.
Aquesta és l'arquitectura darrere de l'agent d'anàlisi de trucades i compliance que vam construir per a un client real de contact center. No és una demo, és un sistema en producció.
6. Les preguntes que has de fer-te abans de construir
Una checklist pràctica per portar a la teva propera reunió d'equip.
- Quina és la tasca concreta que el sistema necessita completar, no la funcionalitat, la tasca?
- Completar aquesta tasca requereix accedir a informació que no és a l'input inicial?
- Com de variable és el camí d'input a output? Els casos extrems són freqüents o excepcionals?
- A quins sistemes toca la tasca i quants en són?
- Què passa quan alguna cosa surt malament? El sistema necessita recuperar-se o pot fallar?
- Quant triga la tasca a completar-se? Segons? Minuts? L'usuari espera?
- Quin és el cost d'una resposta incorrecta? (Més risc = més necessitat de gestió de fallades)
Regla de decisió:
Si has respost «sí» als senyals 2, 3, 4 o 5 de la secció anterior, l'arquitectura agèntica val la pena avaluar-la.
Si has respost «no» a la majoria, comença més simple. Sempre pots afegir complexitat després. Treure-la, gairebé mai.
Conclusió
Els sistemes d'IA agèntics no són chatbots més avançats. Són un patró arquitectònic diferent per a una classe de problema diferent, tasques que requereixen acció, presa de decisions al llarg de múltiples passos i gestió robusta d'un món variable.
La pregunta no és si els agents són impressionants. Ho són. La pregunta és si el teu producte té un problema per al qual els agents són l'eina adequada. La majoria de productes en etapa primerenca tenen un o dos fluxos de treball on la resposta és clarament sí, i molts altres llocs on els enfocaments més simples funcionen millor.
Fer aquesta distinció bé des del principi és la diferència entre llançar alguna cosa en 6 setmanes i passar 6 mesos en una arquitectura que no necessitava ser tan complexa.
Estàs valorant si el teu producte necessita un sistema agèntic?
Si estàs avaluant l'arquitectura del teu producte d'IA i vols parlar-ho amb algú de l'equip, estem disponibles per a una trucada de 30 minuts. Sense pitch, només enginyeria.
Construïm junts
Unim experiència i innovació per portar el teu projecte al següent nivell.