Quelle différence y a-t-il entre le « Tps réponse agent conv. » et le « Tps réponse LLM » ?

Le Tps réponse agent conv. mesure le temps total de réponse de l'agent conversationnel, de la réception du message client à l'envoi de la réponse, en incluant tous les traitements internes. Le Tps réponse LLM mesure uniquement le temps de génération de la réponse par le modèle de langage (LLM), isolant la performance du modèle IA de celle du reste du système.