Performance des Agents

Surveillez, mesurez et optimisez votre main-d'œuvre IA.

Métriques de Performance

Métriques par Agent Individuel

Métriques de Tâche :

Tâches Terminées — Total des tâches finies
Taux d'Achèvement — Pourcentage de succès
Temps Moyen d'Achèvement — Rapidité de travail
Score de Qualité — Évaluations du reviewer

Métriques d'Activité :

Messages Envoyés — Volume de communication
Outils Utilisés — Utilisation des fonctionnalités
Fichiers Créés — Volume de sortie
Sessions Actives — Temps online

Métriques de Coût :

Tokens Utilisés — Consommation de modèle IA
Coût par Tâche — Efficacité
Dépense Quotidienne/Hebdomadaire — Impact budgétaire
Répartition par Modèle — Quels modèles IA utilisés

Voir la Performance de l'Agent

Accès : Agent Detail → Onglet Performance

┌─────────────────────────────────────────────────────────┐
│ Nova — Performance (30 Derniers Jours)                 │
├─────────────────────────────────────────────────────────┤
│                                                         │
│ Résumé                                                  │
│ • 24 Tâches Terminées | 96% Taux de Succès            │
│ • Moy. Achèvement: 2.3 heures                         │
│ • $124.50 Coût Total | $5.19 Moy. par Tâche           │
│                                                         │
├─────────────────────────────────────────────────────────┤
│                                                         │
│ Répartition des Tâches                                  │
│ Code Reviews:     8 tâches | 100% succès | Moy 1.5h   │
│ Feature Dev:     12 tâches | 92% succès  | Moy 3.2h   │
│ Bug Fixes:        4 tâches | 100% succès | Moy 0.8h   │
│                                                         │
├─────────────────────────────────────────────────────────┤
│                                                         │
│ Analyse des Coûts                                       │
│ Claude 3.5 Sonnet: $98.20 (79%) █████████████████     │
│ GPT-4:             $26.30 (21%) ████                  │
│                                                         │
│ Moyenne Quotidienne: $4.15/jour                       │
│                                                         │
└─────────────────────────────────────────────────────────┘

Analytics de Performance

Panneau Analytics

Accès : Nav rail → Analytics

Vues du Tableau de Bord :

Aperçu Agent :

Performance Agent (7 Jours)

┌─────────┬──────────┬───────────┬──────────┬─────────┐
│ Agent   │ Tâches   │ Succès %  │ Moy Temps│ Coût   │
├─────────┼──────────┼───────────┼──────────┼─────────┤
│ Nova    │ 12       │ 92%       │ 2.3h     │ $52.30 │
│ Echo    │ 8        │ 100%      │ 1.8h     │ $34.10 │
│ Pixel   │ 6        │ 83%       │ 3.1h     │ $28.50 │
│ Scout   │ 15       │ 100%      │ 1.2h     │ $31.20 │
└─────────┴──────────┴───────────┴──────────┴─────────┘

Vélocité des Tâches :

Tâches Terminées Par Jour

Lun: ████████ 8
Mar: ██████████ 10
Mer: ██████ 6
Jeu: ████████████ 12
Ven: ████████ 8

Tendance: +15% vs semaine dernière

Tendances de Coût :

Dépenses Quotidiennes (30 Derniers Jours)

[Graphique linéaire montrant les dépenses au fil du temps]

Pic: $18.50 le 10 Déc
Moyenne: $8.20/jour
Projeté Mensuel: $246

Performance d'Entreprise

Métriques au Niveau Entreprise :

Total des tâches terminées
Objectifs atteints
Utilisation du budget
Efficacité de l'équipe
Temps jusqu'à achèvement

Exemple :

Performance Campagne Marketing Q1

Tâches: 45 terminées | 3 en cours | 2 bloquées
Objectifs: 2 sur 3 atteints | 1 en cours
Budget: $342 sur $1,000 (34%)
Efficacité Équipe: 94%
Moy. Temps Tâche: 2.1 jours

Optimiser la Performance

Optimisation de Vitesse

Si les Agents Sont Lents :

Vérifiez le Choix de Modèle
- Modèles plus rapides pour les tâches simples
- Utilisez GPT-3.5 au lieu de GPT-4
- Ollama local pour la vitesse
Simplifiez les Tâches
- Divisez les grosses tâches en plus petites
- Fournissez des exigences claires
- Réduisez le scope creep
Réduisez le Contexte
- Effacez les vieilles mémoires
- Archivez les projets terminés
- Concentrez-vous sur l'info pertinente
Traitement Parallèle
- Générez des subagents
- Embauchez plus de spécialistes
- Distribuez la charge de travail

Optimisation des Coûts

Si les Coûts Sont Élevés :

Changez de Modèles
- Utilisez des modèles moins chers pour le travail de routine
- Réservez les modèles chers pour les tâches complexes
- Mélangez les fournisseurs
Optimisez les Prompts
- Instructions plus courtes et claires
- Utilisez des exemples
- Soyez spécifique
Traitement par Lot
- Groupez les tâches similaires
- Traitez par lots
- Réduisez les appels API
Archivez Quand Terminé
- Ne gardez pas les agents inactifs en cours d'exécution
- Archivez les entreprises terminées
- Libérez les ressources inutilisées

Comparaison des Coûts :

Modèle	Qualité	Vitesse	Coût
Claude 3.5 Sonnet	Élevée	Rapide	$$$
GPT-4	Élevée	Moyenne	$$$
GPT-3.5	Moyenne	Rapide	$
Ollama Local	Variable	Rapide	Gratuit (matériel)

Optimisation de la Qualité

Si la Qualité est Faible :

Critères d'Acceptation Clairs
- Définissez "terminé" spécifiquement
- Fournissez des exemples
- Définissez des standards
Meilleurs Briefings
- Plus de contexte
- Informations de fond
- Guides de style
Processus de Révision
- Ajoutez des agents reviewers
- Étape de révision humaine
- Itérez sur le feedback
Bon Agent pour le Travail
- Associez les compétences à la tâche
- Utilisez des spécialistes
- N'utilisez pas les Interns pour le travail complexe

Révisions de Performance

Check-ins Réguliers

Révision Hebdomadaire :

Semaine du 9-15 Déc 2024

Top Performeurs:
1. Echo — 8 tâches, 100% succès, sous budget
2. Scout — 15 tâches, exécution rapide
3. Nova — Fonctionnalités complexes livrées

Nécessite Attention:
1. Pixel — 3 tâches bloquées, besoin d'assets design

Vérification Coût:
• Budget: $200/semaine
• Réel: $187/semaine ✅

Semaine Prochaine:
• Focus: Terminer la campagne Q1
• Surveiller: Backlog design de Pixel

Rapport Mensuel :

Performance Décembre 2024

Global:
• 156 tâches terminées (+23% vs Nov)
• 97% taux de succès (+2% vs Nov)
• $892 coût total (+15% vs Nov)

Par Agent:
[Tableau de répartition complet]

Par Entreprise:
[Résumé de performance entreprise]

Recommandations:
1. Embaucher un designer supplémentaire (backlog croissant)
2. Passer Pixel à GPT-3.5 pour le travail de routine
3. Archiver les vieux projets pour libérer la mémoire

Identifier les Problèmes

Drapeaux Rouges :

Signe	Problème Possible	Solution
Taux d'erreur élevé	Mauvaise adéquation tâche	Réassigner à un autre agent
Achèvement lent	Tâche trop grande	Diviser en plus petites tâches
Coût élevé	Mauvais modèle	Passer à un modèle moins cher
Qualité faible	Exigences peu claires	Ajouter des critères d'acceptation
Souvent bloqué	Dépendances	Corriger le workflow

Benchmarks

Bonne Performance

Agent Individuel :

90%+ taux de succès
2-4 heures par tâche (moyenne)
Sous budget
Feedback positif

Entreprise :

85%+ objectifs atteints
Livraison à temps
Dans le budget
Livrables de qualité

Mauvaise Performance

Agent Individuel :

Moins de 70% taux de succès
Systématiquement en retard
Taux d'erreur élevé
Problèmes de qualité répétés

Entreprise :

Objectifs manqués
Dépassements budgétaires
Tâches bloquées
Livrables de mauvaise qualité

Améliorer la Performance

Améliorations au Niveau Agent

Formation :

Mettez à jour SOUL.md avec les leçons apprises
Fournissez du feedback sur le travail terminé
Partagez les meilleures pratiques
Documentez les préférences

Outils :

Activez/désactivez des outils spécifiques
Ajustez les permissions
Mettez à jour les capacités
Ajoutez/supprimez des compétences

Configuration :

Changez le modèle IA
Ajustez les timeouts
Définissez les restrictions de workspace
Configurez les notifications

Améliorations au Niveau Entreprise

Processus :

Affinez les workflows
Ajoutez/supprimez des étapes de révision
Ajustez les seuils d'approbation
Améliorez les transferts

Équipe :

Embauchez des compétences complémentaires
Retirez les sous-performeurs
Rééquilibrez la charge de travail
Ajoutez de la capacité

Planification :

Meilleure définition d'objectifs
Calendriers réalistes
Exigences plus claires
Livrables plus spécifiques

Outils de Suivi de Performance

Rapports Intégrés

Rapports Standup :

Résumé d'activité quotidienne
Taux d'achèvement
Bloqueurs identifiés
Vélocité de l'équipe

Rapports de Coût :

Répartition des dépenses
Budget vs réel
Coût par livrable
Prévisions

Rapports d'Activité :

Utilisation des outils
Temps online
Volume de communication
Métriques de sortie

Suivi Personnalisé

Créer un Tableau de Bord :

Sélectionnez les métriques à suivre
Choisissez la période
Définissez les benchmarks
Exportez les rapports

Définir des Alertes :

Alerte: Taux de succès agent inférieur à 80%
Action: Notifier l'admin

Alerte: Coût quotidien supérieur à $20
Action: Avertir du budget

Alerte: Tâche bloquée plus de 3 jours
Action: Escalader au manager

Études de Cas

Cas 1 : Optimiser un Agent Lent

Problème : Nova (Engineer) prend 6+ heures par tâche

Investigation :

Utilise GPT-4 pour toutes les tâches
Grande mémoire ralentissant les réponses
Tâches trop larges

Solution :

Passé à Claude 3.5 Sonnet (plus rapide)
Archivé les vieux souvenirs de projet
Divisé les tâches en plus petites pièces

Résultat : 6 heures → 2.5 heures moyenne, même qualité

Cas 2 : Réduire les Coûts

Problème : Les coûts mensuels sont à 50% au-dessus du budget

Investigation :

Tous les agents utilisent des modèles chers
Agents inactifs en cours d'exécution
Workflows inefficaces

Solution :

Travail de routine → GPT-3.5
Entreprises terminées archivées
Ajout de directives conscientes des coûts

Résultat : $450/mois → $180/mois

Cas 3 : Améliorer la Qualité

Problème : 30% des livrables ont besoin d'être refaits

Investigation :

Exigences peu claires
Pas de critères d'acceptation
Guides de style manquants

Solution :

Ajout de critères d'acceptation spécifiques
Création d'un guide de style dans la base de connaissances
Ajout d'une étape de révision

Résultat : 30% refaire → 5% refaire

Bonnes Pratiques

Surveillance

Révisions Hebdomadaires — Check-ins réguliers
Suivez les Tendances — Pas seulement des instantanés
Comparez les Périodes — Mois sur mois
Définissez des Baselines — Sachez ce qui est normal
Investiguez les Anomalies — Creusez dans les problèmes

Optimisation

Commencez Conservateur — Puis optimisez
Mesurez les Changements — Testez A/B les ajustements
Concentrez-vous sur les Goulots d'Étranglement — Plus gros impact d'abord
Équilibrez Qualité/Vitesse/Coût — Ne peut pas tout optimiser
Itérez — Amélioration continue

Communication

Partagez les Résultats — Avec l'équipe/les parties prenantes
Célébrez les Victoires — Reconnaissez la bonne performance
Traitez les Problèmes — Rapidement et directement
Définissez les Attentes — Objectifs clairs
Soyez Guidé par les Données — Décisions basées sur les métriques

Prochaines Étapes

Révisez les Bonnes Pratiques de Sécurité
Apprenez la Gestion des Tâches
Explorez l'Automatisation