Lorsque vous développez avec AgentX, vous ne payez que pour les réponses que votre Agent génère. Chaque modèle coûte un nombre fixe de crédits, selon sa puissance. Mais « puissant » ne veut pas toujours dire « meilleur » — parfois, la vitesse compte davantage, parfois vous avez besoin d’un raisonnement approfondi.
Ce guide vous présente chaque niveau de modèles, ce pour quoi ils sont adaptés, ainsi que des exemples concrets d’utilisation.
⚡ Modèles à 1 crédit — Ultra-rapides & économiques
Modèles de ce niveau :
GPT 5 / 4.1 nano
Nova Lite (Amazon)
LLaMA 3.2 3B (Meta)
Grok 3 mini (xAI)
DeepSeek V3
Claude 3.5 Haiku (Anthropic)
Pourquoi les choisir ?
Ce sont les sprinteurs du monde de l’IA. Ils ne sont pas conçus pour résoudre d’énormes casse-têtes logiques ou rédiger des rapports de 50 pages, mais ils excellent lorsque votre Agent doit être réactif et traiter beaucoup de requêtes à faible coût.
Idéal pour :
Répondre à une FAQ à fort volume
De courts résumés d’e-mails ou de journaux de chat
Des agents conversationnels simples où la personnalité et la vitesse comptent plus que la complexité
Exemples concrets :
Un Agent retail répondant « Où est mon colis ? » des centaines de fois par heure.
Un chatbot d’école indiquant aux parents à quelle heure a lieu la sortie.
Un bot de support qui trie les problèmes clients avant de passer la main à un humain.
👉 Si la vitesse et le coût sont vos priorités, restez sur les modèles à 1 crédit. Ils sont fiables, rapides et respectueux du budget.
⚖️ Modèles à 2–3 crédits - Plus capables, toujours pratiques
Modèles de ce niveau :
GPT 5 / 4.1 mini (1 credit)
GPT 5 / 4.1 (2 credits)
Nova Micro (Amazon, 2 credits)
LLaMA 3.2 11B (Meta, 3 credits)
Grok 3 (xAI, 3 credits)
Claude 4 Sonnet (Anthropic, 3 credits)
Pourquoi les choisir ?
Ces modèles se situent au point d’équilibre entre capacité et accessibilité. Ils peuvent gérer des instructions plus complexes et maintenir des conversations sur plusieurs tours.
⚠️ Remarque : GPT 5 est puissant mais plus lent. Si votre Agent doit réfléchir soigneusement (résumer un long texte, expliquer son raisonnement, ou gérer des instructions délicates), GPT 5 est un excellent choix. Mais si vos utilisateurs s’attendent à des réponses ultra-rapides, envisagez GPT mini, Nova Micro ou Claude Sonnet.
Idéal pour :
Un support client qui nécessite plus que des réponses toutes faites
Des explications étape par étape
Un raisonnement modéré et des sorties structurées
Exemples concrets :
Un Agent de voyage planifiant un itinéraire multi-étapes avec recommandations d’hôtels + d’activités.
Un Agent bancaire comparant différentes options de prêt et expliquant les compromis.
Un chatbot RH guidant les employés à travers les politiques de congés ou les avantages.
👉 Utilisez ces modèles lorsque vous voulez plus de « cerveau » sans payer des coûts premium en crédits.
🧠 Modèles à 3–4 crédits - Penseurs avancés et spécialistes
Modèles de ce niveau :
Nova Pro (Amazon, 4 credits)
LLaMA 3.3 70B (Meta, 4 credits)
Grok 4 (xAI, 3 credits)
Claude 4 Opus (Anthropic, 3 credits)
DeepSeek R1 (4 credits)
Pourquoi les choisir ?
Ce sont les poids lourds. Ils sont plus lents et plus coûteux par réponse, mais excellent en raisonnement, rédaction, code et analyse de documents complexes.
Idéal pour :
Des workflows complexes où les erreurs coûtent cher
Des questions juridiques, de santé, ou liées à la conformité
Un support technique impliquant du code ou des calculs
Exemples concrets :
Un Agent santé vérifiant des recommandations de traitement sur des centaines de pages.
Un bot d’assistance juridique résumant des contrats et repérant des risques potentiels.
Un Agent d’ingénierie générant du code pour l’automatisation, la conception de PCB ou des simulations.
👉 Utilisez ces modèles lorsque la précision compte plus que la vitesse. Ce sont ceux que vous appelez pour les « cas difficiles ».
📝 Aide-mémoire pour décider rapidement
1 crédit : Super rapide, idéal pour les FAQ, les résumés et les tâches à fort volume.
2–3 crédits : Intelligence équilibrée. Excellent pour le support client, la planification et les réponses structurées. GPT 5 est puissant mais plus lent ; Sonnet et Nova Micro sont des options intermédiaires plus rapides.
3–4 crédits : Penseurs profonds. À utiliser pour des scénarios juridiques, médicaux, techniques ou très orientés recherche, où un raisonnement rigoureux est essentiel.
🎯 Conclusion
Choisir le bon modèle consiste à faire correspondre vitesse, coût et intelligence à votre cas d’usage :
Pour des réponses instantanées → restez sur les sprinteurs à 1 crédit.
Pour de la profondeur conversationnelle et de l’accompagnement → les modèles à 2–3 crédits sont votre meilleure option.
Pour un raisonnement complexe et des tâches à forts enjeux → faites appel aux poids lourds à 3–4 crédits.
👉 Commencez toujours par le modèle le plus rapide qui répond à vos besoins — ne montez en gamme que lorsque le problème exige plus de profondeur.