Chapitre 03

Stack Technique

Les briques technologiques pour construire des agents IA : modèles de langage, orchestrateurs, bases de données vectorielles et outils no-code.

Modèles de langage (LLM)

Le LLM est le cerveau de l'agent. Le choix du modèle impacte la qualité des réponses, la vitesse et le coût.

Modèle Forces Faiblesses Prix (1M tokens)
Claude 3.5 Sonnet Raisonnement, suivi d'instructions, éthique Moins rapide que GPT-4o-mini ~3$ input / 15$ output
GPT-4o Polyvalent, rapide, multimodal Peut être verbeux ~2.5$ input / 10$ output
GPT-4o-mini Très rapide, économique Moins précis sur tâches complexes ~0.15$ input / 0.60$ output
Gemini 1.5 Pro Grande fenêtre contexte (1M tokens) Moins fiable sur le suivi d'instructions ~1.25$ input / 5$ output
Recommandation
Pour les agents B2B, privilégiez Claude 3.5 Sonnet pour sa capacité à suivre des instructions complexes et son ton professionnel. Utilisez GPT-4o-mini pour les tâches simples à fort volume (classification, extraction).

Orchestration

L'orchestrateur coordonne les appels au LLM, les outils et le flux de travail de l'agent.

Options no-code

Make.com

  • Interface visuelle intuitive
  • 700+ intégrations natives
  • Bon pour les workflows linéaires
  • Pricing par opération

Idéal pour : PME, cas d'usage standards

n8n

  • Self-hosted possible
  • Plus flexible (code JavaScript)
  • Communauté active
  • Pricing par workflow

Idéal pour : équipes techniques, contrôle total

Options code

  • LangChain : Framework Python/JS complet pour agents complexes
  • LlamaIndex : Spécialisé RAG et données structurées
  • CrewAI : Orchestration multi-agents
  • Custom Python : Flexibilité maximale, maintenance plus lourde

Mémoire et contexte

Un agent efficace doit « se souvenir » des interactions passées et accéder à des connaissances externes.

Types de mémoire

📝 Mémoire conversationnelle

Historique de la conversation en cours. Stockée dans le prompt ou une base de données.

📚 Mémoire à long terme

Informations persistantes sur les prospects, préférences apprises. Base de données ou CRM.

🔍 Mémoire sémantique (RAG)

Recherche dans une base de connaissances via embeddings et vector database.

Vector databases

Solution Type Prix Usage
Pinecone Cloud Freemium Production, scalabilité
Supabase pgvector Cloud/Self Inclus Supabase Si déjà sur Supabase
ChromaDB Self-hosted Gratuit Prototypage, petits volumes
Airtable + Make No-code Inclus Airtable Cas simples, <10K docs

Outils externes (Tools)

Les outils permettent à l'agent d'agir sur le monde : envoyer des emails, mettre à jour le CRM, rechercher sur le web.

Catégories d'outils

  • CRM : Pipedrive API, HubSpot API, Salesforce API
  • Email : Gmail API, SMTP, Smartlead API, Lemlist API
  • Enrichissement : Clay API, Clearbit, Apollo
  • Recherche : Serper (Google), Tavily, Perplexity API
  • LinkedIn : Phantombuster, La Growth Machine (via webhooks)
  • Communication : Slack API, Twilio (SMS), Calendly
Tool calling natif
Claude et GPT-4 supportent le « function calling » natif : vous décrivez les outils disponibles, le modèle décide quand les utiliser et génère les paramètres. C'est plus fiable que le parsing manuel.

Stack recommandée pour PME

Voici la stack que je recommande pour construire des agents IA en contexte PME française :

🧠 LLM : Claude 3.5 Sonnet (Anthropic)

Meilleur rapport qualité/prix pour les tâches B2B. Excellent suivi d'instructions.

⚙️ Orchestration : Make.com

Interface visuelle, maintenance facile, nombreuses intégrations natives. Module HTTP pour Claude API.

💾 Données : Airtable ou Supabase

Airtable pour le no-code pur. Supabase si vous avez besoin de pgvector pour le RAG.

📊 CRM : Pipedrive

API complète, webhooks fiables, bon rapport fonctionnalités/prix pour PME.

📧 Email : Smartlead ou Lemlist

Smartlead pour le volume, Lemlist pour le multicanal. Les deux ont des API/webhooks.

Budget indicatif
Make.com Pro : 59$/mois | Claude API : 50-200$/mois selon volume | Pipedrive : 49€/user/mois | Smartlead : 79$/mois
Total : 250-400€/mois pour un agent fonctionnel
📚 Guides pour approfondir