Perplexity · API Sonar · 2026

API Perplexity
le guide Sonar pour développeurs en 2026

Intégrer la recherche web sourcée de Perplexity dans vos applications, chatbots et outils internes. Premier appel en 30 minutes.

Sonar
Nom de l’API
30 min
Premier appel
Compatible
OpenAI SDK
ℹ️Réponse directe — Qu’est-ce que l’API Perplexity Sonar ?

L’API Sonar est l’API de Perplexity qui permet d’intégrer la recherche web sourcée dans vos propres applications. Elle expose une interface compatible OpenAI — si vous connaissez l’API OpenAI, vous pouvez utiliser Sonar en changeant 3 lignes de code. Elle retourne des réponses rédigées avec les sources web citées.

Tarification à la consommation : les modèles sonar-small et sonar coûtent autour de 1 à 5 dollars pour 1 million de tokens. Pas d’abonnement mensuel obligatoire — vous payez ce que vous utilisez. Idéal pour des chatbots support, des outils de veille automatique ou des assistants internes.

Pourquoi utiliser l’API Sonar plutôt que l’API OpenAI ?

La différence fondamentale : l’API OpenAI génère depuis sa mémoire. L’API Sonar cherche sur le web en temps réel et cite ses sources. Si votre application a besoin de réponses actuelles et vérifiables, Sonar a un avantage structurel.

Cas d’usage où Sonar gagne : chatbot support client qui répond avec les infos produits les plus récentes, outil de veille concurrentielle automatique, assistant juridique qui cite les textes de loi actuels, tableau de bord de suivi d’actualités sectorielles. Tout ce qui nécessite des informations fraîches et sourcées.

Cas d’usage où l’API OpenAI reste meilleure : génération de contenu créatif, code, analyse de documents uploadés, assistants qui n’ont pas besoin d’infos récentes. Sonar et OpenAI sont complémentaires — choisissez selon le besoin.

Comment démarrer avec l’API Sonar en 30 minutes ?

1

Créer un compte et récupérer la clé API

5 min

Allez sur perplexity.ai/settings/api. Créez un compte Pro ou Entreprise si ce n’est pas fait. Dans l’espace API, générez votre clé API (commence par pplx-). Notez-la — elle ne sera affichée qu’une fois.

2

Installer le SDK

2 min

pip install openai (Python) ou npm install openai (Node.js). L’API Sonar est compatible OpenAI — vous utilisez le même SDK avec un endpoint différent.

3

Premier appel

10 min

Copiez le code d’exemple ci-dessous, remplacez YOUR_API_KEY par votre clé, et lancez. Vous devriez recevoir une réponse avec des sources en moins de 10 secondes.

4

Explorer les modèles

10 min

Testez sonar-small (rapide, économique) et sonar (meilleure qualité). Pour le Deep Research automatisé, essayez sonar-deep-research. Comparez les résultats sur vos cas d’usage réels.

5

Intégrer dans votre app

Variable

Remplacez vos appels OpenAI existants par des appels Sonar là où vous avez besoin d’infos récentes. Récupérez les citations (champ citations dans la réponse) et affichez-les dans votre UI.

Premier appel API Sonar — Python
from openai import OpenAI

client = OpenAI(
    api_key="pplx-VOTRE_CLE_API",
    base_url="https://api.perplexity.ai"
)

response = client.chat.completions.create(
    model="sonar",
    messages=[
        {
            "role": "system",
            "content": "Tu es un assistant qui répond en français avec des sources précises."
        },
        {
            "role": "user",
            "content": "Quelles sont les dernières actualités sur le marché de l'IA en France en 2026 ?"
        }
    ]
)

# Réponse principale
print(response.choices[0].message.content)

# Sources citées (dans les attributs étendus)
if hasattr(response, 'citations'):
    print("\nSources :", response.citations)
Premier appel API Sonar — Node.js
import OpenAI from 'openai';

const client = new OpenAI({
  apiKey: 'pplx-VOTRE_CLE_API',
  baseURL: 'https://api.perplexity.ai',
});

const response = await client.chat.completions.create({
  model: 'sonar',
  messages: [
    {
      role: 'system',
      content: 'Tu es un assistant qui répond en français avec des sources précises.'
    },
    {
      role: 'user',
      content: 'Actualités IA en France en 2026 ?'
    }
  ],
});

console.log(response.choices[0].message.content);

Les modèles Sonar disponibles en 2026

sonar-small : modèle léger, rapide et économique. Parfait pour les chatbots à fort volume de requêtes où la vitesse prime. ~1$/million de tokens.

sonar : le modèle standard, bon équilibre qualité/coût. Recommandé pour la plupart des intégrations. ~1-2$/million de tokens.

sonar-pro : qualité supérieure, utilise Claude ou GPT-4o comme LLM de synthèse. Pour les cas d’usage où la qualité de la réponse est critique. Tarif premium.

sonar-deep-research : équivalent du Deep Research de l’interface web via API. Lance des dizaines de recherches interconnectées et produit un rapport structuré. Traitement asynchrone, résultat en quelques minutes.

💡Mon verdict

J’ai intégré l’API Sonar dans plusieurs projets clients : un outil de veille concurrentielle automatique et un chatbot support documentaire. La compatibilité OpenAI rend l’intégration très rapide — c’est vraiment 30 minutes pour un premier appel fonctionnel.

Mon conseil : commencez avec sonar-small pour les tests et optimisez les coûts. Migrez vers sonar ou sonar-pro sur les requêtes où la qualité compte. La différence de prix entre sonar-small et sonar est faible, mais la différence de qualité sur les sujets complexes peut être significative.

Lucas Fonseque consultant SEO IA Toulouse
Conseil IA & SEO

Audit IA & SEO offert

Lucas Fonseque, consultant SEO & IA à Toulouse. 30 minutes pour identifier les bons outils selon votre profil — sans engagement.

📅 Réserver un appel gratuit →

Questions fréquentes sur l’API Perplexity Sonar ?

L’API Sonar est-elle vraiment compatible avec le SDK OpenAI ?+

Oui, c’est l’un des atouts marketing les plus solides de Sonar. L’API Perplexity implémente la même interface que l’API OpenAI pour le chat : même structure de messages (system/user/assistant), mêmes paramètres (temperature, max_tokens, stream), même format de réponse. Vous changez simplement l’URL de base et la clé API.

En pratique, si vous avez un code Python ou Node.js qui appelle l’API OpenAI, vous pouvez le faire pointer vers Sonar en changeant 2 à 3 lignes : l’API key et le base_url. Les fonctionnalités spécifiques à Sonar (citations, fraîcheur des sources) se retrouvent dans des champs supplémentaires de la réponse, mais la structure de base est identique.

La limite de cette compatibilité : certaines fonctionnalités avancées de l’API OpenAI n’ont pas d’équivalent dans Sonar (function calling avancé, file uploads natifs, assistants API). Et inversement, les citations web dans la réponse sont propres à Sonar et n’existent pas dans l’API OpenAI standard. La compatibilité est au niveau du chat de base, pas des fonctionnalités étendues.

Quel est le coût réel d’utilisation de l’API Sonar ?+

La tarification Sonar est à la consommation en dollars par million de tokens. En 2026, les tarifs approximatifs sont : sonar-small ~1$/million de tokens d’entrée et sortie, sonar ~1-2$/million selon les modèles utilisés, sonar-pro tarif premium (3-5× plus cher que sonar standard), sonar-deep-research tarif variable selon la profondeur de recherche.

Pour calibrer votre budget : une requête typique consomme entre 500 et 3000 tokens (question + contexte + réponse). Pour 1000 requêtes/mois avec sonar, comptez entre 1 et 6 dollars selon le volume de tokens. Pour un chatbot à fort volume (100 000 requêtes/mois), le budget monte rapidement et une négociation de tarifs Enterprise peut être nécessaire.

Pour démarrer, Perplexity offre un crédit gratuit à l’inscription sur la console API — suffisant pour faire vos premiers tests sans risque. Configurez des alertes de coût dans la console API pour éviter les mauvaises surprises si votre app génère plus de requêtes que prévu.

Peut-on accéder aux sources citées via l’API ?+

Oui, les citations sont disponibles dans la réponse API. Le champ citations de la réponse contient la liste des URLs des sources consultées pour générer la réponse. Dans votre application, vous pouvez afficher ces sources à côté de la réponse pour que vos utilisateurs puissent vérifier les informations.

La structure exacte des citations varie légèrement selon la version de l’API et le modèle utilisé. Dans les modèles récents, le contenu textuel de la réponse inclut des marqueurs de référence numérotés ([1], [2], etc.) qui correspondent aux URLs du tableau citations. C’est le même format que vous voyez dans l’interface web Perplexity.

Pour les applications où la traçabilité des sources est importante (applications juridiques, médicales, journalistiques), cette fonctionnalité est particulièrement précieuse. Vous pouvez afficher non seulement la réponse mais aussi les sources sur lesquelles elle s’appuie, ce que l’API OpenAI standard ne permet pas nativement.

L’API Sonar peut-elle être utilisée pour des chatbots en français ?+

Oui, et les résultats sont très bons pour les chatbots professionnels en français. Comme l’interface web, l’API Sonar cherche en priorité des sources francophones quand la question est en français. Pour un chatbot support sur un produit ou service français, vous obtenez des réponses sourcées sur des sites français.

Pour un chatbot en français, paramétrez votre system prompt en français avec des instructions précises sur le contexte et le ton attendu. Ajoutez des instructions du type ‘cite uniquement des sources françaises et officielles’ si vous voulez limiter les sources à des références françaises.

La limite sur le français via API est la même que via l’interface web : les sujets très spécialisés ou très locaux auront moins de sources françaises disponibles. Pour les sujets techniques ou très internationaux, les réponses peuvent mélanger des sources francophones et anglophones.

L’API Sonar supporte-t-elle le streaming des réponses ?+

Oui, le streaming (réception de la réponse token par token au lieu d’attendre la réponse complète) est supporté par l’API Sonar. La syntaxe est identique au streaming OpenAI : passez stream: True (Python) ou stream: true (Node.js) dans les paramètres de votre appel.

Le streaming améliore significativement la perception de performance dans les interfaces utilisateur — vos utilisateurs voient la réponse s’afficher progressivement plutôt d’attendre plusieurs secondes puis voir tout apparaître d’un coup. Pour les chatbots en temps réel, c’est une fonctionnalité essentielle.

Note technique : avec le streaming, les citations ne sont pas disponibles dans le flux de tokens mais arrivent à la fin de la réponse dans un message distinct. Si vous affiche les citations dans votre UI, gérez ce cas asynchrone séparément du flux de texte principal.

Peut-on filtrer les sources Sonar par domaine ou par date ?+

Oui, l’API Sonar propose des paramètres de filtrage des sources dans ses versions récentes. Vous pouvez spécifier des domaines à inclure ou exclure (search_domain_filter), et configurer une fenêtre temporelle pour les sources (search_recency_filter : ‘month’, ‘week’, ‘day’).

Ces filtres sont particulièrement utiles pour : concentrer les recherches sur des sources institutionnelles spécifiques (uniquement gouv.fr, uniquement les publications académiques), exclure des sources de mauvaise qualité ou concurrentes, ou forcer des informations très récentes (uniquement les 7 derniers jours pour une veille d’actualité).

La documentation officielle des paramètres disponibles est sur docs.perplexity.ai. Les filtres évoluent régulièrement avec les nouvelles versions de l’API — consultez la doc officielle pour les options les plus récentes plutôt que de vous fier à des articles qui peuvent être datés.

L’API Sonar est-elle adaptée pour du RAG avec des documents internes ?+

Non, et c’est important de bien comprendre la différence. L’API Sonar fait de la recherche sur le web public — elle interroge Internet, pas vos documents internes. Elle n’est pas conçue pour du RAG (Retrieval-Augmented Generation) sur des bases documentaires privées.

Pour du RAG sur vos propres documents, vous avez besoin d’une stack différente : un modèle d’embedding (nomic-embed-text, bge-m3), une base vectorielle (ChromaDB, Pinecone, Weaviate), et un LLM pour la synthèse (API OpenAI, API Anthropic). Open WebUI avec ChromaDB est une solution clé en main pour ça.

La combinaison possible : utilisez l’API Sonar pour les questions qui nécessitent des informations externes récentes du web, et votre propre stack RAG pour les questions sur vos documents internes. Votre orchestrateur (LangChain, LlamaIndex) peut router les requêtes vers la bonne source selon la nature de la question.

Peut-on tester l’API Sonar sans coder ?+

Oui, via le playground de l’API disponible sur la console Perplexity (console.perplexity.ai). Ce playground web vous permet de tester des requêtes API directement dans le navigateur sans écrire une ligne de code : vous entrez votre message, choisissez le modèle, et voyez la réponse avec les sources.

L’outil Postman ou Insomnia est une autre option no-code : importez la collection Perplexity (disponible dans la doc officielle) et testez des appels API visuellement en remplissant les champs. C’est la méthode que je recommande pour explorer les paramètres disponibles avant de coder.

Pour les équipes non-tech qui veulent évaluer si l’API Sonar convient à leur besoin sans impliquer les développeurs dès le départ, le playground est l’outil idéal. Testez vos cas d’usage concrets, évaluez la qualité des réponses et des sources, puis décidez d’intégrer ou non avant d’investir du temps de développement.

L’API Sonar propose-t-elle des rate limits élevés pour les applications à fort volume ?+

La console Perplexity affiche vos rate limits actuels. Les limites par défaut pour les nouveaux comptes sont modérées — suffisantes pour les tests et les applications à faible trafic. Pour les applications à fort volume (>100 requêtes par minute), des limites plus élevées nécessitent un contact avec l’équipe commerciale Perplexity.

Les rate limits se réfèrent au nombre de requêtes par minute et au nombre de tokens par minute. Deux limites séparées qui peuvent bloquer différemment selon votre pattern d’usage. Une application qui envoie peu de requêtes mais avec des prompts très longs peut bloquer sur le rate limit en tokens avant le rate limit en requêtes.

Pour les applications enterprise à fort volume, Perplexity propose des plans dédiés avec des rate limits élevés et un support prioritaire. Contactez directement l’équipe Perplexity (enterprise@perplexity.ai) si votre estimation de volume dépasse les limites standard du plan Pro API.

L’API Sonar respecte-t-elle le RGPD ?+

C’est une question légitime pour les développeurs qui construisent des applications destinées à des utilisateurs européens. Perplexity AI est une entreprise américaine dont les serveurs sont aux États-Unis. Les données transmises via l’API (vos prompts, le contexte des conversations) passent par leur infrastructure américaine.

Pour les applications B2B en Europe qui traitent des données personnelles, vous devez vérifier si Perplexity propose un Data Processing Agreement (DPA) conforme au RGPD. Contactez directement leur équipe commerciale pour les conditions contractuelles adaptées aux exigences européennes.

Alternative pour les cas avec contraintes RGPD strictes : utiliser une API d’un LLM européen (Mistral AI est français et offre une API avec hébergement européen) combiné avec votre propre système de recherche web si nécessaire. La combinaison est plus complexe à mettre en place mais garantit la souveraineté des données.

⭐ Ce que disent mes clients

Retrouvez-moi sur les réseaux

Analyses SEO, IA et veille Perplexity au quotidien.