The RAG API
Upload, Search, Reason
RAG multimodal prêt pour la production. Un seul appel API. Aucun GPU à gérer, aucun parser à surveiller, aucune vector DB à scaler.
REST API
OpenAPI V3
LLM Agnostic
SOC 2 Type 1


COMMENT ÇA MARCHE
Document brut → réponse sourcée
LightOnOCR-2 • 1B
Ingestion & parsing
Ingérez en masse votre base documentaire via un seul appel API. Synchronisez depuis SharePoint, Teams ou ServiceNow. Le moteur de parsing obtient un score de 83,2 sur OlmOCRBench — devançant tous les systèmes évalués, y compris des modèles 9× plus grands.
NextPlaid • Rust • Optimisé CPU
Chunking & indexation
Le découpage intelligent préserve le contexte. La base de données multi-vecteurs indexe chaque chunk avec une précision au token près — retrouvant le paragraphe exact dans un manuel de 200 pages, pas seulement « un document proche ».
LateOn • Multi-vector Retrieval
Retrieval & reranking
Les pages candidates sont récupérées, puis évaluées individuellement. Parmi les pages 3, 4 et 6 : « Page 3 pertinente. Page 4 non. Page 6 oui. » Seul le contenu pertinent atteint le LLM. Le bruit est éliminé.
Any LLM • Grounded Output
Raisonnement & génération
Le contenu filtré est transmis au LLM de votre choix. Sélectionnez le modèle selon vos contraintes de coût, latence ou performance : open source, souverain ou commercial.
Le plus difficile n'est pas de construire un pipeline RAG, c'est de le maintenir à jour. Nous gérons chaque mise à jour, chaque migration, chaque mois. Votre intégration reste stable. Votre produit reste en avance.
Buy vs. Build
Vous avez construit un RAG interne
Il faut maintenant le faire passer à l’échelle
Il faut maintenant le faire passer à l’échelle
Maintenance des parsers, mises à jour des modèles, cas limites de chunking, scalabilité de la vector DB, c’est un travail d’infrastructure, pas produit.
Externalisez la plomberie et gardez le contrôle.
Sans LightOn API
Votre réalité actuelle
Maintenance continue
Des parsers, de l’OCR, et de la logique de chunking.
Implémentation ACL sur mesure
Synchronisée avec votre IAM.
Mise à l’échelle GPU
Et optimisation de l’inférence.
Mises à niveau de modèles
Tests de non-régression.
Avec LightOn API
Votre réalité potentielle
Endpoint d’ingestion universel
PDF, Office, scans, HTML. Nous gérons l’extraction et le chunking sémantique.
Isolation native par Workspace et Collection
Intégration SSO/SAML, journaux d’audit disponibles par défaut.
Pipeline managé
Optimisé pour des déploiements à faible empreinte (on-premise ou private cloud).
API versionnée (V3)
Rétrocompatibilité, déploiement progressif maîtrisé.
pourquoi LightOn API
Ce que vous obtenez
et ne pouvez ni construire ni acheter ailleurs
et ne pouvez ni construire ni acheter ailleurs
Capacités
DIY RAG
Legacy Search
Cloud RAG
LightOn API
Tableaux et schémas complexes
Casse
Texte seul
Basique
OCR-2 natif
Précision de recherche
mono-vecteur
mots-clés
mono-vecteur
Multi-vecteur
On-premise / air-gapped
DIY complexe
Possible
Cloud uniquement
3 GPUs
Application des ACL
DIY
Partiel
Variable
Niveau document
Flexibilité LLM
Verrouillé
N/A
Fournisseur
Agnostique
Time to production
6-12 mois
2-3 mois
1-2 mois
Immédiat
Hardware Efficiency
Un maximum d’intelligence
Un minimum d’empreinte matérielle
Un minimum d’empreinte matérielle
L’IA d’entreprise ne devrait pas nécessiter une centrale nucléaire.
Notre Search est conçu pour fonctionner sur des infrastructures contraintes (on-premise ou private cloud), en maximisant le ratio « performance par token ».
Notre Search est conçu pour fonctionner sur des infrastructures contraintes (on-premise ou private cloud), en maximisant le ratio « performance par token ».
Optimisé
Nous construisons et fine-tunons des modèles spécifiques aux tâches RAG.
Maîtrise de la quantization
Inférence rapide avec une faible consommation de VRAM.
Mise à l’échelle efficiente
Augmentez l’usage de l’API sans faire exploser votre budget GPU de manière linéaire.
Developers use cases
Que construirez-vous ?
Intégrer Search dans votre ERP
Fonctionnalité. Utilisez notre Search API pour ajouter un bouton « Chat with Invoice » directement dans votre UI SAP ou Salesforce.
Embed Search


Agent de support automatisé
Fonctionnalité. Construisez un worker en arrière-plan qui ingère les tickets, interroge votre Collection « Technical Documentation » et prépare un brouillon de réponse pour l’agent support.
Automated Support Agent


Pipeline d’analyse juridique
Fonctionnalité. Créez un workflow qui uploade des contrats dans un Workspace sécurisé et déclenche automatiquement un prompt d’analyse de risques.
Legal Analysis Pipeline


Developer Experience
Conçue par des développeurs,
pour des développeurs.
pour des développeurs.
Documentation complète
Spécifications Swagger/OpenAPI V3, guides « Quick Start » et recettes détaillées dans la Paradigm Academy.
Protocoles standards
Architecture REST facile à consommer depuis Python, Node.js, Java ou Go.
Extensibilité native
Besoin de connecter des outils live ? L’API supporte le Model Context Protocol (MCP) pour donner à l’IA accès à vos APIs internes.
deployment
Déployez en toute confiance
Sécurité et conformité
Certifications clés (SOC 2 Type 1)
Hébergement flexible (private cloud, on-premise, air-gapped)
Audit et traçabilité (suivi complet des activités)
Gestion des accès et intégration
Single Sign-On (SSO) et SCIM
Permissions fines (ACL) par utilisateur et par groupe
Synchronisation des groupes
Pilotage et accompagnement
Maîtrise des budgets (tarification forfaitaire et prévisible)
Personnalisation avancée (adaptée à vos besoins spécifiques)
Support expert dédié (accompagnement à l’implémentation)
Ne nous croyez pas sur parole
Découvrez comment nos clients innovent plus vite avec LightOn

L'expertise de leur équipe technique et l'évolution rapide du produit, comme la fonctionnalité de recherche hybride, les placent à l'avant-garde de l'innovation.

Jérôme Lacaille
Emeritus Expert in Algorithms
Emeritus Expert in Algorithms
%201.png)

Babbar doit trouver de nouveaux outils pour améliorer la stratégie SEO de ses clients et rester compétitif dans une industrie dynamique.

Sylvain Peyronnet
Co-founder & search engine specialist
Co-founder & search engine specialist


LightOn a répondu très rapidement avec des outils parfaitement adaptés à nos besoins, améliorant notre base documentaire et intégrant des utilisateurs sans expérience.

Achille Lerpinière
Chief Information & Technology Officer
Chief Information & Technology Officer
Construit sur la recherche Open Source.
Testé et approuvé par la communauté.
Testé et approuvé par la communauté.
42,060,936
Téléchargements sur Hugging Face
ModernBERT
LightOnOCR-2
GTE-ModernColBERT
LateOn-code
ColBERT-Zero
OriOn
...
3,239
Likes Hugging Face
ModernBERT
LightOnOCR-2
GTE-ModernColBERT
LateOn-code
ColBERT-Zero
OriOn
...
2,035
Stars Github
PyLate
NextPlaid
FastPlaid
ColGrep
PyLate-rs
...
534,000
Téléchargements PyPi
PyLate
NextPlaid
FastPlaid
ColGrep
PyLate-rs
...