R&D | LightOn

Notre vision

Faire Progresser l'IA Générative par l'Innovation

L'équipe de R&D de LightOn joue un rôle essentiel dans l'avancement du domaine de l'IA générative grâce à une innovation et un développement continus. Leur expertise couvre la création et le perfectionnement de grands modèles de langage (LLM) qui constituent la base de la plateforme Paradigm, une solution d'IA complète conçue pour une utilisation en entreprise. Cette plateforme simplifie l'intégration de l'IA générative dans les flux de travail des entreprises, offrant des options sur site et dans le cloud pour garantir flexibilité et évolutivité en fonction des besoins de chaque entreprise.

Publications récentes

Lire l'article

Day Zero of Multi-Vector Retrieval

Introducing ColBERT-Zero: late interaction model trained from scratch with PyLate

February 19, 2026

CTA Title

Lorem Ipsum

Read post

Lire l'article

LightOnOCR-1B: Making Knowledge Machine-Readable

Introducing LightOnOCR-1B, a 1B parameter vision language model for OCR that pushes the Pareto frontier.

October 23, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

La révolution de la recherche (d’information) multi-vecteurs chez LightOn : de la recherche à la mise en production

Découvrez comment la late-interaction stack de LightOn — ModernBERT, PyLate et FastPlaid transforme la recherche sémantique et le retrieval en IA, en passant de la théorie académique aux systèmes de production.

August 25, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

FastPlaid : Amener la recherche multi-vecteurs à l’échelle de la production

FastPlaid est le moteur open source en Rust de LightOn pour la recherche à interaction tardive. La version 1.10.0 introduit des index actualisables de manière incrémentale — 6,5× plus rapides que Stanford PLAID, permettant à vos pipelines RAG, de recommandation ou de recherche d’évoluer en temps réel, sans interruption.

August 14, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

Introducing Ettin Suite: the SoTA open recipe to outperform existing Generative & Retrieval Models

Introducing Ettin, the first ever SOTA suite of paired encoder & decoder models, developed by Johns Hopkins University in collaboration with LightOn.

July 16, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

PyLate-rs: a lightweight tool to compute embeddings lightning-fast

PyLate-rs is a high-performance inference engine for PyLate models, meticulously crafted in Rust for optimal speed and efficiency.

July 8, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

LightOn met à niveau la recherche dans le RAG agentique avec son nouveau modèle de pointe : Reason-ModernColBERT

Après la récente sortie de GTE-ModernColBERT, un modèle dédié à la recherche d’information redéfinissant les standards de l’industrie par sa gestion des documents longs, LightOn annonce une nouvelle avancée dans la recherche d’information pilotée par l'IA : Reason-ModernColBERT, un modèle open-source multi-vecteurs spécialement conçu pour les applications de recherche approfondie (Deep Research).

May 22, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

LightOn redéfinit les standards de la recherche d’information complexe (RAG) avec GTE-ModernColBERT

Levier d’innovation clé pour les entreprises, les IA génératives sont confrontées à la complexité et la spécificité des données internes aux organisations. Aujourd’hui LightOn annonce la sortie de GTE-ModernColBERT, un modèle dédié à la recherche d’information redéfinissant les standards de l’industrie par sa gestion des documents longs et sa capacité de généralisation sur données complexes inconnues. Ce nouveau modèle surclasse ceux des acteurs de l’écosystème (Alibaba, Cohere, Snowflake, BAAI, JinaAI) sur le benchmark de référence LongEmbed.

April 30, 2025

CTA Title

Lorem Ipsum

Read post

Lire l'article

Finally, a Replacement for BERT

This blog post introduces ModernBERT, a family of state-of-the-art encoder-only models representing improvements over older generation encoders across the board.

December 19, 2024

CTA Title

Lorem Ipsum

Read post

Recherche & développement

Notre vision

Faire Progresser l'IA Générative par l'Innovation

Publications récentes

Day Zero of Multi-Vector Retrieval

CTA Title

LightOnOCR-1B: Making Knowledge Machine-Readable

CTA Title

La révolution de la recherche (d’information) multi-vecteurs chez LightOn : de la recherche à la mise en production

CTA Title

FastPlaid : Amener la recherche multi-vecteurs à l’échelle de la production

CTA Title

Introducing Ettin Suite: the SoTA open recipe to outperform existing Generative & Retrieval Models

CTA Title

PyLate-rs: a lightweight tool to compute embeddings lightning-fast

CTA Title

LightOn met à niveau la recherche dans le RAG agentique avec son nouveau modèle de pointe : Reason-ModernColBERT

CTA Title

LightOn redéfinit les standards de la recherche d’information complexe (RAG) avec GTE-ModernColBERT

CTA Title

Finally, a Replacement for BERT

CTA Title

Explorez les publications
de LightOn

Notre vision

Faire Progresser l'IA Générative par l'Innovation

Publications récentes

Day Zero of Multi-Vector Retrieval

CTA Title

LightOnOCR-1B: Making Knowledge Machine-Readable

CTA Title

La révolution de la recherche (d’information) multi-vecteurs chez LightOn : de la recherche à la mise en production

CTA Title

FastPlaid : Amener la recherche multi-vecteurs à l’échelle de la production

CTA Title

Introducing Ettin Suite: the SoTA open recipe to outperform existing Generative & Retrieval Models

CTA Title

PyLate-rs: a lightweight tool to compute embeddings lightning-fast

CTA Title

LightOn met à niveau la recherche dans le RAG agentique avec son nouveau modèle de pointe : Reason-ModernColBERT

CTA Title

LightOn redéfinit les standards de la recherche d’information complexe (RAG) avec GTE-ModernColBERT

CTA Title

Finally, a Replacement for BERT

CTA Title

Explorez les publications de LightOn

Explorez les publications
de LightOn