Les systèmes d'IA génératifs nécessitent des ressources de calcul, de mémoire et de stockage importantes.Alors que l'IA a le potentiel de provoquer des percées transformatrices dans toutes les industries, son déploiement comporte souvent des coûts élevés.Le RAG est une étape cruciale dans le développement de l'IA, affinant les modèles de grande langue (LLM) en tirant parti des données spécifiques à l'application ou à l'entreprise.
Au cœur de RAG se trouve une base de données vectorielle, qui accumule et convertit les données spécifiques au domaine en vecteurs de caractéristiques.Le RAG s'appuie également sur les algorithmes ANNS pour identifier les vecteurs qui améliorent le modèle en évaluant la similitude entre les vecteurs accumulés et cibles.Pour être efficace, RAG doit récupérer rapidement les informations les plus pertinentes.Traditionnellement, des algorithmes ANNS ont été déployés dans DRAM pour atteindre les performances à grande vitesse requises.
La technologie Koxia AISAQ offre une solution ANNS évolutive et efficace capable de gérer des ensembles de données à l'échelle des milliards avec une utilisation minimale de mémoire et des capacités de commutation d'index rapide.