Hello Guest

Sign In / Register

Welcome,{$name}!

/ Connectez - Out
Français
EnglishDeutschItaliaFrançais한국의русскийSvenskaNederlandespañolPortuguêspolskiSuomiGaeilgeSlovenskáSlovenijaČeštinaMelayuMagyarországHrvatskaDanskromânescIndonesiaΕλλάδαБългарски езикGalegolietuviųMaoriRepublika e ShqipërisëالعربيةአማርኛAzərbaycanEesti VabariikEuskera‎БеларусьLëtzebuergeschAyitiAfrikaansBosnaíslenskaCambodiaမြန်မာМонголулсМакедонскиmalaɡasʲພາສາລາວKurdîსაქართველოIsiXhosaفارسیisiZuluPilipinoසිංහලTürk diliTiếng ViệtहिंदीТоҷикӣاردوภาษาไทยO'zbekKongeriketবাংলা ভাষারChicheŵaSamoaSesothoCрпскиKiswahiliУкраїнаनेपालीעִבְרִיתپښتوКыргыз тилиҚазақшаCatalàCorsaLatviešuHausaગુજરાતીಕನ್ನಡkannaḍaमराठी
Accueil > Message > NVIDIA Open-source Nemotron-MinI-4B-Instruct Modèle AI pour le déploiement sur les appareils

NVIDIA Open-source Nemotron-MinI-4B-Instruct Modèle AI pour le déploiement sur les appareils

Le 15 septembre, MarkTechPost, un média technologique, a rapporté que NVIDIA avait open le modèle d'IA Nemotron-MinI-4B-Instruct, marquant une autre étape importante dans l'innovation de l'entreprise dans l'espace d'IA.

Le modèle AI Nemotron-MinI-4B-Istruct est spécialement conçu pour des tâches telles que le jeu de rôle, la génération (RAG) et les appels de fonction.Il s'agit d'un modèle de petit langage (SLM), distillé et optimisé à partir du plus grand modèle Nemotron-4 15B.

NVIDIA a utilisé des techniques d'IA avancées telles que l'élagage, la quantification et la distillation pour créer un modèle plus petit et plus efficace, ce qui le rend particulièrement adapté au déploiement sur les appareils.

Malgré sa taille réduite, les performances du modèle dans des scénarios spécifiques comme le jeu de rôle et les appels de fonction restent sans compromis, ce qui en fait un choix pratique pour les applications nécessitant des réponses rapides et à la demande.

Réglé sur le modèle de base minitron-4b, le modèle AI Nemotron-MinI-4B-Istruct incorpore la technologie de compression LLM.L'une de ses fonctionnalités les plus notables est sa capacité à gérer une fenêtre de contexte 4096, ce qui lui permet de générer des réponses plus longues et plus cohérentes.