Version 0.6.10 de janvier : Importation de modèles visuels + réglage automatique, solution en une seule étape

L'outil d'IA local de Jan est disponible en version 0.6.10 : prise en charge de l'importation de modèles visuels, réglage automatique expérimental de llama.cpp et corrections de problèmes liés aux images jointes, au copier-coller et à la visibilité des clés API. Cette mise à jour unique couvre les principales expériences de création, de recherche et de déploiement privé local. Nouveautés de cette mise à jour ? 1. Importation de modèles visuels : exécution multimodale locale. Jan peut désormais importer des modèles visuels, ce qui permet à l'IA d'effectuer la compréhension d'images, l'analyse de captures d'écran et la reconnaissance de tableaux localement. Combiné aux modèles de texte, il crée une expérience privée « voir l'image + expliquer », équilibrant vitesse et confidentialité. 2. Réglage automatique de llama.cpp : meilleure compréhension de votre machine. De nouveaux paramètres expérimentaux ajustent automatiquement des paramètres tels que la quantification et le threading en fonction du matériel, réduisant ainsi les coûts de réglage manuel et obtenant un débit d'inférence plus stable sur la plupart des appareils.

3. Corrections de stabilité : Bugs mineurs courants corrigés

Les images jointes, les erreurs de copie et les problèmes d'affichage des clés API ont été corrigés, ce qui a réduit les interruptions de travail et les erreurs de manipulation, et amélioré la convivialité lors du partage et des présentations en équipe.

II. Scénarios de mise en œuvre et bonnes pratiques

1. Efficacité personnelle : Capture d'écran → Comprendre → Sortie

Après avoir importé le modèle visuel, Jan peut convertir les captures d'écran en puces et en listes d'étapes, ce qui est idéal pour les évaluations de produits, la vérification des rapports et la saisie de formulaires.

2. Collaboration d'équipe : Multimodalité locale sans fuite

Utilisez des modèles locaux pour traiter les images et les documents dans l'environnement intranet, en conservant les informations sensibles sur l'appareil. Le réglage automatique permet une utilisation prête à l'emploi sur différents matériels, minimisant ainsi les différences environnementales.

3. Ingénierie et flux de travail de données : léger et réutilisable

(1) Création de modèles : encapsuler « lire l'image - extraire - résumer » dans un processus

(2) Traitement par lots : analyser les captures d'écran et les numérisations par lots à l'aide d'un répertoire

(3) Contrôle qualité : comparaison d'échantillons de champs OCR/table, correction par écriture différée

a. Recommandations en matière de performances

Exécutez d'abord une ligne de base avec optimisation automatique, puis affinez les threads et la quantification en fonction de la taille du modèle.

b. Recommandations en matière de stockage

Activez la mise en cache des blocs et les sessions historiques, réutilisez les fonctionnalités et réduisez les calculs répétés.

c. Recommandations en matière de sécurité

Accordez uniquement les autorisations nécessaires à la clé API, effectuez-la une rotation régulière et activez la journalisation.

III. Liste de contrôle de mise à niveau et de dépannage

1. Étapes de mise à niveau

Sauvegardez les répertoires de session et de modèle → Mise à jour de janvier → Activez le réglage automatique expérimental → Importez le modèle de vision et exécutez les exemples.

2. FAQ

Réduisez la largeur de bits de quantification et la concurrence si la mémoire vidéo est insuffisante ; vérifiez la résolution et le format si les images ne parviennent pas à être analysées ; les anomalies de copie ont été corrigées dans cette version ; si les anomalies persistent, réinitialisez le cache.

3. Mesures d'évaluation

Prenez en compte le débit, la latence du premier mot, la précision de l'analyse et le taux de retouche manuelle pour déterminer si des ajustements de paramètres supplémentaires sont nécessaires.

Foire aux questions (Q&R)

Q : Comment importer un modèle de vision et activer la multimodalité locale dans Jan ?

R : Ajoutez le fichier de modèle visuel ou le chemin d'accès à l'entrepôt dans les paramètres et sélectionnez le backend d'inférence correspondant pour intégrer « entrée d'image + sortie de texte » dans le même processus de conversation.

Q : Le fichier llama.cpp réglé automatiquement remplacera-t-il mes paramètres manuels ?

R : La configuration expérimentale par défaut fournit des paramètres recommandés, qui peuvent être remplacés dans les paramètres avancés. Il est recommandé d'utiliser le réglage automatique pour exécuter d'abord une ligne de base, puis d'affiner les threads et le niveau de quantification.

Q : Quels problèmes affectant l'expérience utilisateur sont corrigés dans cette version ?

R : Les principaux correctifs concernent les échecs d’attachement d’images, les exceptions de copier-coller et la visibilité des clés API. Après la mise à jour, les scénarios concernés sont plus stables et adaptés aux démonstrations et à la collaboration.

Q : Le modèle visuel peut-il être exécuté sans problème sur des machines plus anciennes ?

R : Vous pouvez commencer avec un modèle visuel de petite taille ou à plus forte quantification et activer le réglage automatique et la limitation de la résolution. Si nécessaire, adoptez une méthode d’analyse en deux étapes : « mise à l’échelle d’abord, puis affinement ».

Articles connexes

Kimi : Guide complet des outils d'IA pour textes longs : fonctionnalités, tarifs et fonctionnement

Guide d'utilisation de Tencent Yuanbao : un guide pour améliorer l'efficacité des travailleurs et des étudiants

Kimi K3 officiellement lancé : 2,8 trillions de paramètres misant sur des millions de contextes et un poids ouvert

Mistral Studio ajoute la gestion des versions de prompts : l’IA d’entreprise gère désormais les actifs comportementaux

Outils Recommandés