L’échec du téléchargement de la base de connaissances Coze est le plus susceptible d’être confondu avec « fichier est cassé », mais la situation la plus courante dans les problèmes publics est qu’une des trois couches d’analyse, d’intégration et de stockage n’est pas alignée. L’erreur que vous verrez peut être « num_rows » incohérente, « taille de colonne non correspondante », « taille de lot invalide », ou bien que la connaissance n’a pas fonctionné, l’analyse syntaxique d’image a échoué, ou que le PDF n’a été traité qu’à moitié.
Les dépôts officiels open source de Coze Studio sont https://github.com/coze-dev/coze-studio. Le README officiel place la base de connaissances, le téléchargement d’images et la configuration du modèle dans les composants de base et les guides de développement, ce qui est en fait très clair : la base de connaissances ne fonctionne pas seule, elle dépend du parser, de l’intégration et de la bibliothèque vectorielle sous-jacente pour fonctionner normalement.
Ne vous précipitez pas pour retransmettre le document, d’abord distinguez quelle couche signale l’erreur
Si l’erreur survient lors de la phase de séparation ou d’analyse du document, elle est généralement due à un problème avec les sources d’entrée telles que PDF, Word, CSV et images, ou bien le service OCR/analyse n’est pas connecté. Si l’erreur survient lors de la phase de vectorisation, la raison courante est que la configuration d’inclusion, les dimensions et la taille du lot ne sont pas uniformes. Lorsque l’erreur est signalée à l’étape de stockage, elle est souvent un désaccord dans les paramètres d’écriture de la bibliothèque vectorielle.
Les types de situations les plus courants dans la communauté
- Excel, CSV et Word échouent après le téléchargement, et découvrent finalement que la structure des colonnes analysées et les attentes de stockage sont incohérentes.
- Lorsque la base de connaissances d’image échoue, cela dépend généralement du retour normal de l’OCR ou du service d’analyse d’images.
- Le PDF semble avoir été téléchargé, mais il ne continue pas, donc je dois souvent vérifier si les étapes d’analyse et de segmentation sont interrompues.
La séquence de dépannage la plus pratique
Testez d’abord avec la file indienne la plus simple, ne passez pas plusieurs d’un coup. Vérifiez si la dimension d’embedding et la taille du lot sont cohérentes avec le modèle que vous avez configuré. En public, certaines personnes ont rencontré la restriction selon laquelle la taille du lot ne peut pas dépasser 10, et d’autres ont rencontré des incohérences entre les dimensions vectorielles et les définitions des collections. Enfin, vérifiez si le type de fichier lui-même nécessite de la reconnaissance OCR, de l’analyse de la mise en page ou des composants d’analyse syntaxique spécialisés.
Si vous changez de fichiers à répétition sans regarder au mauvais niveau, vous continuez souvent à tourner en rond. Le problème le plus redouté de la base de connaissances est qu’elle « ressemble à un problème de fichiers », alors qu’en réalité, c’est un problème de configuration.
Conclusion d’une phrase
Si la base de connaissances de Coze ne télécharge pas, ne modifiez pas le fichier en premier, mais distinguez s’il y a un problème d’analyse, d’intégration ou de stockage. Si vous comprenez le niveau d’erreur, le positionnement sera beaucoup plus rapide.