ボタンナレッジベースをアップロードしなかった場合、「ファイルが壊れている」と誤解される可能性が高いですが、公開の問題でより一般的な状況は、解析、埋め込み、保存の3層のうち1つが整合していないことです。 見かけるエラーは「num_rows不整合」、「列サイズが一致しない」、「バッチサイズが無効です」、あるいは知識の読み込み失敗、画像解析の失敗、PDFの処理が半分しか進まなかった場合などです。
公式のCoze Studioオープンソースリポジトリは https://github.com/coze-dev/coze-studio です。 公式のREADMEでは、ナレッジベース、画像アップロード、モデル構成が基本コンポーネントや開発ガイドに記載されており、これは非常に明確です:ナレッジベースは単独で動作するのではなく、パーサー、埋め込み、基盤となるベクターライブラリに依存して正常に動作します。
急いで再送信せず、まずどのレイヤーがエラーを報告しているかを区別してください
文書分割や解析段階でエラーが発生する場合、通常はPDF、Word、CSV、画像などの入力ソースに問題があるか、OCR/解析サービスが接続されていないことが原因です。 ベクトル化フェーズで誤差が起きた場合、一般的な理由は埋め込み構成、寸法、バッチサイズが均一でないことです。 記憶段階で誤差が報告される場合、ベクトルライブラリのパラメータ書き込みの不一致が原因であることが多いです。
地域社会で最も一般的な状況の種類
- Excel、CSV、Wordはアップロード後に失敗し、最終的に解析された列構造やストレージの期待値が一貫していないことに気づきます。
- 画像ナレッジベースが故障した場合、通常はOCRや画像解析サービスが正常に戻るかどうかに依存します。
- PDFはアップロードされたように見えますが、続きがないため、解析や分割のステップが中断されていないか確認しなければならないことがよくあります。
最も実用的なトラブルシューティング手順
まずは一番シンプルな単一列でテストし、一度にたくさん通過しないでください。 埋め込み次元やバッチサイズが設定したモデルと整合しているか確認してください。 公共の問題では、バッチサイズが10を超えてはならないという制限に直面したり、ベクトル次元とコレクションの定義に不一致があると感じた人もいます。 最後に、ファイル形式自体がOCR、レイアウト解析、または専門的な解析コンポーネントを必要としているかを確認しましょう。
間違ったレベルを見ずにファイルを何度も変えるだけだと、堂々巡りを繰り返してしまいます。 ナレッジベースで最も恐れられている問題は、「ファイルの問題のように感じる」ことですが、実際には設定の問題です。
一文の結論
アップロードでバックルナレッジベースがアップロードされない場合は、まずファイルを変更しず、解析、埋め込み、ストレージのいずれかに問題があるかを区別してください。 誤差レベルを理解すれば、ポジショニングはずっと速くなります。