Difyで社内FAQを構築する — チャンク分割と検索精度の実務ガイド

社内FAQの自動化は、Difyで最初に取り組むのに適したワークフローです。ただし現場では「モデルは合っているはずなのに回答がずれる」という声をよく聞きます。原因の多くは、モデルの精度そのものではなく、その手前の「取り込み設計」にあります。

この記事のゴール チャンク分割・メタデータ設計・検索設定について、「実装するときに具体的に何を決めるか」レベルで整理します。

1. なぜ「取り込み」で結果が決まるのか

RAG (Retrieval-Augmented Generation) の回答精度は、大きく分けて次の3つのフェーズで決まります。

このうちDifyのUI上で最も"あとから修正が効きにくい"のがIngestです。チャンク境界を後から変えると、埋め込み計算からやり直す必要があるため、最初の設計判断が長く尾を引きます。

社内FAQ・規程を扱う場合、原則として「意味の切れ目」でチャンクを切ります。機械的な文字数分割は、規程条文のような構造化文書では相性が悪いです。

# 例: マニュアルの分割ルール (擬似)
split_rules:
  - by: heading
    levels: [h2, h3]
  - max_tokens: 800
  - overlap: 80

オーバーラップは 5〜10% を目安に。大きくしすぎると重複ヒットが増え、リランクの負荷とコストが跳ねます。

この記事に対応するワークフロー

この記事で扱った取り込み設計を組み込んだDifyワークフローを公開しています。

チャンクにメタデータを付けておくと、後段の絞り込みが劇的に楽になります。最低限、次の3つは付けておきたいところです。

特に access_scope は、後から権限モデルを乗せる時に効いてきます。「一度もフィルタしないRAG」は本番運用に耐えないため、最初から用意しておきます。

結論から言うと、FAQ用途では"入れておく方が事故が少ない"です。ベクトル検索のトップ5〜10件を対象にリランクを噛ませることで、「意味は近いが的外れ」なチャンクを弾けます。

リランクは万能ではありません。取り込み設計が破綻していると、「悪いチャンクを丁寧に並べ替える」だけの結果になります。順序が大事です。

社内利用では「その回答、どの文書から来た?」が問われます。回答テンプレートに出典 (ドキュメント名 + 章タイトル) を必ず含める指示を入れ、 UIでも同時に表示するのが望ましいです。

運用のヒント 「わからない時はわからないと答える」制約と、低確度時の人手エスカレーション導線を、必ず同時に設計します。

社内FAQの精度は、モデルよりも取り込み設計で決まります。次のステップとして、実際にワークフローテンプレートを触ってみるのがおすすめです。

この記事に関連するユースケース

Coming

この記事の運用フェーズを支える「ベンダー別ハブ」「関連ツール一覧」を準備しています。公開時にはこの記事から直接リンクします。

/vendors/cloudflare

/tools/vector-db

/topics/rag-eval