深度搜索

本章节详细介绍了 HRAG 系统中的深度搜索组件在 MultiHop-RAG 数据集上的使用。其能够处理需要多步推理的复杂问题。该组件通过结合语义检索、信息提取和批判性推理，逐步收集和整合信息，最终生成准确的答案。

深度搜索在 MultiHop-RAG 数据集上的使用流程包括四个主要步骤：

数据准备 

运行以下脚本以下载并保存所需的数据集：

python src/deepsearch/data/get_data.py

该脚本将自动从 Hugging Face 下载 yixuantt/MultiHopRAG 数据集，并将以下两个文件保存到本地：

语料库需先进行向量化嵌入，并建立 Milvus 索引。执行以下脚本：

python src/deepsearch/data/retrieval_corpus.py

该脚本功能包括：

问答系统基于 Agent 框架自动执行多轮检索与思考。使用以下命令运行生成模块：

python src/deepsearch/multi_hop_qa.py

或运行完整流程测试脚本：

python tests/test_multi_hop_qa.py

该模块执行以下功能：

完成问答生成后，可以执行以下命令对结果进行评估：

python src/deepsearch/qa_evaluate.py

或继续运行测试脚本 `test_multi_hop_qa.py`（已包含评估步骤）：

python tests/test_multi_hop_qa.py

评估结果会按照问题类型（如 multi-hop、comparison 等）分类展示，同时给出整体平均指标。