某家居零售巨头 · 定制大模型优化商品搜索

项目背景

某全球家居零售巨头拥有数百万 SKU，传统关键词搜索准确率低，用户难以通过自然语言精准找到目标商品，搜索放弃率高。

本项目被业界视为"大模型+垂直场景"的标杆实践，为零售行业 AI 应用提供了可复制的方法论。

大模型接入层

统一 LLM Adapter 接口（支持 OpenAI / 文心一言 / 通义千问 / Claude），配置化热切换模型。Token 用量实时监控（按用户/会话维度统计），超预算自动熔断并告警（企微机器人）。Prompt 版本管理（Git 式 diff 对比），线上回滚 < 10s。

向量检索系统

text-embedding-3-small 生成 1536 维向量，Milvus 2.3（HNSW 索引，`ef`=200）存储 200w+ 知识片段。多路召回：向量相似度 Top-5 + BM25 关键词加权 + Cohere Rerank 重排，最终取 Top-3，准确率 92.4%。

Prompt 工程

四阶段 Prompt 链：意图识别（Few-shot × 8 示例）→ 知识检索（Top-3 向量片段）→ 上下文组装（Token 预算 6000）→ 答案生成（temperature=0.3）。支持用户反馈「点赞/点踩」闭环，低分回答自动进入人工审核队列。

效果监控体系

会话级埋点：首 Token 延迟（P95 < 2.1s）、拒答率（6.2%）、满意度评分（平均 4.3/5）。高频无效问题聚类（DBSCAN）自动生成知识库补充建议。A/B 测试框架：不同 Prompt 版本流量按比例分配，3 天自动收敛至最优版本。

核心技术栈： OpenAI API LangChain Milvus Python 3.11 FastAPI Vector DB