项目背景

某全球家居零售巨头拥有数百万 SKU,传统关键词搜索准确率低,用户难以通过自然语言精准找到目标商品,搜索放弃率高。

技术方案

  • 联合 OpenAI 微调定制 GPT 模型,注入商品领域知识
  • 语义理解替代关键词匹配,支持自然语言商品搜索
  • 智能标签生成,商品标注准确率大幅提升
  • 错误检测模块,自动识别标注异常商品

核心成果

指标优化前优化后
标签准确率基准↑ 20%
错误检测能力基准↑ 60%
搜索转化率基准↑ 18%

行业意义

本项目被业界视为"大模型+垂直场景"的标杆实践,为零售行业 AI 应用提供了可复制的方法论。

AI 技术实现深度解析

大模型接入层

统一 LLM Adapter 接口(支持 OpenAI / 文心一言 / 通义千问 / Claude),配置化热切换模型。Token 用量实时监控(按用户/会话维度统计),超预算自动熔断并告警(企微机器人)。Prompt 版本管理(Git 式 diff 对比),线上回滚 < 10s。

向量检索系统

text-embedding-3-small 生成 1536 维向量,Milvus 2.3(HNSW 索引,`ef`=200)存储 200w+ 知识片段。多路召回:向量相似度 Top-5 + BM25 关键词加权 + Cohere Rerank 重排,最终取 Top-3,准确率 92.4%。

Prompt 工程

四阶段 Prompt 链:意图识别(Few-shot × 8 示例)→ 知识检索(Top-3 向量片段)→ 上下文组装(Token 预算 6000)→ 答案生成(temperature=0.3)。支持用户反馈「点赞/点踩」闭环,低分回答自动进入人工审核队列。

效果监控体系

会话级埋点:首 Token 延迟(P95 < 2.1s)、拒答率(6.2%)、满意度评分(平均 4.3/5)。高频无效问题聚类(DBSCAN)自动生成知识库补充建议。A/B 测试框架:不同 Prompt 版本流量按比例分配,3 天自动收敛至最优版本。

核心技术栈: OpenAI API LangChain Milvus Python 3.11 FastAPI Vector DB