RAG时代也要懂的召回和排序逻辑
无论是之前的搜索、问答、推荐还是目前基于大模型的RAG,召回和排序仍然是核心的两个工程模块。召回排序在不同场景有很多不同的算法和工程化实现方式,我们简单聊下其中的有代表性的方法。
召回是从海量数据中筛选出与用户Query相关的候选集,需平衡相关性和覆盖率:
排序阶段需对召回结果精细化打分,核心目标是提升意图准确率:
**1)特征工程:**提取Query与文档的匹配特征(如TF-IDF、BM25)、用户行为特征(点击率、停留时长)、内容质量特征(权威性、时效性)等。
2)分阶段排序
**3)多目标优化:**平衡相关性和商业目标(如广告收入),通过多任务学习或强化学习动态调整权重。
**1)效果评估与AB测试:**监控准确率、召回率、CTR、转化率等指标,通过AB实验验证策略有效性。例如,对比语义召回与传统召回的CTR差异。
2)Query理解优化
**3)个性化与场景化:**根据用户设备、地理位置、搜索场景(如电商、资讯)动态调整策略。例如,电商搜索优先召回促销商品。
**4)长尾问题处理:**针对低频Query,采用语义召回或热门结果兜底策略,减少零少结果率。
生成式引擎优化(GEO):通过调整内容呈现形式,适配生成式AI的检索偏好(如结构化信息、简洁描述)。
RAG技术:结合检索增强生成(Retrieval-Augmented Generation),提升答案的准确性和上下文连贯性。
TF-IDF:词频-逆词频,核心思想是,一个词的重要性与它在当前文档中出现的频率成正比,但与它在整个语料库中出现的频率成反比。
BM25:(Best Match 25)是一种经典的信息检索算法,用于衡量查询(Query)与文档(Document)的相关性,广泛应用于搜索引擎、推荐系统召回阶段等场景。其核心思想是通过统计学方法对文档中的关键词权重进行综合评估,是传统检索模型中的标杆算法。
**Wide & Deep **
核心思想是联合训练线性模型(Wide)与深度神经网络(Deep),兼顾记忆(Memorization)与泛化(Generalization)能力,用于用户点击率(CTR)预测和推荐系统。
核心创新是引入注意力机制,动态捕捉用户多样且变化的兴趣,解决传统模型对用户行为序列建模的不足。
**Wide & Deep和DIN对比 **
本文由 @福田贝叶斯 原创发布于人人都是产品经理。未经作者许可,禁止转载
题图来自Unsplash,基于CC0协议
该文观点仅代表作者本人,人人都是产品经理平台仅提供信息存储空间服务