基于相似产品的问答预测技术解析

基于相似产品的问答预测技术

社区产品问答(PQA)是电子商务网站的重要功能。顾客会提出诸如"这条牛仔裤洗后会缩水吗?"或"这个盘子能放进微波炉吗?"等问题,其他顾客则根据自身经验进行回答。

许多电商平台还提供自动问答工具,旨在顾客等待社区回复时即时解决问题。这些工具通常通过从已解决问题档案中检索潜在答案来工作。然而,由于产品新颖、罕见或 simply 未获得社区足够关注,很多时候无法找到相关的问答记录。

创新方法

研究人员提出了一种新颖方法,通过识别相似产品提出的相似问题来预测此类未回答问题的答案。该方法在四个步骤中运行:

步骤1:针对特定产品的新问题,算法检索数百条其他产品的问答记录。每条记录包含问答对和相关产品数据。由于需要在大规模语料库中进行检索,采用基于预训练嵌入的最近邻搜索这一快速但近似的方法来估计相似度。

步骤2:使用问题-问题相似度模型(更精确但较慢的神经模型,基于相似问题对训练)重新计算检索记录中问题与新问题的语义相似度。仅保留具有高语义相似度的记录。

步骤3:每条保留记录与当前问题记录一起传递到新开发的上下文产品相似度(CPS)模型。该模型在特定问题背景下估计两个产品的相似度。例如,两条牛仔裤在"能放进烘干机吗?"问题上可能相似,但在"有弹性吗?"问题上则不相似。

步骤4:最后使用CPS模型评分作为专家混合模型中答案的权重,预测客户问题的答案。

上下文产品相似度

CPS模型基于可扩展的无监督训练程序开发,该程序离线执行并利用大型已解决产品问题语料库——特别是是非问题或可用简单是/否回答的问题。

训练过程的关键要素是定位来自同一产品类别(如牛仔裤对)的产品对,这些产品对还具有高度相似的是非问题(如"有弹性吗?"和"会拉伸吗?")。通过这种自动无监督程序,生成大规模标注数据集用于训练CPS模型。

实际应用效果

在使用某中心PQA数据集中多个产品类别的是非问题进行的实验中,该方法预测是非答案的正确准确率在75%到80%之间,具体取决于可用相似产品的数量。

该方法的一个原创特性是,除了预测答案外,还返回作为预测基础的相似问题和答案。这些为顾客提供了模型预测的上下文和依据,即使预测不准确也能帮助顾客形成自己的判断。通过参考这些资源,顾客可以自行推断出正确答案。

研究人员持续改进模型,即使没有完美准确度,相信顾客已经能从中受益。返回用于答案预测的相关问答让顾客自行判断预测的可靠性。顾客与这些问答的互动,在辅助AI方法中,可以反馈给持续学习方法,帮助进一步改进预测。
更多精彩内容 请关注我的个人公众号 公众号(办公AI智能小助手)或者 我的个人博客 https://blog.qife122.com/
公众号二维码

posted @ 2025-09-02 16:20  CodeShare  阅读(24)  评论(0)    收藏  举报