电商搜索中的用户搜索意图识别
引言
在电商网站的搜索框中,用户输入的每一次查询背后都蕴含着一定的搜索意图。准确识别用户意图对于提升搜索相关性和用户体验至关重要。如果搜索引擎误解了用户想要的内容,可能导致搜索结果不符合期望,用户找不到需要的商品或信息,进而造成业务损失。因此,现代电商搜索引擎越来越像一位聪明的销售顾问,需要迅速判断出顾客的需求类型,然后提供恰当的结果。这一过程并不容易——正如早期研究所言,“仅凭查询推断用户意图充其量是不精确的科学,通常近似于瞎猜”。尽管如此,通过多方面技术手段,我们可以在电商场景中更好地猜测和把握用户的真实意图,从而优化搜索功能。
本文将围绕电商搜索中的用户意图识别展开,内容包括电商搜索常见的用户意图类型及其重要性,主流的意图识别方法(如基于查询文本分析、用户行为以及深度学习模型等),电商场景中特有的挑战(长尾查询、意图歧义、冷启动问题等),以及工程实践中的解决方案与经验(数据集构建、模型部署、与排序系统协同等)。旨在为从事搜索工程的研究人员提供系统性的参考。
电商搜索中的用户意图类型及重要性
搜索意图通常被分为三大类:导航型(Navigational)、信息型(Informational)和交易型(Transactional)。导航型意图指用户想直接到达某个特定的网站或页面;信息型意图指用户寻求某方面的知识或答案;交易型意图则表示用户希望执行某种交易行为(例如购买商品或下载文件)。在实际应用中,有些研究和业界实践会进一步细分出商业调查型(Commercial Investigational)查询,介于信息型和交易型之间,指用户在购买前进行产品比较和调研的搜索。不过总体而言,大部分搜索场景下仍以前三类意图为主。
在电商搜索中,这些意图类型都有所体现,并且都十分重要。电商网站的核心目标是促进交易,因此交易型查询直接与购买意愿相关,往往被认为最有价值。用户在搜索具体商品(例如“一加9手机壳”)或带有购买词汇(如“买”“优惠”)的查询通常是交易型意图,搜索引擎需要着重返回可购买的商品列表以满足需求。然而,如果只关注交易型,忽视其他类型,将可能错失用户的早期触达机会。研究表明,在电商环境中相当大比例的用户搜索其实属于信息型探索——一些用户有高达40%~65%的搜索目的在于获取信息、浏览新品而非立即下单。这些用户可能在寻找产品评测、导购指南或问题解答。对于这类查询,提供丰富的信息(如商品评价、问答内容或导购文章)有助于留住用户,为后续转化奠定基础。同样,导航型查询在电商中也不少见,例如用户搜索品牌名称或店铺名(“耐克官方旗舰店”),此时搜索意图是直达目标页面。如果搜索系统能识别出导航意图,就可以直接返回品牌专区或店铺链接,简化用户操作。
总之,不同意图的查询在电商搜索流量中均占有一定比例,各有其重要性。精准地区分这些意图,有助于搜索引擎“对症下药”:导航型意图直达目标,信息型意图提供内容帮助,交易型意图突出商品和促销。相反,如果意图判断错误,比如将本是信息查询的用户直接带到商品购买页,可能适得其反。因此,明确用户意图类型是电商搜索优化的基础工作之一。
主流的用户意图识别方法
查询分析与分类
基于查询文本的分析与分类是最直接的意图识别方法,即从用户输入的查询本身出发,提取特征并判断其意图类别。传统做法往往依赖于关键词和N-gram特征:由于查询中的关键词往往暗示了用户要找的内容或商品类别,我们可以将查询中的单词、短语作为特征进行分类。例如,查询长度、是否包含疑问词(如“如何”、“是什么”)可以作为线索——包含问句格式的多为信息型查询,而带有商品规格或价格的多为交易型查询。同时,查询中的词频统计、N元语法片段等都可作为输入特征,用于训练一个分类模型。举例来说,如果用户搜索“耐克 跑鞋 黑色”,出现品牌名+产品类型的模式,很可能意图是寻找商品(交易型)。
然而,仅靠简单的关键词匹配往往不足以处理短查询的多义性和上下文含义。这时需要引入上下文理解和更丰富的特征。一方面,可以利用行业领域知识库或同义词词典,将查询词映射到标准化的商品类别或属性上,提高理解正确率。例如,“苹果笔记本电源”中的“苹果”应识别为品牌而非水果,通过商品品牌词典可辅助判断。另一方面,查询的上下文不仅指语言上下文,还包括会话上下文(用户在本次会话中之前搜索了什么)和业务上下文(比如当前所在类目或热门趋势)。上下文信息有助于意图判别:如果用户刚浏览了某商品详情页然后在站内搜索,很可能下一步是交易导向。同样地,查询词序和组合也提供线索,比如“附近 自行车 店铺”与“自行车 附近 店铺”虽然词相同但语义略异,需要基于短语结构理解用户想找的是附近的自行车店。
随着机器学习的发展,监督分类模型被广泛用于查询意图识别。早期有研究将查询分类视为一个多类别分类问题,可以采用朴素贝叶斯、SVM等模型,以N-gram等文本特征为输入进行训练。近年更先进的方法则借助词向量和深度表示:例如利用词嵌入(Word Embedding)将查询映射为稠密向量表示,或者使用预训练语言模型(如BERT)的上下文嵌入来获取查询语义特征。这些深度表示往往比手工特征更能捕捉查询的潜在含义。例如,通过BERT模型可以理解“苹果笔记本”和“Apple laptop”实际上对应相同的商品类别,即使字面不一样。利用嵌入向量作为特征,再接上分类层,可以提高意图分类的效果。
此外,还有一些增强查询分析的方法值得一提:其一是层次化的查询分类,即不仅判断大类意图,还将查询映射到细粒度的商品类别或目录。例如亚马逊会将查询意图定义为具体的产品类型,在内部有一个包含数万节点的产品类型本体(ontology)用于分类。查询“oneplus 9”的意图可细化为“手机”,查询“skechers”(斯凯奇,美国鞋类品牌)的意图是“鞋”。这种把查询归入商品品类的做法,本质上也是意图识别的一种,在电商中非常实用。其二是查询理解管道中先分类后解析的策略:工程实践中常将意图分类作为查询解析的第一步,然后再根据意图选择不同的后续处理。例如某电商搜索系统采用“意图分类 -> 显式属性解析 -> 隐式属性推荐”三段式流程。先判断用户想找的商品大类(意图),再从查询中抽取具体的属性词(品牌、规格等),最后甚至根据意图和已知属性推荐用户可能还需要的其他属性(比如根据用户搜索OnePlus 9手机,推荐相关配件如手机壳)。这一系列操作的起点都依赖于准确的意图分类。
用户行为分析
单靠查询文字有时难以断定用户真实意图,此时用户行为数据提供了宝贵的线索。电商平台上,用户的点击、浏览、收藏、购买等行为都被记录在日志中,这些点击流日志和转化率数据能够反映某类查询背后的典型目的。例如,如果某查询经常带来高点击率且最终购买转化率也很高,可推断这类查询多半是强交易意图;相反,如果用户搜索后往往只浏览内容页面或问答而无购买,则更可能是信息意图。通过分析历史日志,可以对每个查询的行为模式进行归类,从而推测新出现的同类查询的意图倾向。实际上,业界常用用户行为来辅助生成训练数据:例如将过去一年中每个查询在各商品类型上的点击次数汇总,某查询点击最多的品类可作为其意图标签,用于训练意图分类模型。这种基于用户群体行为的弱标注方法,减少了人工标注工作,使大规模意图模型成为可能。
除了静态地统计指标,会话级别的用户行为分析也很重要。一个查询往往不是孤立的,结合用户在一次搜索会话中的操作序列,可以更精准地判断意图。例如用户先搜索“大屏手机性价比”,随后点击了一篇评测文章,又搜索了“红米Note 12”,紧接着浏览了商品详情并加入购物车——这个过程中用户意图从信息获取逐渐变为购买决策。通过序列建模或实时跟踪,我们可以检测到用户意图的转变,并相应地调整搜索推荐策略。在工程上,一些做法会针对短会话推断当前阶段的意图:比如如果检测到用户正处于浏览探索阶段(多次使用分类筛选、没有立即购买),那么Ranking模型可能更注重丰富度和多样性;而当用户处于精准搜索阶段(输入具体型号、直接加入购物车),Ranking则偏重精准匹配和销量权重。
值得注意的是,不同意图的用户行为模式存在显著差异。研究表明,在电商搜索中可以区分**“探索式”和“目标式”两种典型行为:前者表现为用户通过导航分类页面浏览商品(例如按类别/属性逐步筛选),后者则是用户带着明确购买意图使用关键词直接搜索。数据显示浏览式查询的点击后购买率明显低于直接关键词搜索的查询。这提示我们,用户行为(浏览 vs. 直接搜索)本身也是意图的体现。实际系统可以利用这些模式差异,动态调整排序目标:对于探索浏览意图的查询,更看重用户互动参与(如点击深度);对于明确购买意图的查询,更强调转化(购买)。总的来说,深入挖掘用户行为数据,可以从侧面印证或修正基于查询文本的意图判断**,提升模型鲁棒性。
基于深度学习的模型方法
近几年,深度学习在NLP领域的突破为用户意图识别带来了强大工具。预训练语言模型(如BERT、RoBERTa等)的出现,使得通过微调(fine-tuning)对短查询进行意图分类成为可能。典型做法是将查询作为输入,通过BERT获取其上下文向量表示,然后在输出的[CLS]向量上接一个全连接分类层以预测意图类别。这种模型可以端到端训练,在大量通用语料预训练的基础上,学习到丰富的语言知识,对于电商中大量短文本查询的理解尤为有效。例如,对“PS5 slim 发售日期”这样的查询,BERT能根据整体语义判断用户在寻求发布日期等信息,而不仅仅依靠某几个关键字。实验表明,基于BERT的意图分类模型往往比传统浅层模型精度更高,尤其在处理意图隐含、词义多样的查询时效果显著提升。
深度模型的另一个优势在于可以结合多任务学习来共享特征、提高泛化能力。在实际应用中,用户意图识别常常和其他任务相伴出现,例如查询意图分类与查询属性提取、问答意图检测等。多任务学习允许我们同时训练多个相关目标,通过共享底层表示来互相促进。举例来说,有研究将实体识别(NER)和查询意图判断联合训练:针对用户搜索语句,模型一方面识别其中是否存在店铺地址等特定实体,另一方面判断用户是否意在查找店铺信息。这种全局到局部的联合训练,使模型能更好地区分类似“orange”这类多义词(在“pickup my order at Orange store”中是店名,在“buy orange at Target”中则是水果),显著提升了意图分类准确率。在电商搜索中,也可以设计多任务模型,例如同时预测查询的意图类型(信息/交易等)和目标商品类别,或联合学习用户点击率预测等,从而让模型既利用文本线索,又参考历史行为信号来判断意图。多任务框架下,各任务共享的表示能够让模型在冷启动时有所依托——即使某任务的数据有限,相关任务的训练可以提供额外的信息支撑,提高模型对长尾情况的鲁棒性。
除了预训练模型和多任务,深度学习还催生了其他先进方法应用于意图识别。例如,图神经网络(GNN)被用于结合电商产品的知识体系来辅助意图判断。具体而言,电商产品通常有层次化的目录结构或本体,将查询映射到该结构中的节点可以视为一种意图分类。学者们设计模型将商品类别层次编码为图谱信息,将查询文本嵌入表示与类别节点的表示共同送入图神经网络,以捕捉类别之间的关系和约束。这类模型可以在一定程度上解决类别之间的混淆问题,例如“洗发水 去屑”查询可能对应多个上位类别(日化、医药等),通过图谱约束可以利用父子类关联来提高判别准确度。再如,对比学习和半监督学习近年来也被引入意图识别领域,用于缓解训练数据不足和类别不平衡的问题。对比学习通过让模型区分“正/负”样本对,获取更加判别性的查询表示;半监督则利用未标注的真实查询数据,通过伪标签和自训练逐步提升模型性能。这些深度学习技术手段已经在工业界取得成果,例如亚马逊最新研究构建的层次查询分类框架中,结合了对比学习、层次标签信息和自训练策略,在内部数据上超越了以往方法,在罕见意图类别上显著改善了分类准确率。
综上,深度学习为用户意图识别提供了统一而强大的建模框架。通过大规模预训练模型捕获语义,通过多任务和图谱融合丰富先验,通过对比学习和自训练弥补数据稀疏,现代意图识别模型比以往更加智能和健壮,为电商搜索理解用户需求打下坚实基础。
电商场景中常见的挑战
尽管工具和方法不断进步,电商搜索中的用户意图识别依然面临诸多挑战,主要体现在以下几个方面:
-
长尾查询及类别不平衡:电商平台的查询分布具有明显的长尾特征,大量查询非常少见甚至前所未有。这导致训练意图分类器时面临严重的类别不均衡问题。某些主流商品类别(如手机、服装)的查询占据大量流量,而许多小众品类或特殊意图(如投诉退款、违禁品搜索等)极为罕见,仅占全部查询的万分之几。例如亚马逊报告中提到,某些敏感类别的查询仅占0.05%~0.15%。长尾查询由于缺乏充足样本,模型容易偏向头部常见类别,导致长尾意图的漏检或误判。这对用户体验和平台合规都有影响(误判可能呈现不当内容)。如何在数据不平衡情况下提升小众意图的识别率,是一大难题。
-
查询短小、意图歧义:用户在搜索时往往输入的文字非常简短(平均仅约3个词)。短查询的语义信息极其有限,容易出现多重歧义。举例来说,一个词“苹果”在不同情境下可能指水果、电子产品品牌甚至乐队名称;“Java”可能是编程语言也可能是咖啡。电商搜索里类似地存在意图歧义,如用户输入“苹果11”可能想找iPhone 11手机(交易型),也可能在找苹果醋11度(信息型,查询商品信息)等等。如果不借助上下文和附加信息,仅凭字面很难断定意图。当查询词本身泛指性强或缺少限定时(例如只输入“洗衣机”),用户的具体需求不明确,可能需要引导或询问才能弄清是要买洗衣机(交易)还是了解洗衣机使用方法(信息)。意图歧义对搜索引擎提出了更高要求:既需要识别可能的多种意图,又要想办法推断出最符合用户当前需求的那一种。消解歧义可能需要结合用户的历史偏好、地理位置甚至季节(例如“口罩”一词在特殊时期可能更多是健康防护意图)。总之,查询短小和歧义性是意图识别准确率的天然障碍,需要特别处理。
-
冷启动问题:冷启动在此处主要指新查询或新意图类别缺乏训练数据的情况。在电商领域,新兴的商品品类、潮流术语不断出现,例如某款新品发布,其名称第一次被大量用户搜索时,系统可能没有任何历史可循。这些新查询(或新商品类目)由于缺少用户交互数据支撑,意图识别模型往往难以及时做出正确判断。例如,当平台刚上线“医药健康”品类时,用户搜索一些药品名称,系统可能误将其归入其他相近类别(如保健品或食品),因为模型尚未“学会”新的分类。这种冷启动问题会导致搜索结果前期不理想,影响用户体验。此外,对于新用户(匿名访客)而言,也存在会话冷启动——由于缺乏历史行为,系统无法利用个性化偏好来辅助意图推断。这些情况要求模型具有泛化能力和自适应更新机制。在没有数据时,是否可以借助规则、知识库或模拟数据来填补?冷启动是每个搜索系统绕不开的问题。
-
语言与表达多样性:电商平台面向广泛的用户群,不同用户使用的语言和表达方式差异巨大。特别在多语言站点或多地区业务中,同一种意图可能有截然不同的查询表述。例如,“防晒霜”在中国用户查询中可能是“防晒霜”“防晒乳”,而英文用户则是“sunscreen”,印度用户甚至会在英文中夹杂印地语单词。这种跨语言、混合语言(如“hinglish”英印混杂)的查询对意图识别提出了额外挑战。模型需要具备多语言理解能力,或系统需要对不同语种分别训练模型并在查询进入时检测语种。另外,用户查询常包含口语化简写和错别字。如“bb鞋”可能指品牌Baby鞋,拼写错误“iphon”也需要识别为“iPhone”。这些变体如果处理不当,会导致意图判断出错。因此,电商搜索意图识别必须考虑文本规范化和多语言支持等工程问题,否则在真实环境中效果会大打折扣。
-
其他挑战:除了上述主要难点,还有一些方面值得注意。例如用户意图的时效性,有些搜索意图会随时间改变(如季节性商品、流行趋势),模型需要及时捕捉最新的意图偏向。再如意图与业务策略的关联,有些用户查询表明的意图可能触及平台策略红线(如违禁品查询、自杀倾向求助等),这时准确识别并采取措施不仅关系体验更涉及合规。这些特殊场景对意图分类的精度要求更高,宁可多判也不能漏判。最后,多意图共现的情况也可能发生:用户一次查询可能隐含多重意图(例如“iPhone 13 评测 买”同时包含想看评测和考虑购买两种意图),如何应对这类多标签情况也是一项挑战。
综上,电商搜索的意图识别需要在数据不均衡、信息不足和语言多样的复杂环境下工作,这些挑战推动我们在模型和工程上不断创新,以更好地理解用户的查询。
工程实践中的解决方案与经验
构建高质量的训练数据集
高性能的意图识别模型离不开大量准确的训练数据。然而获取大规模高质量的标注数据在实际中非常困难。工程实践中常采用多策略结合来构建意图识别的数据集:
-
日志弱标注:正如前文提到的,利用用户行为日志自动推断意图标签是一种实用且可扩展的方法。具体做法包括:根据查询点击的商品类别分布来标注意图类别(点击最多的类别作为该查询的商品意图);根据点击后是否购买来标注查询是交易型或信息型;根据用户是否点击站内某目标页来判断导航型等。例如,亚马逊会收集每个查询在各产品类型上的一年点击汇总,用这些隐含反馈作为模型训练集。这种方法能够产出海量训练样本,但缺点是标注噪声较大、准确率依赖于用户行为的一致性。
-
人工标注和规则:对于关键业务需求和少数难以从行为推出的意图类别,仍需要投入人工标注。例如导航型查询(品牌名/店铺名)可以请编辑根据词典和经验挑选,建立规则列表。当检测到查询完全匹配某已知品牌或店名时,直接标记为导航意图。人工标注适合覆盖头部高频查询以及特殊类别(如敏感查询),能保证精度。但人工成本高、覆盖面有限,需要与自动方法结合使用。实际中常见做法是:人工精标一小部分数据用于校验模型,剩余长尾部分通过算法自动标注。
-
数据增强与合成:为了解决冷启动的新意图类别缺数据问题,工程上开始尝试生成式的数据增强方法。例如,利用预训练的大模型根据已有商品目录和历史查询生成一些可能的查询作为训练样本。一篇2024年的研究提出了两种生成策略:(1)用生成式模型微调历史查询-商品对,然后为新商品类别生成模拟查询;(2)用提示(prompt)引导大模型直接根据新品类描述产出查询。同时,他们还模拟了一些用户交互数据用于弥补没有点击日志的问题。实验证明,加入这些合成查询和伪交互数据可以显著提升新类别上的查询分类效果,在真实系统中也带来了更高的相关结果比例。这说明借助生成式AI来扩充训练集是很有前景的方向。另外更传统的增强手段还有同义词替换、翻译回译、拼写扰动等,也可以增加模型对各种输入变体的鲁棒性。
-
半监督学习:对于庞大的未标注查询集合,可以采用半监督或自训练(self-training)策略来挖掘其价值。实践中,可以先用一个初步训练的分类模型去预测未标记查询的意图类别,然后将高置信度的预测结果加入训练集继续训练模型。这种迭代可以不断扩充训练数据,同时让模型在真实数据分布上自适应。不过要注意的是,低置信度或模型易错的类别要谨慎选择,以免将错误标签越滚越大。因此有研究引入邻域采样等策略,只选择与已标注样本相似度高的未标注查询来加入训练,从而提高新增样本的质量。半监督学习能够一定程度上缓解长尾类别样本不足的问题,许多工业案例表明它能提升模型对罕见意图的识别能力。
模型部署与实时识别
在完成模型训练后,将用户意图识别模型部署到在线系统也有不少工程讲究。首先是系统架构集成:意图识别通常作为搜索查询理解(query understanding)模块的一部分,位于检索和排序之前。常见的架构是用户每提交一个搜索词,后台就会调用意图分类服务返回该查询的意图标签(或分布)。由于电商搜索对响应速度要求极高,这一过程必须非常高效。为降低延迟,工程上会采取如下一些措施:
-
轻量化模型:深度学习模型虽然效果好但推理开销大。如果直接用一个大型BERT模型对每个查询实时推理,延迟和成本可能无法接受。解决办法包括模型蒸馏、量化压缩等,将原始模型压缩为较小网络以加速推理。此外,也可以考虑使用优化的深度学习推理框架或硬件加速(如GPU、TPU)来缩短每次调用时间。在一些场景下,甚至会退而求其次采用规则或简单模型对极短查询先快速判断,以确保基础响应速度,把深度模型用于复杂情况。
-
缓存与预计算:针对电商搜索中热门查询重复率高的特点,可以对高频查询的意图结果进行缓存。比如每天离线统计Top N常见查询,预先计算它们的意图分类结果存储起来,用户输入这些查询时直接查缓存返回。对于长尾查询,可以考虑在用户输入过程中(如输入法候选或下拉建议阶段)提前触发意图模型计算,以减少等待时间。这种异步预取策略在大型电商中很常见,例如当用户还在打字时系统已经在后台判别意图并准备好相应的检索方案。
-
多级策略回退:部署时要考虑模型预测不确定或出错的情况。工程实践中往往设计兜底策略:当模型给出的意图置信度不足时,可以回退到安全的默认流程。例如无法确定意图时,就按查询词去全文检索,不套用特定意图的强化逻辑,以免误判带来糟糕结果。再如对于疑似多意图的查询,可以并行触发多个意图的处理流程,然后综合结果。在上线初期,为降低风险,可以选择“少用不过度”:仅对模型非常有把握的意图采取特殊处理,对其余查询仍用常规搜索流程,待模型成熟再逐步扩大覆盖面。
-
监控与持续学习:部署后需实时监控模型效果,包括关键业务指标(点击率、转化率)以及人工标注检查。通过A/B测试可以评估启用意图识别的版本相对原先的提升。若发现某些查询效果变差,可能意味着模型误判,需要人工介入分析并修正训练数据。持续地收集新数据、定期重新训练模型(例如每日或每周增量学习)也是必要的,这样模型才能跟上用户意图的变化趋势,不断自我进化。
与排序系统的协同优化
用户意图识别的最终目的,是为了帮助排序及整体搜索结果优化。因此在工程实践中,意图分类模型往往不会独立存在,而是与下游的检索、排序、推荐等模块协同工作。这里介绍几种协同方式和经验:
-
检索阶段的分流与加权:根据意图选择不同的检索策略是常用做法。例如当意图被识别为导航型时,搜索引擎可以直接走精确匹配通道,只匹配品牌或店铺名称字段,确保将唯一对应的结果排在最前。如果意图是信息型,引擎则可以在商品索引之外,同时查询内容库(例如问答库、文章库)并合并结果,提供富信息的结果页。而对于交易型查询,系统可能启用严格的商品品类过滤,只从意图对应的商品类别中检索结果,避免混入不相关的类别。比如用户搜索“尼康相机”,若意图分类为“相机”品类,则可以限制检索范围主要在“相机”类商品,提高准确率。这种利用意图进行检索分流和结果加权的策略,在大型电商里能有效提升结果的精准匹配度和用户满意度。实践经验表明,在采用查询分类辅助检索后,相关商品命中率和结果点击率都有明显提高。
-
排序特征与策略调整:即使检索阶段不做硬筛选,意图识别结果也可作为特征输入到学习排序模型中。排序模型可以根据查询意图动态调整排序参数。例如,对于识别为探索浏览意图的查询,可增加多样性权重或新颖商品的曝光;对于强交易意图的查询,则强调销售量、评价等能促成购买的因素。这种“意图感知”的排序优化本质上是将用户群细分,针对不同意图细分采用不同的排序目标函数。有研究通过将训练数据按照意图类型分层,分别优化点击率和转化率目标,从而提升了两种意图下排序模型的泛化表现。在实际系统中,也可以简化处理:将意图标签作为输入特征,交由Ranker自己学习如何利用。例如模型可能学到“导航意图=更看重是否匹配品牌官网”,“信息意图=用户停留时长特征更重要”等。总之,让排序策略知晓用户意图,有助于因需制宜地优化不同场景下的相关性。
-
结果展示与引导:协同不止体现在排序算法,还包括前端交互的调整。根据用户意图,页面展示层可以做相应优化。例如当判断查询是信息型时,可以在搜索结果顶部展示一个知识面板或常见问题解答,以快速满足用户的信息需求;当判断为交易型时,则突出商品的价格、优惠信息,提供快速下单入口;对于导航型查询,则可以直接跳转或明显展示目标页面(如某品牌旗舰店入口),减少中间步骤。这些前端的改动都建立在对意图的精准把握上,是提升用户体验的最后一环。此外,意图识别还能帮助推荐系统:比如当检测到用户目前处于信息收集阶段,可在旁边推荐相关的内容;当用户意图转为购买时,则推荐热销商品或配件。从整个用户旅程看,意图识别贯穿始终,为各环节提供决策依据。
-
错误与纠偏机制:尽管尽力优化,意图识别也难免有出错的时候。因此工程上需要考虑当意图识别错了时如何降级处理,以减少对用户的负面影响。一种策略是在搜索结果中多样化排列一些不同意图对应的结果,防止因为全部猜错而一无所获。例如用户搜索模棱两可的词时,可以在前几条既呈现商品也呈现内容。即使意图判断有偏差,用户仍可能找到所需的信息。另一种策略是提供意图纠错交互,当系统不确定用户想干什么时,通过界面提示加以引导,例如询问“您是在寻找产品还是相关教程?”让用户自行选择。这些都属于协同范畴:让排序和交互对意图模型的输出不过度依赖,而是能动态弥补其不足。
综上所述,在电商搜索的工程实践中,用户意图识别绝不是孤立的NLP任务,而是深度嵌入到搜索系统的各个层面。从数据构建到模型训练,从部署优化到排序协同,每一步都积累了大量的经验教训。完善的用户意图识别体系能够极大提升搜索引擎的智能程度,使其真正“读懂”用户,在适当的情境下给出最合适的结果。展望未来,随着预训练大模型、强化学习等技术的发展,用户意图识别将在电商领域变得更加精准和实时,为用户提供更贴心高效的搜索体验。
参考资料:
- Andrei Broder. A Taxonomy of Web Search. ACM SIGIR Forum 36(2): 3-10, 2002.
- Mirasvit Blog. Search queries have three types: Navigational, Informational, Transactional. May 17, 2021.
- Bing He et al. Hierarchical query classification in e-commerce search. WWW 2024 Companion (The Web Conf’24).
- Akshay Jagtap et al. Improving Search for New Product Categories via Synthetic Query Generation Strategies. WWW 2024 Companion.
- Prakhar Nigam. How Ecommerce Search Engine Knows What You Are Looking For. LinkedIn Article, Mar 10, 2023.
- Shalin Shah, Ryan Siskind. Multi-Task Learning of Query Intent and Named Entities using Transfer Learning. arXiv preprint arXiv:2105.03316, 2021.
- Dominic Syré et al. Aligning Ranking Objectives with E-commerce Search Intent. SIGIR eCom’23 Workshop, 2023.
- Prakash M. Comar, Srinivasan Sengamedu. Intent based relevance estimation from click logs. CIKM 2017.

浙公网安备 33010602011771号