10 实现内容相似推荐

image

  • 内容获取(存储MySQL)-进行分词(TF-IDF)-语义拓展-生成每篇文章的向量(出现对应的词及拓展的词就是1)-每篇文章最相似的topN的文章-缓存-提供服务

image

看github案例

image

中文的词库:ai.tencent.com/ailab/nlp/embedding.html

  • 数据量小用提取关键词后可以直接相似近邻搜索
  • LSH用于大数据集
posted @ 2022-12-15 09:33  Trouvaille_fighting  阅读(42)  评论(0)    收藏  举报