摘要: 使用solr中需要查看具体评分的计算过程,并分析评分计算过程。 参数设置: 返回结果: "response":{"numFound":10,"start":0,"maxScore":43.508614,"docs":[ { "szqx":"江干区", "szs":"杭州市", "name":"杭州行 阅读全文
posted @ 2019-09-03 10:25 不同的日子丶看不同的云 阅读(269) 评论(0) 推荐(0) 编辑
摘要: 如何控制评分 如果设置了sort字段,那么将会按照sort字段的顺序返回结果。 如果没有设置sort字段,那么将会根据相关度打分来排序。也就是说,相关度更高的排在前面。 如何来定制适合自身业务的排序打分规则(boost)呢?经过这段时间的思考与实践,想到了如下三个方法:1、定制Lucene的boos 阅读全文
posted @ 2019-08-26 17:11 不同的日子丶看不同的云 阅读(366) 评论(0) 推荐(0) 编辑
摘要: 以下来自solr in action。 包含: 词项频次。查询词项出现在当前查询文档中的次数。 反向文档频次。查询词项出现在所有文档总的次数。 此项权重。 标准化因子: 字段规范: 文档权重。 字段权重。 长度归一化。消除长文档的优势。因为长文档的词项频次一般会比较大。 协调因子。避免一个文档中出现 阅读全文
posted @ 2019-08-26 16:58 不同的日子丶看不同的云 阅读(703) 评论(0) 推荐(0) 编辑
摘要: solr-custom-score solr自定义评分组件demo (一)背景介绍 大多数时候我们使用lucene/solr/elasticsearch自带的评分查询都是没问题的,当然这也仅仅限于简单的业务或者对搜索排名 不敏感的场景中,假设业务方要求有若干业务因子要干扰到排名,同时还不能放弃框架本 阅读全文
posted @ 2019-08-26 16:52 不同的日子丶看不同的云 阅读(627) 评论(0) 推荐(0) 编辑
摘要: Jmeter添加参数的四种方法 1.HTTP请求添加 方法:1.添加的HTTP Request组件中找到Parameters页面下的add,添加自定义参数 。 2.设置参数名称Name和参数值Value,如果是中文的,需要勾选URL Encode。 评价:这种方法只能一次添加一个参数,和在path中 阅读全文
posted @ 2019-08-21 16:45 不同的日子丶看不同的云 阅读(6086) 评论(0) 推荐(0) 编辑
摘要: Data competition: From 0 to 1: Part I 1. Data competition Introduction 2. Example: Credit Fraud Detector EDA(Exploratory Data Analysis) Why taking log 阅读全文
posted @ 2019-08-20 20:51 不同的日子丶看不同的云 阅读(411) 评论(0) 推荐(0) 编辑
摘要: 进入Hive交互系统,“show databases:”。出现报错: Failed to start database 'metastore_db' with class loader sun.misc.Launcher$AppClassLoader 经查找是因为数据库初始化的问题。 进入终端初始化 阅读全文
posted @ 2019-08-15 20:51 不同的日子丶看不同的云 阅读(2834) 评论(0) 推荐(0) 编辑
摘要: 问题:pip了pandas和sklearn模块到anaconda下的study3.7环境,可是打开juypter却找不到相应的模块。 解决思路: 1.配置的本地python3.7环境变量下pip相应pandas和sklearn模块,均以安装成功。 1 pip install pandas 2 pip 阅读全文
posted @ 2019-08-11 12:43 不同的日子丶看不同的云 阅读(2336) 评论(0) 推荐(0) 编辑
摘要: 不知道大家最近有没有去看电影,最近身边的朋友都在向我安利一部叫做《哪吒之魔童降世》的动漫电影。大家无一例外,都说非常的好看。 看一下最近的微信搜索指数,比火热的电视剧“亲爱的热爱的”搜索指数要高出近6倍,比迪斯尼的“狮子王”要高出22倍,确实非常火。 去猫眼上看了一下,结果显示在接近84万人评分的情 阅读全文
posted @ 2019-08-06 20:30 不同的日子丶看不同的云 阅读(315) 评论(0) 推荐(0) 编辑
摘要: 豆瓣的一个关于“周X伦在微博超话没有数据流量,他是不是没有蔡X坤火”的帖子引爆了Jay Chou粉丝与KUN的粉丝的流量之争。两家粉丝以背后最大赢家新浪微博为载体,打响了一场被各大媒体争相报道、吃瓜路人津津乐道的数据流量之战。 用ABtestdech得出结论 一:什么是A/B测试? 统计学角度来讲, 阅读全文
posted @ 2019-08-06 20:11 不同的日子丶看不同的云 阅读(775) 评论(0) 推荐(0) 编辑