• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
 






kayy

 
 

Powered by 博客园
博客园 | 首页 | 新随笔 | 联系 | 订阅 订阅 | 管理

2019年11月8日

als_tf
摘要: # -*- coding: utf-8 -*-import tensorflow as tfdef als_tf(user_item_matrix, feature_num, train_times, reg): user_num, item_num = user_item_matrix.shape 阅读全文
posted @ 2019-11-08 17:31 kayy 阅读(218) 评论(0) 推荐(0)
 

2019年11月7日

小样本点击率纠正-威尔逊(Wilson)区间
摘要: click/all = 1/2 > 9/20 p —— click/all n —— all z —— 正态分布,均值 + z * 标准差 置信度。 z = 1.96,置信度为95% def wilson(click, all): if all == 0: return 0 z = 1.96 r = 阅读全文
posted @ 2019-11-07 18:47 kayy 阅读(1136) 评论(0) 推荐(0)
 

2019年11月2日

mail.py
摘要: #-*- coding: utf-8 -*- import smtplib from email.mime.multipart import MIMEMultipart from email.mime.text import MIMEText from email.mime.image import 阅读全文
posted @ 2019-11-02 10:30 kayy 阅读(174) 评论(0) 推荐(0)
 

2019年10月29日

mail
摘要: mail.sh s=`cat ./all.html` /usr/sbin/sendmail -t -F SenderDisplayerName <<EOF SUBJECT: feature TO: aaa@aaa.com MIME-VERSION: 1.0 Content-type: text/ht 阅读全文
posted @ 2019-10-29 11:34 kayy 阅读(397) 评论(0) 推荐(0)
 

2019年8月1日

相关系数和p值的含义
摘要: 相关系数就是两个变量之间的相关程度,-1<0负相关,r>0正相关,r2越接近1表示越相关。 P值即概率,反映某一事件发生的可能性大小。统计学根据显著性检验方法所得到的P 值,一般以P < 0.05 为显著, P<0.01 为非常显著,其含义是样本间的差异由抽样误差所致的概率小于0.05 或0.01。 阅读全文
posted @ 2019-08-01 14:26 kayy 阅读(25456) 评论(0) 推荐(0)
 

2019年7月30日

payspark als
摘要: from pyspark.sql import SparkSession import math from os.path import abspath def cosSim(v1, v2): member = reduce(lambda x, y: x+y, map(lambda d: d[0]* 阅读全文
posted @ 2019-07-30 19:51 kayy 阅读(236) 评论(0) 推荐(0)
 
bayesian_smoothing贝叶斯平滑
摘要: # -*- coding: utf-8 -*- import numpy as np def bayesian_smoothing(c, i): r = 1.0*c/i # print r m = np.mean(r) v = np.var(r) a = (m*(1-m)/v-1)*m b = (m 阅读全文
posted @ 2019-07-30 19:40 kayy 阅读(418) 评论(0) 推荐(0)
 

2019年7月23日

python sparksql
摘要: from pyspark.sql import SparkSession from os.path import abspath warehouse_location = abspath('spark-warehouse') spark = SparkSession.builder.appName( 阅读全文
posted @ 2019-07-23 10:13 kayy 阅读(1463) 评论(0) 推荐(0)
 

2019年5月7日

LightGBM 自定义metric
摘要: def self_loss(labels, preds): preds = preds.get_label() k = labels - preds # 对labels求导 grad = np.where(k>0, 2*np.abs(preds)/(np.power(np.abs(labels)+n 阅读全文
posted @ 2019-05-07 11:32 kayy 阅读(5820) 评论(0) 推荐(0)
 

2019年3月20日

推荐系统 坑
摘要: 1、用户搜索和筛选的信息是否可用,如何使用 2、看过 点过 聊过 买过 3、时间新颖 热门 4、协同过滤看起来会很好 5、不单一 多样性 不违规 6、场景 用户所处时间位置 7、推荐系统架构 召回少补多退粗排 排序 策略多优于少 8、场景细分 越细越准 9、评价指标 排序的话auc TopN 10、 阅读全文
posted @ 2019-03-20 17:47 kayy 阅读(232) 评论(0) 推荐(0)
 
下一页