02 2022 档案

摘要:简介 传统的广告最终的呈现需要经过召回与排序两个阶段,百度的搜索架构则采用三层漏斗状,如图1所示。最上面的一层用于筛选出和用户查询最相关的一部分广告,将整个候选广告集从亿级降到千级;下面两层是排序阶段,需要结合具体的业务,对召回的广告进行最终的排序、展示。三层结构相较于两层结构更多的是从计算资源与业 阅读全文

posted @ 2022-02-23 19:37 foghorn 阅读(291) 评论(0) 推荐(0) |

摘要:图1 广告排序两阶段架构 简介 样本优化包括样本增强和样本提纯,是现代广告投放平台中一个重要但经常被忽视的组成部分。由于大量的候选广告,工业广告服务通常利用多层漏斗形结构(如图1所示),至少涉及两个阶段:候选样本生成和重新排序。在候选样本生成步骤中,通常根据过去的点击/转换数据训练离线神经网络匹配模 阅读全文

posted @ 2022-02-21 23:06 foghorn 阅读(524) 评论(0) 推荐(0) |

摘要:常用API gensim.models.Word2Vec(sentence, min_count, workers) gensim.models.word2vec.Word2Vec(sentence, min_count, workers) word2vec参数 sentence:语料句子,必须是一 阅读全文

posted @ 2022-02-13 17:59 foghorn 阅读(1013) 评论(0) 推荐(0) |

摘要:什么是迭代器 迭代是python中访问集合元素的一种非常强大的一种方式。迭代器是一个可以记住遍历位置的对象,因此不会像列表那样一次性全部生成,而是可以等到用的时候才生成,因此节省了大量的内存资源。迭代器对象从集合中的第一个元素开始访问,直到所有的元素被访问完。迭代器有两个方法:iter()和next 阅读全文

posted @ 2022-02-13 03:08 foghorn 阅读(99) 评论(0) 推荐(0) |

摘要:集成学习的分类 bagging 从训练集从进行子抽样组成每个基模型所需要的子训练集,对所有基模型预测的结果进行综合产生最终的预测结果。 boosting 训练过程为阶梯状,基模型按次序一一进行训练(实现上可以做到并行),基模型的训练集按照某种策略每次都进行一定的转化。对所有基模型预测的结果进行线性综 阅读全文

posted @ 2022-02-12 21:24 foghorn 阅读(395) 评论(0) 推荐(0) |

摘要:sklearn文档参数描述 函数签名 class sklearn.tree.DecisionTreeClassifier(*, criterion='gini', splitter='best', max_depth=None, min_samples_split=2, min_samples_le 阅读全文

posted @ 2022-02-12 19:57 foghorn 阅读(387) 评论(0) 推荐(0) |

摘要:原文见:http://c.biancheng.net/view/6675.html 迭代器是什么 无论是序列容器还是关联容器,最常做的操作无疑是遍历容器中存储的元素,而实现此操作,多数情况会选用“迭代器(iterator)”来实现。那么,迭代器到底是什么呢? 我们知道,尽管不同容器的内部结构各异,但 阅读全文

posted @ 2022-02-11 19:42 foghorn 阅读(80) 评论(0) 推荐(0) |

摘要:通常认为,STL 是由容器、算法、迭代器、函数对象、适配器、内存分配器这 6 部分构成,其中后面 4 部分是为前 2 部分服务的,它们各自的含义如下表所示。 | STL的组成 | 含义 | | | | | 容器 | 一些封装数据结构的模板类,例如 vector 向量容器、list 列表容器等。 | 阅读全文

posted @ 2022-02-11 19:22 foghorn 阅读(186) 评论(0) 推荐(0) |

摘要:lower_bound(arr, x)函数用于查找arr中第一个大于或等于x的元素,如果arr是容器,则返回的是迭代器,如果arr是普通数组,则返回的是指针。 upper_bound(arr, x)查找arr中第一个大于x的元素,如果x有多个,则查找最后一个。 两个函数必须在有序序列上操作,在头文件 阅读全文

posted @ 2022-02-11 14:49 foghorn 阅读(73) 评论(0) 推荐(0) |

摘要:emplace_back() 和 push_back() 的区别,就在于底层实现的机制不同。push_back() 向容器尾部添加元素时,首先会创建这个元素,然后再将这个元素拷贝或者移动到容器中(如果是拷贝的话,事后会自行销毁先前创建的这个元素);而 emplace_back() 在实现时,则是直接 阅读全文

posted @ 2022-02-11 13:17 foghorn 阅读(460) 评论(0) 推荐(0) |

摘要:简介 传统的深度学习网络主要针对图片,语音等欧氏空间内规则型数据;而对社交、电商和医疗等非规则结构数据则仍受到一定程度的限制。以电商场景为例,可以将用户、商品和广告等都看作节点(nodes),而将用户对于商品的购买,广告的点击等操作视为边(edges,节点间连接)。节点和边就构成了一张图(Graph 阅读全文

posted @ 2022-02-10 14:59 foghorn 阅读(314) 评论(0) 推荐(0) |

摘要:图1 商品属性和用户配置文件之间关系的示例。左边列出了鞋子的属性,而右边列出了从相应的属性推断出的可能的用户配置文件 简介 该论文于2020年发表在WSDM上,目的是解决推荐系统中的冷启动问题。作者认为商品的属性可以反映用户的特征,如图1所示,一个鞋子会有不同的特征,这些特征能从侧面反映用户的兴趣爱 阅读全文

posted @ 2022-02-07 22:19 foghorn 阅读(278) 评论(0) 推荐(0) |

摘要:#include <iostream> #include <cstring> using namespace std; /* 有 N 种物品和一个容量是 V 的背包,每种物品都有无限件可用。 第 i 种物品的体积是 vi,价值是 wi。 求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且 阅读全文

posted @ 2022-02-03 23:44 foghorn 阅读(35) 评论(0) 推荐(0) |

摘要:#include <iostream> #include <cstring> using namespace std; /* 有 N 件物品和一个容量是 V 的背包。每件物品只能使用一次。 第 i 件物品的体积是 vi,价值是 wi 求解将哪些物品装入背包,可使这些物品的总体积不超过背包容量,且总价 阅读全文

posted @ 2022-02-03 23:39 foghorn 阅读(37) 评论(0) 推荐(0) |

博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3