随笔分类 -  NLP

上一页 1 2 3 4 5 6 ··· 12 下一页
摘要:一是特征工程。 第二是算法定义和调参,就是你该选择什么样的算法,用什么样的参数进行调节。 第三是数据采集和清洗,接下来是实现这个算法并进行优化。‘I’代表和业务生产系统集成,所以我们就会简称为FaDAI这五大步骤。特征工程是这五大环节最重要的一部分 阅读全文
posted @ 2022-01-21 10:22 今夜无风 阅读(255) 评论(0) 推荐(0)
摘要:对于Category的特征,我们通常有两种方法把它变成一个数字:Label编码和hash编码;使用sklearn的LabelEncoder可以实现把Label编码成数字。 现在主要介绍使用hash方法对类别进行编码 1.在大型工业场景下,会源源不断地出现新的item,新的用户,新的id,原先的one 阅读全文
posted @ 2022-01-20 22:45 今夜无风 阅读(645) 评论(0) 推荐(0)
摘要:推荐系统中最重要的两部分是特征和模型,早期模型上没有很大突破的时候,人工特征工程是推荐系统发展的主要方向。在这里我总结一下做特征工程的思路和不同特征的处理方式。 1. 创造特征的思路 业务背景特征在推荐系统中猜测用户是否点击内容,可以仔细分析用户从打开手机到看到推荐内容的整个过程中的任何因素,比如这 阅读全文
posted @ 2022-01-20 17:22 今夜无风 阅读(485) 评论(0) 推荐(0)
摘要:参考地址:https://zhuanlan.zhihu.com/p/398630370https://www.modb.pro/db/152185https://blog.csdn.net/xiewenbo/article/details/103859633?spm=1001.2101.3001.6 阅读全文
posted @ 2022-01-20 10:10 今夜无风 阅读(857) 评论(0) 推荐(0)
摘要:最近将之前所做项目查阅的资料进行汇总,比较琐碎,希望有些知识点或者想法能帮助到你。 参考文献地址:https://blog.csdn.net/u011412768/article/details/93404921https://blog.csdn.net/a2639491403/article/de 阅读全文
posted @ 2022-01-20 10:09 今夜无风 阅读(412) 评论(0) 推荐(0)
摘要:1.模型构建 def get_model(): """函数式API搭建双塔DNN模型""" # 输入 user_id = keras.layers.Input(shape=(1,), name="user_id") gender = keras.layers.Input(shape=(1,), na 阅读全文
posted @ 2022-01-08 16:05 今夜无风 阅读(880) 评论(0) 推荐(0)
摘要:这个模块提供了堆队列算法的实现,也称为优先队列算法。 堆是一个二叉树,它的每个父节点的值都只会小于或等于所有孩子节点(的值)。 它使用了数组来实现:从零开始计数,对于所有的 k ,都有 heap[k] <= heap[2*k+1] 和 heap[k] <= heap[2*k+2]。 为了便于比较,不 阅读全文
posted @ 2021-12-29 21:50 今夜无风 阅读(138) 评论(0) 推荐(0)
摘要:参考源:https://www.6aiq.com/article/1605651191093 阅读全文
posted @ 2021-12-28 18:25 今夜无风 阅读(127) 评论(0) 推荐(0)
摘要:来源:https://cloud.tencent.com/developer/news/688362 阅读全文
posted @ 2021-12-28 11:12 今夜无风 阅读(46) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2021-12-22 21:30 今夜无风 阅读(134) 评论(0) 推荐(0)
摘要:query意图搜索模块-意图解析1.对比通用搜索,boss求职搜索是结构化召回2.ner是指导召回关键信号在实际场景下,doc端的数据会包含很多结构化的字段,不同字段之间的语义差距会非常大,如果我们进行全字段检索,经常会出现一些语义漂移问题。比如,搜"销售专员",可能会找到"临时工",因为它的字段里 阅读全文
posted @ 2021-12-16 14:55 今夜无风 阅读(291) 评论(0) 推荐(0)
摘要:作者:暴躁乐谷链接:https://zhuanlan.zhihu.com/p/426478129 见过身边的阿里P8,记录一下我的观察,这里仅说技术线的P8,有同学有想问的直接留言: (由于过于真实而脱敏,手动降温)薪资水平上,现在字节挖阿里P8的报价已经能谈到xxx万税前现金年薪 + xxx万期权 阅读全文
posted @ 2021-11-01 21:57 今夜无风 阅读(920) 评论(0) 推荐(0)
摘要:问题: # 你这个学期必须选修 numCourses 门课程,记为 0 到 numCourses - 1 。 # # 在选修某些课程之前需要一些先修课程。 先修课程按数组 prerequisites 给出,# 其中 prerequisites[i] = [ai, bi] ,表# 示如果要学习课程 a 阅读全文
posted @ 2021-10-19 15:09 今夜无风 阅读(171) 评论(0) 推荐(0)
摘要:python中的collections.defaultdict()函数 一种特殊类型的字典本身就保存了默认值defaultdict(),defaultdict类的初始化函数接受一个类型作为参数,当所访问的键不存在的时候,可以实例化一个值作为默认值。 简单使用: 阅读全文
posted @ 2021-10-19 11:05 今夜无风 阅读(108) 评论(0) 推荐(0)
摘要:问题: # 给你单链表的头节点 head ,请你反转链表,# 并返回反转后的链表。 方法: 1)双指针迭代法 def reverseList(self, head: ListNode) -> ListNode: # 双指针法,申请两个指针 prev = None curr = head while 阅读全文
posted @ 2021-10-18 21:28 今夜无风 阅读(136) 评论(0) 推荐(0)
摘要:问题: # 给定一个大小为 n 的数组,找到其中的多数元素。# 多数元素是指在数组中出现次数 大于 ⌊ n/2 ⌋ 的元素。 # # 你可以假设数组是非空的,并且给定的数组总是存在多数元素。 # 方法:哈希、排序 class Solution: def majorityElement(self, n 阅读全文
posted @ 2021-10-18 17:48 今夜无风 阅读(103) 评论(0) 推荐(0)
摘要:用max自带函数 def find_max(): # 统计一段文本中出现最多的字母 # 函数会把第一个参数的每个值依次放入key提供的比较大小的方法里 import string text = "dengyexun" return max(string.ascii_lowercase, key=te 阅读全文
posted @ 2021-10-18 14:31 今夜无风 阅读(81) 评论(0) 推荐(0)
摘要:问题: # 给你两个单链表的头节点 headA 和 headB ,请你找出并返回两个单链表相交的起始节点。如果两个链表没有交点,返回 null 。 方法:双指针法分别遍历两个链表,第一次相遇即为相交点 参考代码: class Solution: def getIntersectionNode(sel 阅读全文
posted @ 2021-10-18 11:29 今夜无风 阅读(77) 评论(0) 推荐(0)
摘要:fastText是Facebook于2016年开源的一个词向量计算和文本分类工具,在文本分类任务中,fastText(浅层网络)往往能取得和深度网络相媲美的精度,却在训练时间上比深度网络快许多数量级。在标准的多核CPU上, 能够训练10亿词级别语料库的词向量在10分钟之内,能够分类有着30万多类别的 阅读全文
posted @ 2021-10-13 09:42 今夜无风 阅读(1000) 评论(0) 推荐(0)
摘要: 阅读全文
posted @ 2021-09-30 14:36 今夜无风 阅读(35) 评论(0) 推荐(0)

上一页 1 2 3 4 5 6 ··· 12 下一页