上一页 1 2 3 4 5 6 7 8 9 10 ··· 217 下一页

2023年3月13日

特征工程以及特征工程的方法

摘要: 什么是特征工程有这么一句话在业界广泛流传:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。那特征工程到底是什么呢?顾名思义,其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用。通过总结和归纳,人们认为特征工程包括以下方面: 特征工程的常用处理方法1.时间戳 阅读全文

posted @ 2023-03-13 11:24 ExplorerMan 阅读(152) 评论(0) 推荐(0) 编辑

2023年3月11日

超参数

摘要: 在机器学习的上下文中,超参数是在开始学习过程之前设置值的参数。 相反,其他参数的值通过训练得出。 超参数: 定义关于模型的更高层次的概念,如复杂性或学习能力。 不能直接从标准模型培训过程中的数据中学习,需要预先定义。 可以通过设置不同的值,训练不同的模型和选择更好的测试值来决定 超参数的一些示例: 阅读全文

posted @ 2023-03-11 00:03 ExplorerMan 阅读(38) 评论(0) 推荐(0) 编辑

2023年3月10日

词向量与分类工具

摘要: word2vec是2013年Google开源的一款用于词向量计算的工具 fastText是Facebook于2016年开源的一个词向量计算和文本分类工具 GloVe是斯坦福团队于2014年提出一个词向量方法,全名叫“Global Vectors”,直接利用全局的统计信息进行训练 阅读全文

posted @ 2023-03-10 23:59 ExplorerMan 阅读(16) 评论(0) 推荐(0) 编辑

机器学习算法之有监督学习和无监督学习的区别

摘要: 如今机器学习和人工智能是大家耳熟能详的两个词汇,在我们日常生活中也是被高频的提到。其实机器学习只是人工智能的一部分,是人工智能的一个子集,它往往是通过示例和经验模型让计算机去执行一些操作任务,研究人员和开发人员比较比较热衷于它。在生活中,我们应用的很多东西其实都使用的是机器学习算法,例如我们使用的好 阅读全文

posted @ 2023-03-10 23:44 ExplorerMan 阅读(146) 评论(0) 推荐(0) 编辑

训练词向量

摘要: 1.3 训练词向量学习目标了解词向量的相关知识.掌握fasttext工具训练词向量的过程.词向量的相关知识:用向量表示文本中的词汇(或字符)是现代机器学习中最流行的做法, 这些向量能够很好的捕捉语言之间的关系, 从而提升基于词向量的各种NLP任务的效果.使用fasttext工具训练词向量的过程第一步 阅读全文

posted @ 2023-03-10 19:46 ExplorerMan 阅读(60) 评论(0) 推荐(0) 编辑

人工智能 —— 知识图谱

摘要: 引言初学者刚开始学习人工智能时,面对铺天盖地的概念,如,人工智能、机器学习、深度学习、计算机视觉等等,一时间可能就被这些“高深”的名称给唬住了,不知道如何下手。又或者有些同学在学习了很长时间后,问他学习的是人工智能的哪一方面,都不能清晰地回答出来,只能回答个大概,也基本上是名词堆砌。所以本篇文章的目 阅读全文

posted @ 2023-03-10 19:43 ExplorerMan 阅读(76) 评论(0) 推荐(0) 编辑

fasttext工具的使用

摘要: 1.1 认识fasttext工具学习目标了解fasttext工具的作用.了解fasttext工具的优势及其原因.掌握fasttext的安装方法.作为NLP工程领域常用的工具包, fasttext有两大作用:进行文本分类训练词向量fasttext工具包的优势:正如它的名字, 在保持较高精度的情况下, 阅读全文

posted @ 2023-03-10 19:41 ExplorerMan 阅读(87) 评论(0) 推荐(0) 编辑

2023年3月3日

六步搭建机器学习项目雏形框架

摘要: 机器学习覆盖的范围十分广泛。这篇文章将整体描述机器学习适用的典型问题,提供实现机器学习项目雏形的框架。 首先厘清一些定义。 机器学习、人工智能和数据科学区别何在? 这三个主题没有明确的定义,因而有些难以理解。为防止误解,我们将问题简化。读者可以认为本文提到的机器学习就是发现数据中的规律,以理解某些问 阅读全文

posted @ 2023-03-03 11:48 ExplorerMan 阅读(46) 评论(0) 推荐(0) 编辑

2022年12月12日

更严格的代码格式化工具 gofumpt

摘要: gofmt 是 golang 自带的代码自动格式化工具,是保证 Go 代码风格一致的大杀器。我们这次要推荐的 gofumpt 在 gofmt 的基础上添加了一系列更加严格的格式化规则,并保证了对 gofmt 的兼容。 gofumpt 有助于进一步提升代码质量,它已经成为 gopls(Go 官方语言服 阅读全文

posted @ 2022-12-12 15:04 ExplorerMan 阅读(635) 评论(0) 推荐(0) 编辑

2022年11月16日

雪花算法snowflake分布式id生成原理详解,以及对解决时钟回拨问题几种方案讨论

摘要: UUID:Java自带的生成一串唯一随机36位字符串,可以保证唯一性,但是采用无意义字符串,无法有序递增,且数据量大时查询效率比较低。 采用数据库自增序列: 读写分离时,只有主节点可以进行写操作,可能有单点故障的风险, 分表分库,数据迁移合并等比较麻烦。 雪花算法:它是Twitter开源的由64位整 阅读全文

posted @ 2022-11-16 11:27 ExplorerMan 阅读(2922) 评论(0) 推荐(0) 编辑

上一页 1 2 3 4 5 6 7 8 9 10 ··· 217 下一页

导航