随笔分类 - 机器学习和数据挖掘
摘要:2024.3.2日在深圳参加了AI大模型及应用落地研讨会,研讨会主要介绍了一下3方面的内容,深圳的AI应用,能落地的已有比较多的应用场景了:我比较感兴趣的是CodeGeeX 1.AI发作现状及应用原理; 2.AI大模型发展情况; 3.AI大模型目前可以应用的场景介绍
阅读全文
摘要:目录1.背景 2.关键概念Prompts and completions(语义搜索 或 文本补全)2.1 Tokens2.2 Models3.快速入门 3.1 openAi账号注册3.2 获取开发者API keys3.3 官方SDK4.其他说明 4.1 openAi自身限制4.2 账号注册4.3 收
阅读全文
摘要:pandas 学习总结 作者:csj 更新时间:2018.04.02 shenzhen email:59888745@qq.com home: http://www.cnblogs.com/csj007523/p/8149929.html 1.import 2.export 3.create obj
阅读全文
摘要:1 场景解析: a.数据探查(数据量的大小,数据缺失或乱码,ETL 操作,字段类型,是否含有目标队列) b.场景抽象(是通过已有的数据,挖掘出可以应用的业务场景。机器学习主要用来解决的场景包括二分类、多分类、聚类和回归) c.算法选择(是确定算法范围、多算法尝试和多视角分析寻找最适合自身业务的算法)
阅读全文
摘要:机器学习 — 推荐系统 作者:大树 深圳更新时间:2018.02.08 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结; 回主目录:2017 年学习记录和总结 技术架构 1.对内容数据,用户数据,行为数据,进行数据处理,格式化,清洗,归并等;2.根据业务规则
阅读全文
摘要:sklearn linear_model,svm,tree,naive bayes,ensemble by iris dataset In [15]: from sklearn import datasets import numpy as np from sklearn.model_selecti
阅读全文
摘要:作者:大树 更新时间:01.20 email:59888745@qq.com 数据处理,机器学习 回主目录:2017 年学习记录和总结 In [ ]: Kaggle上有很多有意思的项目,大家得空可以试着做一做,其中有个关于香港赛马预测的项目,若大家做的效果好, 预测的结果准确度高的话,可以轻松的 g
阅读全文
摘要:人脸识别 人脸识别技术是基于人的脸部特征信息进行身份识别的一种生物识别技术。用摄像机或摄像头采集含有人脸的图像或视频流,并自动在图像中检测和跟踪人脸,进而对检测到的人脸进行脸部的一系列相关技术,通常也叫做人像识别、面部识别 人脸识别流程人脸识别技术流程主要包括四个组成部分,分别为:人脸图像采集及检测
阅读全文
摘要:作者:csj更新时间:01.15 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结; 回主目录:2017 年学习记录和总结 1 安装spark及简介 spark 是用scala语言编写的一套分布式内存计算系统,他的核心抽象模型是RDD(弹性分布式数据集),围绕
阅读全文
摘要:matplotlib 学习总结 作者:csj更新时间:01.09 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结; 回主目录:2017 年学习记录和总结 import matplotlib.pyplot as plt import numpy as np x
阅读全文
摘要:作者:csj更新时间:01.09 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结; 回主目录:2017 年学习记录和总结
阅读全文
摘要:pandas的学习总结 作者:csj更新时间:2017.12.31 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结; 回主目录:2017 年学习记录和总结 1.pandas简介2.pandas数据结构 Series DataFrame Index csv文件
阅读全文
摘要:作者:csj更新时间:2017.12.30 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结; 回主目录:2017 年学习记录和总结 1.python 简介: 2.python 解释器 3.python基础: 1.数据类型,变量,字符串,编码2.list,tu
阅读全文
摘要:数据获取,解析,存储等知识的学习总结 作者:csj更新时间:2017.12.31 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结,此部分已更新完; 回主目录:2017 年学习记录和总结 我们在数据处理,数据分析时,数据的来源有: 1.直接读取已有的.csv;
阅读全文
摘要:今天是2017年12月30日,2017年的年尾,2018年马上就要到了,回顾2017过的确实很快,不知不觉就到年末了,再次开篇对2016.2017年的学习数据挖掘,机器学习方面的知识做一个总结,对自己所学的知识也做一个梳理,查漏补缺关于数据挖据、数据分析,可视化,ML,DL,NLP等。 作者:csj
阅读全文
摘要:最近看了周志华老师的书,主要内容如下,涉及到很多机器学习的知识点: by [2017.12.29 更新 denny shenzhen 59888745@qq.com] 1.线性模型: 3.在样本空间找一个超平面,将不同类别的样本分开; 2.决策树:CSL,ID3,C4.5算法 ID3中根据属性值分割
阅读全文
摘要:分析数据, 缺失值处理 ,去重处理, 噪音处理 看了charlotte的博客分析数据, 缺失值处理 学习总结,很受用,如是将她的画图的部分代码添加完整,可以运行,这样学起来更直观. 1.分析数据 在实际项目中,当我们确定需求后就会去找相应的数据,拿到数据后,首先要对数据进行描述性统计分析,查看哪些数
阅读全文
摘要:实现文本分词+在线词云实现工具 词云是NLP中比较简单而且效果较好的一种表达方式,说到可视化,R语言当仍不让,可见R语言︱文本挖掘——词云wordcloud2包 当然用代码写词云还是比较费劲的,网上也有一些成型的软件供大家使用。 本节转载于金砖咖啡馆公众号 我们词云制作工具是目前非常流行的tagxe
阅读全文
摘要:DeepNLP的核心关键/NLP语言模型 /word embedding/word2vec Indexing: 〇、序 一、DeepNLP的核心关键:语言表示(Representation) 二、NLP词的表示方法类型 1、词的独热表示one-hot representation 2、词的分布式表示
阅读全文
摘要:作者:大树更新时间:2017.12.14 email:59888745@qq.com 说明:因内容较多,会不断更新 xxx学习总结; 回主目录:2017 年学习记录和总结 机器学习算法总结: 线性回归 (Linear Regression) (ML分类) Y=aX+b 利用连续性变量来估计实际数值
阅读全文

浙公网安备 33010602011771号