夜的独白

  博客园  :: 首页  :: 新随笔  :: 联系 :: 订阅 订阅  :: 管理

2021年7月1日

摘要: 文章目录 1.挖掘背景与目标 2.2 数据探索与预处理 * 2.1 数据筛选 2.2 数据去重 2.3 删除前缀评分 2.4 jieba分词 3 基于LDA 模型的主题分析 4.权重 5.如何在主题空间比较两两文档之间的相似度 本文是基于《Python数据分析与挖掘实战》的实战部分的第15章的数据— 阅读全文
posted @ 2021-07-01 19:18 夜的独白 阅读(350) 评论(0) 推荐(0)

摘要: 第0周 Python基本语法元素 conda : 一个工具,用于包管理和环境管理,其中:包管理与pip类似,管理Python第三方库环境管理能够允许用户使用不同版本Python,并能灵活切换 anaconda :一个集合,包括conda、某版本Python、一批第三方库等 conda将工具、第三方库 阅读全文
posted @ 2021-07-01 18:26 夜的独白 阅读(114) 评论(0) 推荐(0)

摘要: 写在前面的话: 实例中的所有数据都是在GitHub上下载的,打包下载即可。 地址是: [ http://github.com/pydata/pydata-book ](http://github.com/pydata/pydata- book) 还有一定要说明的: 我使用的是Python2.7,书中 阅读全文
posted @ 2021-07-01 18:24 夜的独白 阅读(79) 评论(0) 推荐(0)

摘要: 学习《利用Python进行数据分析》第二章的时候,处理1880-2010年间全美婴儿姓名数据,有句代码总是报错: total_births=names.pivot_table('births',rows='year',cols='sex',aggfunc=sum) [/code] 报错信息如下: ` 阅读全文
posted @ 2021-07-01 18:09 夜的独白 阅读(106) 评论(0) 推荐(0)

摘要: 由于刚开始接触python的数据分析,第二章引言和第三章IPython就先略读了下,对能做的事和开发环境有了个大致的认识,但针对其中提到的一些优势还有没体会,回头再重新看。今天直接学习python数据分析中重要的库之一: Numpy(numerical python) 看看它在pypi上的说明(理解 阅读全文
posted @ 2021-07-01 18:04 夜的独白 阅读(35) 评论(0) 推荐(0)

摘要: import pandas as pd import numpy as np import matplotlib.pyplot as plt %matplotlib inline [/code] //anaconda/lib/python2.7/site-packages/matplotlib/fo 阅读全文
posted @ 2021-07-01 18:03 夜的独白 阅读(126) 评论(0) 推荐(0)

摘要: WGS(Whole Genome Sequencing) 指将物种细胞里面完整的基因组序列全部DNA,检测并排列,此技术几乎能够鉴定出基因组上任何类型的突变。 对于人类来说,全基因组测序的价值是极大的,它的信息包含了所有基因和生命特征之间的内在关联性,当然也意味着更大的数据解读和更高的技术挑战。 测 阅读全文
posted @ 2021-07-01 18:01 夜的独白 阅读(1042) 评论(0) 推荐(0)

摘要: 《数据分析实战》–用R做聚类分析 本文参考的是 《数据分析实战》 的第八章。 背景: 针对某公司的产品,现目前需要服务好已有的用户,针对不同的用户群体设计并推广不同的营销策略。 现状: 目标用户不明确。 预期: 明确目标用户群。 读取数据 读取Dau数据: > dau <- read.csv('da 阅读全文
posted @ 2021-07-01 17:50 夜的独白 阅读(272) 评论(0) 推荐(0)

摘要: 【赋值栅格】工具:此处仅设置【忽略背景值】为黑边像元值,而不设置NoData值,避免所有指定像素将在输出栅格数据集中被设置为 NoData。 忽略背景值: 1、 使用此选项移除在栅格数据周围创建的不需要的值 。指定的值与栅格数据集中的其他有用数据不同。例如,栅格边界上为零的值不同于栅格数据集内的零值 阅读全文
posted @ 2021-07-01 17:45 夜的独白 阅读(552) 评论(0) 推荐(0)

摘要: 因为自己准备的时候战战兢兢,所以希望给学弟学妹一些经验,希望大家都万事胜意o( ̄▽ ̄)ブ 不知道这算不算侵字节爸爸的权啊,是的话麻烦提醒一下,我就删了…… 一、准备 岗位描述: 1、负责分字节跳动旗下国内外产品及业务的数据分析工作; 2、分析各项影响产品提升与增长的因素、各项业务细节,结合业务方向, 阅读全文
posted @ 2021-07-01 17:33 夜的独白 阅读(710) 评论(0) 推荐(0)