摘要: 刚开始学习Hadoop时就曾经一直抱怨Hadoop的安装部署为什么这么麻烦,对于一个新手需要捯饬一天才能把分布式环境安装配置好。而对于一个自学Hadoop而周围又没人交流的菜鸟来说,我对Hadoop的理解一直停留在很肤浅的层面,能应用,但对内部的原理知之甚少。最近和一个做这方面的朋友聊天,他问我你学阅读全文
posted @ 2017-04-22 23:44 jinhaolin 阅读(979) 评论(0) 编辑
摘要: 开篇不打算写太多技术细节,只想来阐述一下计划写该系列博客的初衷。 首先按照惯例,先做个自我介绍。博主本人一直是从事C++相关方面的研发,自认为技术很是一般(不只是谦虚),现在也同时兼顾在做一些大数据与云计算方面的工作,对机器学习和自然语言处理也有部分涉猎,总之是涉猎很广,但精通的却很少。 公司有一项阅读全文
posted @ 2016-12-19 21:23 jinhaolin 阅读(1329) 评论(3) 编辑
摘要: DataFrame是一个表格型的数据结构,它含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔值等)。DataFrame既有行索引也有列索引,它可以被看做由Series组成的字典(共用同一个索引)。 DataFrame有多种不同的创建方法: Dict of 1D ndarrays, lis阅读全文
posted @ 2016-10-20 15:03 jinhaolin 阅读(4992) 评论(0) 编辑
摘要: Pandas基本的数据结构是Series和DataFrame。Series是1 D的,DataFrame是2 D的。 首先引入Pandas和Numpy from pandas import Series, DataFrame import pandas as pd import numpy as n阅读全文
posted @ 2016-10-20 10:18 jinhaolin 阅读(2314) 评论(0) 编辑
摘要: Pandas为所有中等规模数据分析的最有效的工具,它依赖Numpy。 学习过程中我搜集了一些资料汇总如下: 作为开始,你可以先看一个关于Pandas的 "10分钟简短介绍" ,中文版在 "这里" 。 然后可以学习一个更详细的 "Pandas教程" ,百度文库也有一个系列的 "Pandas教程" 。 阅读全文
posted @ 2016-10-20 08:44 jinhaolin 阅读(198) 评论(0) 编辑
摘要: 最近无意中发现了一款轻量级的标记语言,语法简单,排版方便,正好最近想学习大数据与机器学习相关的知识,并计划时常写一些博客来做笔记,感觉Markdown应该是比较适合编辑,所以把博客园的编辑器改成了markdown,并在以后的记录中习惯使用。下面就总结一些Markdown的基本语法方便随时查阅。 1.阅读全文
posted @ 2016-08-15 11:01 jinhaolin 阅读(496) 评论(1) 编辑
摘要: 以下依次列出python2常遇到的几个问题及讲解。 # -*- coding:utf-8 -*- python2默认以ASCII编码,但是在实际编码过程中,我们会用到很多中文,为了不使包含中文的程序报错,也是为了符合国际通用惯例,一般将我们的文件编码设置为utf-8格式。 设定编码的格式有很多种,只阅读全文
posted @ 2016-01-14 00:53 jinhaolin 阅读(1658) 评论(1) 编辑
摘要: 在开始之前先要吐槽一下CSDN,昨晚怀着激动得心情写下了我人生中的第一篇博文,今天审核通过后发现所有的图片都不见了,瞬间就不开心了。所以不得不又申请了博客园的账号,重新开始。 前段时间一直研究通用爬虫,做的过程中也是各种问题,不过好在磕磕绊绊搞出点眉目,中间学到了不少东西,感觉互联网真的好神奇。 但阅读全文
posted @ 2015-12-09 18:25 jinhaolin 阅读(2355) 评论(3) 编辑
作者:Leo Chin
出处:http://www.cnblogs.com/hnrainll/
本博客文章,大多系网络中收集,转载请注明出处
相关标签:嵌入式培训嵌入式开发嵌入式学习