EdisonZhou - 博客园

2015年7月18日

摘要：

At first，计算机中绝大部分数据都放到内存中的，不同的数据放到不同的内存区域中。But，内存角度没有数据类型，只有二进制；数据以字节（8位二进制）为单位存取。不同数据类型占据不同的字节，例如在32位系统中：int 为4个字节，short为2个字节（下面如未特殊声明，均为32为系统环境下的说明）。下面我们看看int类型、short类型和double类型的数字分别在内存中如何存储：阅读全文

posted @ 2015-07-18 14:56 EdisonZhou 阅读(2277) 评论(0) 推荐(2)

你必须知道的指针基础-1.预备篇：搭建GCC开发环境

摘要：

GCC（GNU Compiler Collection）是一套功能强大、性能优越的编程语言编译器，它是GNU计划的代表作品之一。GCC是Linux平台下最常用的编译器，GCC原名为GNU C Compiler，即GNU C语言编译器，随着GCC支持的语言越来越多，它的名称也逐渐变成了GNU Compiler Collection。下面对GCC的基本使用方法进行介绍。这里我们主要使用Windows系统进行C程序的开发调试，所以我们选择GCC for Windows版本的编译器。阅读全文

posted @ 2015-07-18 13:21 EdisonZhou 阅读(2854) 评论(1) 推荐(2)

2015年7月17日

数据结构基础温故-4.树与二叉树（下）

摘要：

上面两篇我们了解了树的基本概念以及二叉树的遍历算法，还对二叉查找树进行了模拟实现。数学表达式求值是程序设计语言编译中的一个基本问题，表达式求值是栈应用的一个典型案例，表达式分为前缀、中缀和后缀三种形式。这里，我们通过一个四则运算的应用场景，借助二叉树来帮助求解表达式的值。首先，将表达式转换为二叉树，然后通过先序遍历二叉树的方式求出表达式的值。阅读全文

posted @ 2015-07-17 00:38 EdisonZhou 阅读(3862) 评论(1) 推荐(7)

2015年7月14日

数据结构基础温故-4.树与二叉树（中）

摘要：

在上一篇中，我们了解了树的基本概念以及二叉树的基本特点和代码实现，还用递归的方式对二叉树的三种遍历算法进行了代码实现。但是，由于递归需要系统堆栈，所以空间消耗要比非递归代码要大很多。而且，如果递归深度太大，可能系统撑不住。因此，我们使用非递归（这里主要是循环，循环方法比递归方法快, 因为循环避免了一系列函数调用和返回中所涉及到的参数传递和返回值的额外开销）来重新实现一遍各种遍历算法，再对二叉树的另外一种特殊的遍历—层次遍历进行实现，最后再了解一下特殊的二叉树—二叉查找树。阅读全文

posted @ 2015-07-14 01:55 EdisonZhou 阅读(3255) 评论(2) 推荐(11)

2015年7月12日

数据结构基础温故-4.树与二叉树（上）

摘要：

前面所讨论的线性表元素之间都是一对一的关系，今天我们所看到的结构各元素之间却是一对多的关系。树在计算机中有着广泛的应用，甚至在计算机的日常使用中，也可以看到树形结构的身影，如下图所示的Windows资源管理器和应用程序的菜单都属于树形结构。树形结构是一种典型的非线性结构，除了用于表示相邻关系外，还可以表示层次关系。本文重点讨论树与二叉树的基本结构和遍历算法等内容。阅读全文

posted @ 2015-07-12 14:16 EdisonZhou 阅读(4601) 评论(0) 推荐(12)

2015年7月8日

使用Unity3D的设计思想实现一个简单的C#赛车游戏场景

摘要：

最近看了看一个C#游戏开发的公开课，在该公开课中使用面向对象思想与Unity3D游戏开发思想结合的方式，对一个简单的赛车游戏场景进行了实现。原本在C#中很方便地就可以完成的一个小场景，使用Unity3D的设计思想（即一切游戏对象皆空对象，拖拽组件才使其具有了活力）来实现却需要花费大量时间与精力，究竟它神奇在什么地方？本文通过实现这个小例子来看看。阅读全文

posted @ 2015-07-08 01:23 EdisonZhou 阅读(13014) 评论(2) 推荐(4)

2015年7月5日

数据结构基础温故-3.队列

摘要：

在日常生活中，队列的例子比比皆是，例如在车展排队买票，排在队头的处理完离开，后来的必须在队尾排队等候。在程序设计中，队列也有着广泛的应用，例如计算机的任务调度系统、为了削减高峰时期订单请求的消息队列等等。与栈类似，队列也是属于操作受限的线性表，不过队列是只允许在一端进行插入，在另一端进行删除。在其他数据结构如树的一些基本操作中（比如树的广度优先遍历）也需要借助队列来实现，因此这里我们来看看队列。阅读全文

posted @ 2015-07-05 10:27 EdisonZhou 阅读(2806) 评论(3) 推荐(9)

2015年7月4日

数据结构基础温故-2.栈

摘要：

现实生活中的事情往往都能总结归纳成一定的数据结构，例如餐馆中餐盘的堆叠和使用，羽毛球筒里装的羽毛球等都是典型的栈结构。而在.NET中，值类型在线程栈上进行分配，引用类型在托管堆上进行分配，本文所说的“栈”正是这种数据结构。栈和队列都是常用的数据结构，它们的逻辑结构与线性表相通，不同之处则在于操作受某种特殊限制。因此，栈和队列也被称为操作受限的线性表。这里，我们首先来了解一下栈。阅读全文

posted @ 2015-07-04 01:55 EdisonZhou 阅读(3347) 评论(3) 推荐(12)

2015年7月3日

数据结构基础温故-1.线性表（下）

摘要：

在上一篇中，我们了解了单链表与双链表，本次将单链表中终端结点的指针端由空指针改为指向头结点，就使整个单链表形成一个环，这种头尾相接的单链表称为单循环链表，简称循环链表（circular linked list）。循环链表和单链表的主要差异就在于循环的判断条件上，原来是判断p.next是否为空，现在则是p.next不等于头结点，则循环未结束。本文还会使用循环链表以及.NET中内置的LinkedList解决约瑟夫问题。阅读全文

posted @ 2015-07-03 01:05 EdisonZhou 阅读(2681) 评论(4) 推荐(11)

2015年7月1日

数据结构基础温故-1.线性表（中）

摘要：

在上一篇中，我们学习了线性表最基础的表现形式-顺序表，但是其存在一定缺点：必须占用一整块事先分配好的存储空间，在插入和删除操作上需要移动大量元素（即操作不方便），于是不受固定存储空间限制并且可以进行比较快捷地插入和删除操作的链表横空出世，所以我们就来复习一下链表。阅读全文

posted @ 2015-07-01 01:23 EdisonZhou 阅读(4708) 评论(10) 推荐(30)

2015年6月23日

数据结构基础温故-1.线性表（上）

摘要：

线性表是最简单也是在编程当中使用最多的一种数据结构。例如，英文字母表（A,B,C,D...,Z）就是一个线性表，表中的每一个英文字母都是一个数据元素；又如，成绩单也是一个线性表，表中的每一行是一个数据元素，每个数据元素又由学号、姓名、成绩等数据项组成。顺序表和链表作为线性表的两种重要的存在形式，它们是堆栈、队列、树、图等数据结构的实现基础。线性表中的元素在位置上是有序的，类似于储户去银行排队取钱，人们依次排着队，排在前面的先取，排在后面的则后取。这种位置上的有序性就是一种线性关系。由此可以看出：线性表的前后两个元素存在一一对应关系。阅读全文

posted @ 2015-06-23 00:40 EdisonZhou 阅读(9198) 评论(14) 推荐(56)

2015年5月1日

Hadoop学习笔记—21.Hadoop2的改进内容简介

摘要：

Hadoop2相比较于Hadoop1.x来说，HDFS的架构与MapReduce的都有较大的变化，且速度上和可用性上都有了很大的提高，Hadoop2中有两个重要的变更：（1）HDFS的NameNode可以以集群的方式布署，增强了NameNodes的水平扩展能力和高可用性，分别是:HDFS Federation与HA；（2）MapReduce将JobTracker中的资源管理及任务生命周期管理（包括定时触发及监控），拆分成两个独立的组件，并更名为YARN（Yet Another Resource Negotiator）；阅读全文

posted @ 2015-05-01 16:37 EdisonZhou 阅读(4913) 评论(1) 推荐(7)

2015年4月29日

Hadoop学习笔记—20.网站日志分析项目案例（三）统计分析

摘要：

为了能够借助Hive进行统计分析，首先我们需要将清洗后的数据存入Hive中，那么我们需要先建立一张表。这里我们选择分区表，以日期作为分区的指标，建表语句如下：（这里关键之处就在于确定映射的HDFS位置，我这里是/project/techbbs/cleaned即清洗后的数据存放的位置）。建立了分区表之后，就需要增加一个分区，增加分区的语句如下：（这里主要针对20150425这一天的日志进行分区）。阅读全文

posted @ 2015-04-29 01:13 EdisonZhou 阅读(22755) 评论(3) 推荐(16)

2015年4月26日

Hadoop学习笔记—20.网站日志分析项目案例（二）数据清洗

摘要：

（1）根据前一篇的关键指标的分析，我们所要统计分析的均不涉及到访问状态（HTTP状态码）以及本次访问的流量，于是我们首先可以将这两项记录清理掉；（2）根据日志记录的数据格式，我们需要将日期格式转换为平常所见的普通格式如20150426这种，于是我们可以写一个类将日志记录的日期进行转换；（3）由于静态资源的访问请求对我们的数据分析没有意义，于是我们可以将"GET /staticsource/"开头的访问记录过滤掉，又因为GET和POST字符串对我们也没有意义，因此也可以将其省略掉；阅读全文

posted @ 2015-04-26 20:26 EdisonZhou 阅读(53242) 评论(11) 推荐(23)

2015年4月23日

Hadoop学习笔记—20.网站日志分析项目案例（一）项目介绍

摘要：

本次要实践的数据日志来源于国内某技术学习论坛，该论坛由某培训机构主办，汇聚了众多技术学习者，每天都有人发帖、回帖。本次实践的目的就在于通过对该技术论坛的apache common日志进行分析，计算该论坛的一些关键指标，供运营者进行决策时参考。开发该系统的目的是为了获取一些业务相关的指标，这些指标在第三方工具中无法获得的；阅读全文

posted @ 2015-04-23 00:21 EdisonZhou 阅读(30636) 评论(7) 推荐(15)

2015年4月22日

Hadoop学习笔记—19.Flume框架学习

摘要：

Flume是Cloudera提供的一个高可用的、高可靠的开源分布式海量日志收集系统，日志数据可以经过Flume流向需要存储终端目的地。这里的日志是一个统称，泛指文件、操作记录等许多数据。Flume的核心是把数据从数据源收集过来，再送到目的地。为了保证输送一定成功，在送到目的地之前，会先缓存数据，待数据真正到达目的地后，删除自己缓存的数据。阅读全文

posted @ 2015-04-22 00:39 EdisonZhou 阅读(5077) 评论(1) 推荐(2)

2015年4月20日

Hadoop入门学习总结系列文章目录

摘要：

一、为何要学习Hadoop? 这是一个信息爆炸的时代。经过数十年的积累，很多企业都聚集了大量的数据。这些数据也是企业的核心财富之一，怎样从累积的数据里寻找价值，变废为宝炼数成金成为当务之急。但数据增长的速度往往比cpu和内存性能增长的速度还要快得多。要处理海量数据，如果求助于昂贵的专用主机甚至超级计阅读全文

posted @ 2015-04-20 00:15 EdisonZhou 阅读(14646) 评论(9) 推荐(31)

Hadoop学习笔记—18.Sqoop框架学习

摘要：

Hadoop正成为企业用于大数据分析的最热门选择，但想将你的数据移植过去并不容易。Apache Sqoop正在加紧帮助客户将重要数据从数据库移到Hadoop。随着Hadoop和关系型数据库之间的数据移动渐渐变成一个标准的流程，云管理员们能够利用Sqoop的并行批量数据加载能力来简化这一流程，降低编写自定义数据加载脚本的需求。Apache Sqoop（SQL-to-Hadoop）项目旨在协助 RDBMS 与 Hadoop 之间进行高效的大数据交流。用户可以在 Sqoop 的帮助下，轻松地把关系型数据库的数据导入到 Hadoop 与其相关的系统 (如HBase和Hive)中；同时也可以把数据从 Hadoop 系统里抽取并导出到关系型数据库里。因此，可以说Sqoop就是一个阅读全文

posted @ 2015-04-20 00:08 EdisonZhou 阅读(7220) 评论(5) 推荐(10)

2015年4月19日

Hadoop学习笔记—17.Hive框架学习

摘要：

Hive 是建立在 Hadoop 基础上的数据仓库基础构架。它提供了一系列的工具，可以用来进行数据提取转化加载（ETL），这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言，称为 QL ，它允许熟悉 SQL 的用户查询数据。同时，这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。Hive 是 SQL解析引擎，它将SQL语句转译成Map/Reduce Job然后在Hadoop执行。Hive的表其实就是HDFS的目录，按表名把文件夹分开。如果是分区表，则分区值是子文件夹，可以直接在Map/Reduce Job里使用这阅读全文

posted @ 2015-04-19 21:43 EdisonZhou 阅读(11563) 评论(1) 推荐(17)

2015年4月10日

Hadoop学习笔记—16.Pig框架学习

摘要：

Pig是一个基于Hadoop的大规模数据分析平台，它提供的SQL-LIKE语言叫Pig Latin，该语言的编译器会把类SQL的数据分析请求转换为一系列经过优化处理的MapReduce运算。Pig为复杂的海量数据并行计算提供了一个简单的操作和编程接口。相比Java的MapReduce API，Pig为大型数据集的处理提供了更高层次的抽象，与MapReduce相比，Pig提供了更丰富的数据结构，一般都是多值和嵌套的数据结构。Pig还提供了一套更强大的数据变换操作，包括在MapReduce中被忽视的连接Join操作。阅读全文

posted @ 2015-04-10 01:37 EdisonZhou 阅读(6632) 评论(1) 推荐(3)

Edison Zhou

To be a happy Developer and Blogger!

公告