随笔分类 - 数据挖掘
摘要:1、 直接登陆服务器:ssh 2014210***@thumedia.org -p 6349 创建streaming.py: touch streaming.py,并且如下编辑: #! /usr/bin/python import logging import math import time pg2count={} t=1 while 1: fp=open('/tmp/hw3.l...
阅读全文
摘要:1.数据概述 本报告中采用的数据集来自于UCI经典数据集Adult,最初来源是由1994年Barry Becker的统计数据集,该数据集本来最初的主要任务是根据数据集中的相关属性预测某个人的年收入是大于50K还是小于等于50K。本数据集一共有14个属性用来预测个人的年收入,包括了年龄、工作阶层、教育程度、职业、性别、种族、家庭状况等情况。这14个基本属性中有一项属性为fnlwgt,即...
阅读全文

浙公网安备 33010602011771号