2016 年 3月 10 日随笔档案 - HUSTLX

2016年3月10日

摘要：贝叶斯定理设是类标号未知的数据样本，为某种假设，数据样本属于某特定的类 C ，对于该分类问题，期望确定，即给定观测数据样本，假定成立的概率，称为后验概率，或称条件下的后验概率。分类就是要确定。例如，假定数据样本集由顾客组成，用他们的年龄和收入情况进行分类。假定表示顾客的年龄在31岁到40之间并且中等收入，表示顾客将购买电脑，则反映的是观察到顾客的年龄在31岁到40之间并且中等收入时，将购买电... 阅读全文

posted @ 2016-03-10 22:12 HUSTLX 阅读(1337) 评论(0) 推荐(0)

数据预处理

摘要： 1.概述数据挖掘是从大量的，不完全的，有噪声的，模糊的，随即的数据中，提取隐含在其中的，人们事先不知道的，但有潜在的有用信息和知识的过程。数据挖掘过程一般包括数据采集，数据预处理，数据挖掘以及知识评价和呈现。在一个完整的数据挖掘过程中，数据预处理要花费60%左右的时间，而后的挖掘工作仅仅占工工作量的10%左右。目前对挖掘的研究主要集中于挖掘技术，挖掘算法，挖掘语言等在海量的原始数据中，存在这... 阅读全文

posted @ 2016-03-10 20:21 HUSTLX 阅读(6992) 评论(0) 推荐(0)

BP神经网络分类器的设计

摘要： 1.BP神经网络训练过程论述 BP网络结构有3层：输入层、隐含层、输出层，如图1所示。图1 三层BP网络结构 3层BP神经网络学习训练过程主要由4部分组成：输入模式顺传播（输入模式由输入层经隐含层向输出层传播计算）、输出误差逆传播（输出的误差由输出层经隐含层传向输入层）、循环记忆训练（模式顺序传播与误差逆传播的计算过程反复交替循环进行）和学习结果判别（判定全局误差是否趋向极小值）。... 阅读全文

posted @ 2016-03-10 20:11 HUSTLX 阅读(4575) 评论(3) 推荐(2)

聚类算法

摘要：聚类算法李鑫 2014210820 电子系 1、kmeans算法 1.1Kmeans算法理论基础 K均值算法能够使聚类域中所有样品到聚类中心距离平方和最小。其原理为：先取k个初始聚类中心，计算每个样品到这k个中心的距离，找出最小距离，把样品归入最近的聚类中心，修改中心点的值为本类所有样品的均值，再计算各个样品到新的聚类中心的距离，重新归类，修改新的中心点，直到新的聚类中心和上一... 阅读全文

posted @ 2016-03-10 19:35 HUSTLX 阅读(3625) 评论(0) 推荐(0)

HUSTLX

微博http://weibo.com/5290004302/profile?rightmod=1&wvr=6&mod=personinfo&is_all=1

公告