05 2008 档案
蛙蛙推荐:利用Excel进行销售量预测
摘要: 利用excel做线性增长预测
昨天看了个帖子http://www.cnblogs.com/shenyisyn/archive/2008/05/20/1203061.html,自己写程序实现线性预测,其实excel也有这功能。假如我们知道了1季度的每天的销售额,我们要推算出后半年的销售额,以便制定原材料采购计划。当然销售量受很多因素影响,季节,营销,地区等,我们先不考虑这些情况,单纯利用线性公式来做预测,如果要把多种属性进行考虑和建模的话,得用sqlserver的BI功能了。
阅读全文
posted @
2008-05-23 12:42 蛙蛙池塘 阅读(1160) |
评论 (14) 编辑
蛙蛙推荐:蛙蛙教你索引邮件
摘要: 困了,不多说了,就是教你怎样把邮件建立索引,再搜索出来。用MAPI把邮件读取到数据库里,用SharpICTCLAS做一个lucene的中文的语汇单元分析器,用lucene建立索引及查询索引。
阅读全文
posted @
2008-05-21 00:23 蛙蛙池塘 阅读(1909) |
评论 (12) 编辑
蛙蛙推荐:蛙蛙牌关键词提取算法
摘要: 摘要:昨天给大家演示简单的文本聚类,但要给每个聚类再提取一两个关键词用于表示该聚类。我们还是用TFIDF算法来做,因为这是比较简单的提取特征算法,不过这里的TF是指某词在本聚类内所有文章的词频,而不是本文章内出现的次数,IDF还是在所有文章里出现的倒文档频率。
阅读全文
posted @
2008-05-11 23:34 蛙蛙池塘 阅读(1635) |
评论 (8) 编辑
蛙蛙推荐:蛙蛙教你文本聚类
摘要: 摘要:文本聚类是搜索引擎和语义web的基本技术,这次本蛙和大家一起学习一下简单的文本聚类算法,可能不能直接用于实际应用中,但对于想学搜索技术的初学者还是有一定入门作用的。这里会用到TF/IDF权重,用余弦夹角计算文本相似度,用方差计算两个数据间欧式距离,用k-means进行数据聚类等数学和统计知识。关于这些概念可以去google,或者参考文本后的参考链接。
阅读全文
posted @
2008-05-10 20:43 蛙蛙池塘 阅读(2130) |
评论 (16) 编辑
蛙蛙推荐:蛙蛙牌软件注册码算法
摘要: 摘要:辛辛苦苦写个共享软件,又怕被人破解,所以就会想到用注册码的方式来激活软件。本蛙给大家一个简单的思路来实现软件注册码算法,当然.net做的东西很容易被人破解,反编译出来把验证注册码的代码一去就算破解了,不过咱不讨论这个先。
阅读全文
posted @
2008-05-03 21:55 蛙蛙池塘 阅读(2327) |
评论 (34) 编辑
蛙蛙推荐:蛙蛙牌广告鼓励算法
摘要: 不知道有多少人去研究google,阿里妈妈的广告作弊算法,抓包、分析http头,分析参数,分析cookies,甚至分析鼠标的点击序列,写钩子用程序去点广告,或者去模仿用户行为,我说这太麻烦了。不管你的广告做的多么好,你的广告点击次和广告商的收益低于一定比例,人家肯定不会给你广告费的,人家又不傻。这里用另一种思路去鼓励你的网站访问者去随机的点击广告,毕竟最终是人点的,咱只是鼓励一下,还不算不道德,是吧。
阅读全文
posted @
2008-05-01 12:57 蛙蛙池塘 阅读(1742) |
评论 (22) 编辑