• 博客园logo
  • 会员
  • 众包
  • 新闻
  • 博问
  • 闪存
  • 赞助商
  • HarmonyOS
  • Chat2DB
    • 搜索
      所有博客
    • 搜索
      当前博客
  • 写随笔 我的博客 短消息 简洁模式
    用户头像
    我的博客 我的园子 账号设置 会员中心 简洁模式 ... 退出登录
    注册 登录
xiao dan feng
博客园 首页 新随笔 联系 订阅 订阅 管理
上一页 1 2 3 下一页

2014年6月4日

ntlk_data安装小结
摘要: 《Python自然语言处理》用nltk.download()的方法安装书中所用语料库数据,不太好使。一是部分网友反映的下载很慢很慢,二是下载链接,无论书上、NLTK官网(http://nltk.org/nltk_data/)、网友博客(http://www.cnblogs.com/ToDoToTry... 阅读全文
posted @ 2014-06-04 17:16 xiao dan feng 阅读(1630) 评论(0) 推荐(0)
 
 

2014年6月2日

Logistic回归小结
摘要: 1.梯度上升优化1). 伪代码:所有回归系数初始化为1-------------------weights = ones((colNum,1))重复r次: 计算整个数据集的梯度gradient 使用alpha*gradient更新回归系数的向量 返回回归系数weights2). 迭代r次的代码... 阅读全文
posted @ 2014-06-02 16:05 xiao dan feng 阅读(1333) 评论(1) 推荐(0)
 
 

2014年5月31日

SVD小结
摘要: 1.矩阵分解假设一个矩阵Data是m行n列,SVD(奇异值分解)将Data分解为U,E,VT 三个矩阵:Datam*n=Um*kEk*kVTk*nE是一个对角矩阵,对角元素为奇异值,对应Data的奇异值,即Data*DataT特征值的平方2.选取特征下面确定选取哪几维特征实现降维,去除噪声和冗余信息... 阅读全文
posted @ 2014-05-31 15:55 xiao dan feng 阅读(203) 评论(0) 推荐(0)
 
 

2014年5月8日

在window上安装pandas
摘要: 之前在ubuntu上安装pandas,用的easy_install。这次在window上同样方法装遇到"unable to find vcvarsall.bat",看一些网上帖子好像说这个要装minGW解决,不喜欢装那么东西。就直接下exe装pandas,但也遇到问题,在注册表里找不到python2... 阅读全文
posted @ 2014-05-08 19:42 xiao dan feng 阅读(322) 评论(0) 推荐(0)
 
 

2014年4月25日

Day14 summary
摘要: Since I am writing blog in Ubuntu which has not installed Chinese language package, this blog will be in poor English.It's terrible to run into proble... 阅读全文
posted @ 2014-04-25 23:03 xiao dan feng 阅读(204) 评论(0) 推荐(0)
 
 

2014年4月20日

Day7
摘要: 看集体编程智慧第一章,做基于del.ici.ous建推荐系统那个练习,需要API。自从打通google API后现在见什么API都妥妥的。不过这个是人家事先编写好的python API,http://code.google.com/p/pydelicious/downloads/list下载下来,用... 阅读全文
posted @ 2014-04-20 21:19 xiao dan feng 阅读(190) 评论(0) 推荐(0)
 
Day9 summary
摘要: 昨天又翻出收藏夹里一个叫“谷子粒”的bloghttp://1.guzili.sinaapp.com/?p=128#more-128,链接是博主整理的机器学习方面的热点微博,相当的干货。要说我是从知乎对数据挖掘、机器学习入的门,那现在我在微博又进一阶。这里接触到更多的国内外大牛教授,活跃的中青年MLe... 阅读全文
posted @ 2014-04-20 21:19 xiao dan feng 阅读(156) 评论(0) 推荐(0)
 
 

2014年4月17日

Day6 google Geocoding API
摘要: 在看机器学习实战中K-means一章,练习中需要调用Yahoo PlaceFinder API 为地点添加经纬度,语言是python。申请到了appid但调用好像还要收费,要填写银行卡号才能用,没管那么多直接用了。而且网上关于这个API调用的参考文章很少。鼓捣半天用JSON加载API URL进行调用... 阅读全文
posted @ 2014-04-17 13:02 xiao dan feng 阅读(450) 评论(1) 推荐(0)
 
 

2014年4月13日

Day3 summary
摘要: 今天主要学习了K-means算法,又过了遍Andrew教授的coursera视频,弄明白了Action书上的算法。困难出现在实例练习,申请Yahoo place finder API获得了appid,但不确定是否要收费,反正案例使用时没有返回像书上出现的结果,也不确定问题是否出现在json加载时编解... 阅读全文
posted @ 2014-04-13 23:27 xiao dan feng 阅读(130) 评论(0) 推荐(0)
 
 

2014年4月12日

Day2 summary
摘要: 感觉今天就对电脑大扫除了。卸了一早上cygwin也没找到方法,只能先放着不管,真上linux时才说。搜了搜linux视频教程很多,应该好开个头。但这个毕竟是优先级不够高的。高的必须是论文啊,还有学会DM的手艺。跟捡白菜似的先验验网上的数据源都能用不,好用不。数据堂看起来也不那么给力,微博数据自己挖更对准需求,电商数据要100~800人民币,暂且不会去用吧。其他的数据源看起来也一个德行,之后还要再甄别甄别。找好数据源,还要有用的场景,怎么挖怎么用,一些竞赛像kaggle、数据堂等上面的可供参考。学位论文上的应用也是好参考。明天做什么呢? 阅读全文
posted @ 2014-04-12 23:18 xiao dan feng 阅读(125) 评论(0) 推荐(0)
 
 
上一页 1 2 3 下一页

公告


博客园  ©  2004-2025
浙公网安备 33010602011771号 浙ICP备2021040463号-3