12 2020 档案

摘要:直接参考 Eclipse开发JavaWeb项目配置Tomcat,详细教程 如果缺了很多东西 缺了server:eclipse中添加server插件 安装JST Server Adapters 安装JST Server AdaptersExtensions 如果安装的时候卡住了:取消勾选Contact 阅读全文
posted @ 2020-12-26 16:35 vlj 阅读(98) 评论(0) 推荐(0)
摘要:特征选择 阅读全文
posted @ 2020-12-18 22:17 vlj 阅读(136) 评论(0) 推荐(0)
摘要:使用sklearn进行交叉验证 GroupKFold-小记 阅读全文
posted @ 2020-12-18 22:16 vlj 阅读(255) 评论(0) 推荐(0)
摘要:需求 实现猫狗图像二分类,数据描述如下 这个数据集的训练数据集中一共有25000张猫和狗的图片,其中猫、狗各12500张。在测试数据集中有12500张图片,其中猫、狗图片无序混杂,且无对应的标签。 官方网站:https://www.kaggle.com/c/dogs-vs-cats-redux-ke 阅读全文
posted @ 2020-12-16 00:29 vlj 阅读(1762) 评论(0) 推荐(0)
摘要:Reduce端的联结 reduce端联结,又称repartitioned join(重分区联结)或者reparationed sort-merge join(重分区排序-合并联结) reduce侧联结的主要问题是,混洗阶段消耗过大。 先看几个术语与概念 data source:数据源(类似MySql 阅读全文
posted @ 2020-12-08 20:25 vlj 阅读(155) 评论(0) 推荐(0)
摘要:顺序链接MapReduce作业 形如:mapreduce-1 | mapreduce-2 | mapreduce-3 在run函数中,继续写新的job,再通过JobClient.runJob()进行调用 @Override public int run(String[] args) throws E 阅读全文
posted @ 2020-12-08 11:57 vlj 阅读(207) 评论(0) 推荐(0)
摘要:为何使用combiner 减少洗牌的键值对数量 缓解数据倾斜问题 combiner的设计 combiner在数据转换上必须与reducer等价 若Reducer仅处理分配型函数(最大值/最小值/求和/计数),可以使用reducer为combiner 其他:自己设计combiner和reducer 求 阅读全文
posted @ 2020-12-08 10:26 vlj 阅读(132) 评论(0) 推荐(0)
摘要:通过Unix命令使用Streaming 使用命令行方式的时候,输入数据必须为文本,并且每行被视为一个记录。若输入的格式是TextInputFormat,则流操作只会将值传递给mapper 提取第二列数据 input/output:指定输入输出目录 cut -f 2:只取第二列数据 -d ,:指定", 阅读全文
posted @ 2020-12-08 09:33 vlj 阅读(475) 评论(0) 推荐(0)
摘要:数据 专利数据的特性 专利引用数据所构成的关系图与网页链接以及社会网络图大同小异 专利发布以时间为序,特性类似于时间序列 专利关联到一个人和一个位置,可视为个人信息或地理数据 首先拿到专利数据:http://data.nber.org/patents/ 本文使用是的cite75-99.txt,该文件 阅读全文
posted @ 2020-12-07 19:57 vlj 阅读(311) 评论(0) 推荐(0)