08 2017 档案

摘要:print np.mean(df.title.apply(lambda x: len(x))) # 24.072694718 print df.title.apply(lambda x: len(x) < 30).value_counts() """ True 4069 False 1516 """ 阅读全文
posted @ 2017-08-30 17:11 焦距 阅读(1528) 评论(0) 推荐(0) 编辑
摘要:python 中除了整型,其他进制的只能用字符串来表示 阅读全文
posted @ 2017-08-29 19:51 焦距 阅读(316) 评论(0) 推荐(0) 编辑
摘要:1.问题:在本地用matplotlib绘图可以,但是在ssh远程绘图的时候会报错 RuntimeError: Invalid DISPLAY variable 2.原因:matplotlib的默认backend是TkAgg,而FltkAgg, GTK, GTKAgg, GTKCairo, TkAgg 阅读全文
posted @ 2017-08-29 11:24 焦距 阅读(18580) 评论(0) 推荐(1) 编辑
摘要:1.查看系统目前正在用的内核 2.查看/boot保存的所有内核 3.除了目前正在用的内核(4.4.0-92),把其它没有用的内核删除或者移到其它分区 如果需要更多的空间,同理把4.4.0-83, 4.0.0-87等移除即可 参考: [ubuntu] Boot Partition is Full 阅读全文
posted @ 2017-08-29 10:04 焦距 阅读(3189) 评论(0) 推荐(1) 编辑
摘要:1.安装 安装的时候会提示设置密码 2.使用 (1)mysql操作 (2)数据库操作 (3)表操作 (4)数据操作 其它sql详细语法参考: 21分钟 MySQL 入门教程 阅读全文
posted @ 2017-08-28 15:25 焦距 阅读(262) 评论(0) 推荐(0) 编辑
摘要:1.首先,vim ~/.bashrc 2.然后在文件最下面添加一行:export PATH="$PATH:NEW_PATH" 3.保存后,在终端输入以下命令得修改生效:source ~/.bashrc 4.通过echo命令测试一下: echo $PATH 如果出现了NEW_PATH说明环境变量配置成 阅读全文
posted @ 2017-08-22 20:46 焦距 阅读(495) 评论(0) 推荐(0) 编辑
摘要:转自知乎上看到的一篇很棒的文章:用深度学习(CNN RNN Attention)解决大规模文本分类问题 - 综述和实践 近来在同时做一个应用深度学习解决淘宝商品的类目预测问题的项目,恰好硕士毕业时论文题目便是文本分类问题,趁此机会总结下文本分类领域特别是应用深度学习解决文本分类的相关的思路、做法和部 阅读全文
posted @ 2017-08-22 15:52 焦距 阅读(1013) 评论(0) 推荐(0) 编辑
摘要:LabelEncoder的说明: 阅读全文
posted @ 2017-08-21 15:11 焦距 阅读(5392) 评论(0) 推荐(0) 编辑
摘要:参考了两种方法: 1. 解决fatal: unable to connect to github.com问题 http://blog.csdn.net/greenqingqingws/article/details/11808745原因:需要用https才能读到数据解决方法:输入命令git conf 阅读全文
posted @ 2017-08-21 09:51 焦距 阅读(15015) 评论(1) 推荐(0) 编辑
摘要:目标:本地机器ssh登录远程目标机器时不用输入密码 (默认状态下,ssh user@192.xxx.x.xxx需要输入密码) 原理:通过公钥和私钥实现系统认证 实现:把本地机器的公钥复制到目标机器 具体: 1. 在本地机器生成公钥私钥对(如果之前已经执行过,这一步可以跳过) ssh-keygen - 阅读全文
posted @ 2017-08-18 16:51 焦距 阅读(414) 评论(0) 推荐(0) 编辑
摘要:一.setuptools - 官方文档: Building and Distributing Packages with Setuptools- 中文文档: Python包管理工具setuptools详解 1.使用过程 2. setuptools工具的setup.py的模板 声明依赖包的语法: Th 阅读全文
posted @ 2017-08-18 15:14 焦距 阅读(15021) 评论(0) 推荐(0) 编辑
摘要:1.多行注释: 1. 首先按esc进入命令行模式下,按下Ctrl + v,进入列(也叫区块)模式; 2. 在行首使用上下键选择需要注释的多行; 3. 按下键盘(大写)“I”键,进入插入模式; 4. 然后输入注释符(“//”、“#”等); 5. 最后按下“Esc”键。注:在按下esc键后,会稍等一会才 阅读全文
posted @ 2017-08-17 14:40 焦距 阅读(232) 评论(0) 推荐(0) 编辑
摘要:通过set()获取两个数组的交/并/差集: 阅读全文
posted @ 2017-08-16 22:30 焦距 阅读(13017) 评论(0) 推荐(0) 编辑
摘要:在服务器上训练并保存模型,复制到本地之后load_model()报错: ValueError: Tensor conversion requested dtype int32 for Tensor with dtype float32: 'Tensor("embedding_1/random_uni 阅读全文
posted @ 2017-08-16 22:19 焦距 阅读(11785) 评论(0) 推荐(1) 编辑
摘要:当用户注销(logout)或者网络断开时,终端会收到 HUP(hangup)信号从而关闭其所有子进程。因此,我们的解决办法就有两种途径:要么让进程忽略 HUP 信号,要么让进程运行在新的会话里从而成为不属于此终端的子进程。 (hangup 名称的来由:在 Unix 的早期版本中,每个终端都会通过 m 阅读全文
posted @ 2017-08-16 14:51 焦距 阅读(7510) 评论(0) 推荐(0) 编辑
摘要:报错:'0.80454153 is not JSON serializable' 输出y_pred_prob的类别:<type 'numpy.float32'> 参考https://stackoverflow.com/questions/27050108/convert-numpy-type-to- 阅读全文
posted @ 2017-08-11 16:48 焦距 阅读(8053) 评论(0) 推荐(0) 编辑
摘要:1.安装 sudo apt-get install python-virtualenv 2.使用 创建虚拟环境: virtualenv [虚拟环境名称] 例如: virtualenv env_test 指定python版本: virtualenv env_test --python=python2. 阅读全文
posted @ 2017-08-10 20:51 焦距 阅读(1091) 评论(0) 推荐(1) 编辑
摘要:from itertools import islice start = 1 # 跳过第一行idx=0,从idx=1开始读取文件 with codecs.open('data.json', encoding='utf-8') as fr: for idx, line in enumerate(islice(fr, start, None)): print i... 阅读全文
posted @ 2017-08-10 16:57 焦距 阅读(4566) 评论(0) 推荐(0) 编辑
摘要:对dataframe绘图并保存: 可以制定列,对该列各取值作统计: 阅读全文
posted @ 2017-08-04 17:54 焦距 阅读(5376) 评论(0) 推荐(0) 编辑
摘要:图的基本结构 通常,使用 numpy 组织数据, 使用 matplotlib API 进行数据图像绘制。 一幅数据图基本上包括如下结构: 详细的结构图如下图所示: 画法 按照绘图结构,可将数据图的绘制分为如下几个步骤: 导入 matplotlib 包相关工具包 准备数据,numpy 数组存储 绘制原 阅读全文
posted @ 2017-08-03 17:22 焦距 阅读(916) 评论(0) 推荐(0) 编辑
摘要:利用awk分析data.csv中label列各取值的分布. 在终端执行head data.csv查看数据: 因为行内包含换行符的项会被分成多行(例如上面的第3,4行),所以需要结合正则匹配 -F ',' 表示根据逗号分隔; $(NF-1)~/^[A-Z][0-9]/ 表示分隔后的倒数第二项(在此指取 阅读全文
posted @ 2017-08-03 12:45 焦距 阅读(6103) 评论(0) 推荐(0) 编辑
摘要:1. DataFrame 处理缺失值 dropna() 把在ToC列有缺失值的行去掉 补充:还可以用df.fillna()来把缺失值替换为某个特殊标记 2. 根据某维度计算重复的行 duplicated()、value_counts() duplicated()方法返回一个布尔型的Series,显示 阅读全文
posted @ 2017-08-02 16:04 焦距 阅读(5574) 评论(0) 推荐(1) 编辑
摘要:1.只显示当前目录 找到位置: 将这两个小写的w换成大写W,然后source ~/.bashrc即可 2.终端颜色美化 vim ~/.bashrc 然后下面这行的注释去掉,打开这个变量的开关,即可使用彩色的命令行提示符 关闭force_color_prompt的的效果如下图: 而打开后的效果如下图: 阅读全文
posted @ 2017-08-02 14:37 焦距 阅读(5866) 评论(0) 推荐(1) 编辑
摘要:1.keras模型可视化 keras.utils.vis_utils模块提供了画出Keras模型的函数(利用graphviz) 该函数将画出模型结构图,并保存成图片: plot_model接收两个可选参数: show_shapes:指定是否显示输出数据的形状,默认为False show_layer_ 阅读全文
posted @ 2017-08-01 16:28 焦距 阅读(8233) 评论(0) 推荐(2) 编辑