摘要: *args 表示任意个普通参数,调用的时候自动组装为一个tuple **kwags 表示任意个字典类型参数, 调用的时候自动组装成一个dict args和kwags是两个约定俗成的用法。 变长参数可以用*args来解包 >>> args = [3,6]>>> list(range(*args))[3 阅读全文
posted @ 2018-03-19 22:03 郭雪原 阅读(203) 评论(0) 推荐(0)
摘要: linux环境, 运行sh spoon.sh打开图形化界面时经常出现闪退情况。 报错信息如下: 解决方法: vim spoon.sh 这段代码后面添加 阅读全文
posted @ 2018-03-14 17:18 郭雪原 阅读(2829) 评论(0) 推荐(0)
摘要: REPLACE(filed, CHR(10), '') //替换换行符 REPLACE(filed, CHR(13), '') //替换回车符 阅读全文
posted @ 2018-03-14 16:45 郭雪原 阅读(1089) 评论(0) 推荐(0)
摘要: 以下只是本人在使用过程中一些经验,可能有误解不对的地方,希望大家指正。 这个控件可以在job中调用,也可以在transformation中使用。下面将分别说明在两个不同任务中调用时的使用方法和需要注意事项。 一、在job任务中使用 在job中设置变量一般都是设置全局变量,在不同转换间使用。首先需要G 阅读全文
posted @ 2017-11-08 11:33 郭雪原 阅读(19653) 评论(1) 推荐(1)
摘要: A:西米喜欢健身 B:超超不爱健身,喜欢打游戏 step1:分词 A:西米/喜欢/健身 B:超超/不/喜欢/健身,喜欢/打/游戏 step2:列出两个句子的并集 西米/喜欢/健身/超超/不/打/游戏 step3:计算词频向量 A:[1,1,1,0,0,0,0] B:[0,1,1,1,1,1,1] s 阅读全文
posted @ 2017-11-03 17:44 郭雪原 阅读(14385) 评论(0) 推荐(0)
摘要: TF-IDF算法: TF:词频(Term Frequency),即在分词后,某一个词在文档中出现的频率。 IDF:逆文档频率(Inverse Document Frequency)。在词频的基础上给每个词分配权重,如果有三个词的词频一样,但这并不代表这三个词在这篇文章的重要性是一样的,因此还要给这三 阅读全文
posted @ 2017-11-03 16:26 郭雪原 阅读(1549) 评论(0) 推荐(0)
摘要: 1. 常用模块 # 连接数据库 connect()函数创建一个新的数据库连接对话并返回一个新的连接实例对象 # 打开一个操作整个数据库的光标 连接对象可以创建光标用来执行SQL语句 # 执行一个创建表的SQL语句 光标可以使用execute()和executemany()函数 # 传递参数给插入语句 阅读全文
posted @ 2017-11-02 16:21 郭雪原 阅读(1495) 评论(0) 推荐(0)
摘要: 第一次安装出现java -version正确但是javac 报错'JAVAC' 不是内部或外部命令,网上说是因为安装选择路径为一个的时候会覆盖。 变量设置参数如下: 变量名:JAVA_HOME 变量值:C:\Program Files (x86)\Java\jdk // 要根据自己的实际路径配置 变 阅读全文
posted @ 2017-10-18 10:53 郭雪原 阅读(108) 评论(0) 推荐(0)
摘要: 问题描述:在centos机器上部署了kettle脚本,每天定时跑一次,但是并没有成功跑,手动执行命令是可以的。而且写了一个测试的shell脚本也是可以执行的。 解决方案: 将2的错误输出,/usr/local/kettle/data-integration/spoon.sh: line 209: j 阅读全文
posted @ 2017-08-25 17:08 郭雪原 阅读(2211) 评论(0) 推荐(1)
摘要: 列表实现队列操作(FIFO),可以使用标准库里的 collections.deque,deque是double-ended quene的缩写,双端队列的意思,它可以实现从队列头部快速增加和取出对象。 deque用rotate实现跑马灯操作,转自http://www.zlovezl.cn/articl 阅读全文
posted @ 2017-08-14 15:25 郭雪原 阅读(271) 评论(0) 推荐(0)