[置顶] 将python脚本编译成exe文件

摘要: 今天帮朋友实现一个读取图片输出所有点rgb值得小脚本,但是朋友没有python环境,更不用说装各种依赖库了。所以就想把python转成exe发给他。现在常用的工具有py2exe: 不推荐,项目最后更新日期是2008-11-16,对于依赖的管理非常糟糕,写个简单的hello world调试成功,但是引... 阅读全文
posted @ 2015-06-25 14:27 Barthu 阅读(784) 评论(0) 推荐(0)

java使用jni

摘要: Java调用c++的核心是变量类型的转换,java的int与c++中的int是一样的,转换比较简单。而想java中的String,处理就复杂一些。JNIEXPORT jstring JNICALL Java_com_dd_lib_ChineseToPinyin (JNIEnv *env, jclas... 阅读全文
posted @ 2015-05-04 21:20 Barthu 阅读(219) 评论(0) 推荐(0)

hive 构建外表及分区

摘要: hive里分了create table和create external table,external table的好处就是表结构和数据是解绑的,删除表并不会删除数据,表相当于就是定义了去解析相对应的文件时的规范而已。一个比较常见的应用场景是将网站的用户浏览数据建立一个外表,然后按天做分区加快查找... 阅读全文
posted @ 2015-05-04 21:17 Barthu 阅读(4182) 评论(0) 推荐(0)

mysql 实现TF-IDF 遍历不定个数的列

摘要: 有这样一道题,要求使用纯mysql实现一个TF-IDF算法。原始的输入是一个有articles表,有100列,每列存储一个单词。其实核心难点就是怎么遍历对比这100个词和指定词比如'apple'进行对比。首先蛮力穷举所有的列名,如word1 、word2。。。但是这样做代码肯定丑的不像样,而且如果是... 阅读全文
posted @ 2015-05-04 21:14 Barthu 阅读(616) 评论(0) 推荐(0)

python非转义输出utf8编码

摘要: 笔者需要将代码中的utf8编码的字符串str1原样输出到文件里,因为最终需要输出的是一行,并且其中的\t等还需要转义,所以使用r""这种形式也不靠谱。能想到的办法就是把"\xe6"转换成"\\xe6"这样,不过事实上非常难转换,因为'\xe6'整个是一个长字符,无法单独匹配其中的'\'。最终发现了一... 阅读全文
posted @ 2015-05-04 21:09 Barthu 阅读(490) 评论(0) 推荐(0)

sqoop抽取mysql数据 遇到问题及解决方案

摘要: sqoop import --connect 'jdbc:mysql://127.0.0.1/dbname' --username 'username' --password 'userpass' --query "select product_id, price, sale_price, shop... 阅读全文
posted @ 2015-05-04 21:05 Barthu 阅读(2555) 评论(0) 推荐(0)