会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
alisonzhu
Data Science 相关
博客园
首页
新随笔
联系
管理
订阅
2016年11月14日
python 过滤字母、标点等 保留数字
摘要: crazystring = ‘dade142.;!0142f[.,]ad’ 只保留数字 filter(str.isdigit, crazystring) ‘1420142’ 只保留字母 filter(str.isalpha, crazystring) ‘dadefad’ 只保留字母和数字 filte
阅读全文
posted @ 2016-11-14 17:28 alisonzhu
阅读(8994)
评论(0)
推荐(0)
2016年8月2日
python 上下文管理器
摘要: vi withCM.py 在Linux里编辑文件withCM.py 下面是文件正文 f = open("new.txt","w") print (f.closed) 输出判断文件是否关闭的属性 f.write("Hello world!") f.close() print (f.closed) 在L
阅读全文
posted @ 2016-08-02 23:30 alisonzhu
阅读(232)
评论(0)
推荐(0)
2015年5月15日
linux下安装gcc及设置多版本gcc多版本共存(如果enable静态库,会报错,不知道为什么,忽略静态库就没问题了)
摘要: 背景:1、在做文本挖掘的时候,安装“结巴”算法包,需要gcc版本>4.6,但是不知道是不是有内核或其他东西是gcc低版本支持的,只好安装多版本; 2、linux版本:Red Hat Enterprise Linux Server release 6.2 (Santiago); 3...
阅读全文
posted @ 2015-05-15 20:09 alisonzhu
阅读(4417)
评论(0)
推荐(0)
2015年2月10日
excel中两列匹配,取匹配列的后一列数据
摘要: 刚在处理excel数据时,遇到如下问题:已知A列的英文名和B列的中文名,现有一批C列的英文名,想根据A/B列的对应规则,输出C列对应的中文名。但是C列的顺序和A列顺序不一致,也不一定所有内容都被包含在A列。举例:A B C ...
阅读全文
posted @ 2015-02-10 14:51 alisonzhu
阅读(4974)
评论(0)
推荐(0)
2015年2月6日
Mac版和windows版 R语言中文乱码
摘要: Mac版:R读取excel文件时,先转换成csv格式文件,但是读取过程中总提示错误:“错误于make.names( col.names, unique=TRUE):‘’多字节字符串有错”查看数据时,所有中文也不能正常显示。判断为中文乱码问题。重新读取过程中:加上代码:encoding="utf-8"...
阅读全文
posted @ 2015-02-06 18:00 alisonzhu
阅读(12852)
评论(1)
推荐(0)
2014年11月16日
ods
摘要: ODS(英语:Operational Data Store)是一种数据架构或数据库设计的概念,出现原因是来自于当需要集成来自多个系统的数据,结果又要给一或多个系统使用时。集成来自多个系统的数据,应先创建数据模型(data model)。由于ODS并不属于特定的系统,因此其数据模型的设计应为主题导向式...
阅读全文
posted @ 2014-11-16 22:47 alisonzhu
阅读(360)
评论(0)
推荐(0)
设置RStudio工作文档路径
摘要: 一、指定想要保存R相关文档的路径,建立文件夹: (一)在Mac OS X系统: 1.选择Finder 2.直接按下cmd+shift+G,输入路径(如:/Users/alisonzhu)(~/Library/Preferences是系统文件) ...
阅读全文
posted @ 2014-11-16 12:49 alisonzhu
阅读(19156)
评论(0)
推荐(0)
2014年11月12日
Sql%Rowcount
摘要: sql%rowcount用于记录修改的条数,如同在sqlplus下执行delete from之后提示已删除xx行一样, 这个参数必须要在一个修改语句和commit之间放置,否则就得不到正确的修改行数。
阅读全文
posted @ 2014-11-12 01:21 alisonzhu
阅读(358)
评论(0)
推荐(0)
/*+parallel(t,8)*/
摘要: /* */在Oracle中是hint,/*+parallel(t,8)*/意思是强行启用并行模式来执行当前SQL,按理是数字越大,执行效率越高。一般为CPU的倍数如:4,8等,在执行类型SQL必须先运行:alter session enable parallel dml 。基于并行查询要启动并行进程...
阅读全文
posted @ 2014-11-12 01:15 alisonzhu
阅读(2288)
评论(0)
推荐(0)
2014年11月10日
/*+append*/
摘要: 在Oracle里,语句:insert/*+append*/intotable1select*fromtable2 /*+APPEND*/不去寻找freelist中的freeblock,直接在tableHWM上面加入数据。也就是说,/*+APPEND*/在表...
阅读全文
posted @ 2014-11-10 17:39 alisonzhu
阅读(1186)
评论(0)
推荐(0)
公告