摘要: 创建目录:mkdir 修改文件属性权限:chmod (change mode) 编辑权限:vim 保存并退出编辑: 按esc + :wq! 展开文件属性以及文件所属的用户和组: ll 或 ls -l 更改文件属性 chgrp:更改文件属组 | chgrp [-R] 属组名 文件名 | -R表示递归更 阅读全文
posted @ 2023-12-27 14:42 柒久酒 阅读(1) 评论(0) 推荐(0) 编辑
摘要: 读取h5 文件时报错: python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte" 法一:MS = pd.read_csv("path",encoding = "ISO-8859-1", engine='python',delimit 阅读全文
posted @ 2021-07-01 15:11 柒久酒 阅读(1261) 评论(0) 推荐(0) 编辑
摘要: 独热编码应用于有许多类的列时,会导致并行性和多重共线性问题。 解决方式有: ①限制n个最常见的类别(可覆盖约95%的数量) ②频率编码:用其计数或者频率代替某个类别(最常用)。缺点:若计数相同,则模型做相同处理导致信息丢失 ③目标编码:用该类别的平均目标值作为一维数值向量 ④嵌入:对于文本数据类型或 阅读全文
posted @ 2021-06-22 14:03 柒久酒 阅读(504) 评论(0) 推荐(0) 编辑
摘要: compile() 函数将一个字符串编译为字节代码。 compile(source, filename, mode[, flags[, dont_inherit]]) source -- 字符串或者AST(Abstract Syntax Trees)对象。。 filename -- 代码文件名称,如 阅读全文
posted @ 2021-04-23 15:31 柒久酒 阅读(77) 评论(0) 推荐(0) 编辑
摘要: 由于keras只能接受长度相同的序列输入 keras.preprocessing.sequence.pad_sequences(sequences, maxlen=None, dtype='int32', padding='pre', truncating='pre', value=0.) sequ 阅读全文
posted @ 2021-04-23 14:57 柒久酒 阅读(856) 评论(0) 推荐(0) 编辑
摘要: numpy.array(object,dtype = None,copy = True, order ='K',subok = False,ndmin =0) 数组属性: arange:创建等差数组 通过索引找数组位置 阅读全文
posted @ 2021-04-23 11:00 柒久酒 阅读(91) 评论(0) 推荐(0) 编辑
摘要: qurey()方法可以找到特定的行需要注意1.如果数据是dataframe类型,那么需要这样输出筛选出的每一行for index,row in data.query(“nameXXX").iterrows()2. 如果XXX是一个变量,那么可以用@XXX的方式来引用这个东西for index,row 阅读全文
posted @ 2021-04-22 21:48 柒久酒 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-04-22 11:28 柒久酒 阅读(51) 评论(0) 推荐(0) 编辑
摘要: 1.正向/逆向最大匹配法 2.NLP概率图:HMM针对中文分词应用——Viterbi算法 统计学思想:Viterbi算法找出一条概率最大路径(最短的马尔科夫链) jieba支持三种分词: 固有分词 繁体分词 自定义词典 阅读全文
posted @ 2021-04-22 09:50 柒久酒 阅读(54) 评论(0) 推荐(0) 编辑
摘要: re.sub(pattern, repl, string, count=0, flags=0) 参数: pattern : 正则中的模式字符串。 repl : 替换后的字符串,也可为一个函数。 string : 要被查找替换的原始字符串。 count : 模式匹配后替换的最大次数,默认 0 表示替换 阅读全文
posted @ 2021-04-22 09:44 柒久酒 阅读(90) 评论(0) 推荐(0) 编辑