会员
众包
新闻
博问
闪存
赞助商
HarmonyOS
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
柒久酒
博客园
首页
新随笔
联系
订阅
管理
2024年7月10日
zip( ) 函数
摘要: zip( ) 的作用 b = ["red", "green", "blue"] c = ["leopard", "cheetah", "jaguar"] for x,y in zip(b,c): print(x, y) 输出: red leopard green cheetah blue jagua
阅读全文
posted @ 2024-07-10 14:51 柒久酒
阅读(31)
评论(0)
推荐(0)
2023年12月27日
linux基础
摘要: 创建目录:mkdir 修改文件属性权限:chmod (change mode) 编辑权限:vim 保存并退出编辑: 按esc + :wq! 展开文件属性以及文件所属的用户和组: ll 或 ls -l 更改文件属性 chgrp:更改文件属组 | chgrp [-R] 属组名 文件名 | -R表示递归更
阅读全文
posted @ 2023-12-27 14:41 柒久酒
阅读(23)
评论(0)
推荐(0)
2021年7月1日
python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte"的解决办法
摘要: 读取h5 文件时报错: python 报错"UnicodeDecodeError: 'utf-8' codec can't decode byte" 法一:MS = pd.read_csv("path",encoding = "ISO-8859-1", engine='python',delimit
阅读全文
posted @ 2021-07-01 15:11 柒久酒
阅读(1549)
评论(0)
推荐(0)
2021年6月22日
onehot后导致维数激增的解决方法
摘要: 独热编码应用于有许多类的列时,会导致并行性和多重共线性问题。 解决方式有: ①限制n个最常见的类别(可覆盖约95%的数量) ②频率编码:用其计数或者频率代替某个类别(最常用)。缺点:若计数相同,则模型做相同处理导致信息丢失 ③目标编码:用该类别的平均目标值作为一维数值向量 ④嵌入:对于文本数据类型或
阅读全文
posted @ 2021-06-22 14:03 柒久酒
阅读(806)
评论(0)
推荐(0)
2021年4月23日
python compile()
摘要: compile() 函数将一个字符串编译为字节代码。 compile(source, filename, mode[, flags[, dont_inherit]]) source -- 字符串或者AST(Abstract Syntax Trees)对象。。 filename -- 代码文件名称,如
阅读全文
posted @ 2021-04-23 15:31 柒久酒
阅读(95)
评论(0)
推荐(0)
序列预处理pad_sequences()序列填充
摘要: 由于keras只能接受长度相同的序列输入 keras.preprocessing.sequence.pad_sequences(sequences, maxlen=None, dtype='int32', padding='pre', truncating='pre', value=0.) sequ
阅读全文
posted @ 2021-04-23 14:57 柒久酒
阅读(964)
评论(0)
推荐(0)
numpy.array( )
摘要: numpy.array(object,dtype = None,copy = True, order ='K',subok = False,ndmin =0) 数组属性: arange:创建等差数组 通过索引找数组位置
阅读全文
posted @ 2021-04-23 11:00 柒久酒
阅读(128)
评论(0)
推荐(0)
2021年4月22日
python qurey()
摘要: qurey()方法可以找到特定的行需要注意1.如果数据是dataframe类型,那么需要这样输出筛选出的每一行for index,row in data.query(“nameXXX").iterrows()2. 如果XXX是一个变量,那么可以用@XXX的方式来引用这个东西for index,row
阅读全文
posted @ 2021-04-22 21:48 柒久酒
阅读(107)
评论(0)
推荐(0)
文本的向量化表达
摘要:
阅读全文
posted @ 2021-04-22 11:28 柒久酒
阅读(63)
评论(0)
推荐(0)
文本分词
摘要: 1.正向/逆向最大匹配法 2.NLP概率图:HMM针对中文分词应用——Viterbi算法 统计学思想:Viterbi算法找出一条概率最大路径(最短的马尔科夫链) jieba支持三种分词: 固有分词 繁体分词 自定义词典
阅读全文
posted @ 2021-04-22 09:50 柒久酒
阅读(68)
评论(0)
推荐(0)
下一页
公告