摘要: 1、random.random() 生成0-1之间的浮点数 2、random.randint(m, n) 生成[m, n]之间的随机整数 3、random.uniform(m, n) 生成[m, n]之间的随机浮点数 4、random.shuffle(list) 将列表中的元素打乱 。。。。。。 阅读全文
posted @ 2020-06-22 10:44 青晨forever 阅读(2370) 评论(0) 推荐(0)
摘要: crazystring = ‘dade142.;!0142f[.,]ad’ newStr = ''.join(list(filter(str.isalnum, crazystring) ‘dade1420142fad’)) #红色字体函数不能少。 只保留数字 >>> filter(str.isdig 阅读全文
posted @ 2020-06-17 16:17 青晨forever 阅读(7188) 评论(0) 推荐(1)
摘要: import pandas as pd #y_pred是ndarray #将ndarray转为series pred = pd.Series(y_pred.tolist()) #y_test、content、都是series dict = {'prediction':pred.values, '内容 阅读全文
posted @ 2020-05-28 10:30 青晨forever 阅读(9767) 评论(0) 推荐(0)
摘要: 1、特征工程原则:特征之间、特征和label之间不要有相关性,保持相对独立,有算法就专门为了识别强相关性特征只保留一个。 多重共线性:在很多实际的数据当中,往往存在多个互相关联的特征,这时候模型就会变得不稳定,数据中细微的变化就可能导致模型的巨大变化(模型的变化本质上是系数,或者叫参数,可以理解成W 阅读全文
posted @ 2020-05-22 18:03 青晨forever 阅读(106) 评论(0) 推荐(0)
摘要: (1)两个dataframe横向拼接 (2)将array数组转换成DataFrame的形式 data_frame = DataFrame(data_array,index=None,columns = ['a','b','c','d']) 阅读全文
posted @ 2020-05-21 12:33 青晨forever 阅读(143) 评论(0) 推荐(0)
摘要: 1,保存模型: my_model = create_model_function( ...... ) my_model.compile( ...... ) my_model.fit( ...... ) model_name . save( filepath, overwrite: bool=True 阅读全文
posted @ 2020-05-20 10:52 青晨forever 阅读(884) 评论(0) 推荐(0)
摘要: 定义: list:链表,有序的项目, 通过索引进行查找,使用方括号”[]”; tuple:元组,元组将多样的对象集合到一起,不能修改,通过索引进行查找, 使用括号”()”; dict:字典,字典是一组键(key)和值(value)的组合,通过键(key)进行查找,没有顺序, 使用大括号”{}”; s 阅读全文
posted @ 2020-05-19 11:49 青晨forever 阅读(633) 评论(0) 推荐(0)
摘要: 1、raw_input([prompt]) 函数从标准输入读取一个行,并返回一个字符串(去掉结尾的换行符) 2、input([prompt]) 函数和 raw_input([prompt]) 函数基本类似,但是 input 可以接收一个Python表达式作为输入,并将运算结果返回。就是必须符合Pyt 阅读全文
posted @ 2020-05-19 11:39 青晨forever 阅读(525) 评论(0) 推荐(0)
摘要: 在正则表达式中,如果直接给出字符,就是精确匹配。用\d可以匹配一个数字,\w可以匹配一个字母或数字 .可以匹配任意字符 在正则表达式中,用*表示任意个字符(包括0个),用+表示至少一个字符,用?表示0个或1个字符,用{n}表示n个字符,用{n,m}表示n-m个字符 要做更精确地匹配,可以用[]表示范 阅读全文
posted @ 2020-05-18 18:39 青晨forever 阅读(149) 评论(0) 推荐(0)
摘要: 1、 2、目前Apache Spark支持三种分布式部署方式,分别是standalone、spark on mesos和 spark on YARN 3、 阅读全文
posted @ 2020-05-18 17:44 青晨forever 阅读(141) 评论(0) 推荐(0)