posted @ 2021-12-19 16:01 呱嗒呱嗒 阅读(151) 评论(0) 推荐(0) 编辑
摘要:
文本相似度一般用于处理告警或日志聚类等文本类数据 from simhash import Simhash def simhash_similarity(text1, text2): """ :param text1: 文本1 :param text2: 文本2 :return: 返回两篇文章的相似度 阅读全文
摘要:
G-Research模拟环境下对于时间的处理异常,代码如下: import datetime import os,sys import numpy as np import pandas as pd import gresearch_crypto #env = gresearch_crypto.ma 阅读全文
posted @ 2021-11-29 11:08 呱嗒呱嗒 阅读(339) 评论(0) 推荐(0) 编辑
摘要:
Kaggle新手注册——国内由于屏蔽Google服务验证码无法显示: 解决思路 1)在无成本的情况下选用Firefox或Microsoft edge的扩展插件,如 SetupVPN - Lifetime Free VPN 能够获得一定程度上的免费流量额度,满足注册调用Google服务 2)其他思路 阅读全文
posted @ 2021-11-25 14:21 呱嗒呱嗒 阅读(5335) 评论(0) 推荐(0) 编辑
摘要:
python API请求——SSL报错 During handling of the above exception, another exception occurred: Traceback (most recent call last): File ".\getOpsMindMetrics.p 阅读全文
posted @ 2021-11-24 17:54 呱嗒呱嗒 阅读(389) 评论(0) 推荐(0) 编辑
摘要:
在我们进行数据分析时,通常会遇到各种数据缺失的情况,针对这种情况我们该如何进行填补呢? 1、人工填补 该方法仅适用于小数据集,受个人因素影响。 2、平均值填补 对某一列的缺失值,采用该列的平均值填充 df.fillna(method=a.mean(),inplace=True)#此处重点讲解一下fi 阅读全文
posted @ 2021-11-23 10:04 呱嗒呱嗒 阅读(6097) 评论(0) 推荐(1) 编辑