上一页 1 2 3 4 5 6 7 8 ··· 18 下一页

2021年4月7日

pd.read_excel 读取大文件

摘要: 批量读取 import os import pandas as pd HERE = os.path.abspath(os.path.dirname(__file__)) DATA_DIR = os.path.abspath(os.path.join(HERE, '..', 'data')) def 阅读全文

posted @ 2021-04-07 17:33 iUpoint 阅读(1562) 评论(0) 推荐(0)

基于统计的机器翻译

摘要: 1. 中英文平行语料预处理中文处理数据泛化,解决数据稀疏问题数字 $number日期 $date时间 $time网址等 $literal专有名词处理:如“东北大学信息学院”建议拆分为“东北大学”、“信息学院”,有助于抽取出更多翻译规则 英文大小写句尾结束符与最后单词用空格分开数据泛化处理 其他全角 阅读全文

posted @ 2021-04-07 16:15 iUpoint 阅读(281) 评论(0) 推荐(0)

2021年4月6日

时间序列预测之 AUTO-ARIMA

摘要: 参考链接:常用7种时间序列预测模型 用python做时间序列预测九:ARIMA模型简介 运用ARIMA进行时间序列建模的基本步骤: 1)加载数据:构建模型的第一步当然是加载数据集。 2)预处理:根据数据集定义预处理步骤。包括创建时间戳、日期/时间列转换为d类型、序列单变量化等。 3)序列平稳化:为了 阅读全文

posted @ 2021-04-06 14:41 iUpoint 阅读(13477) 评论(2) 推荐(3)

用户画像

摘要: 阅读全文

posted @ 2021-04-06 10:59 iUpoint 阅读(42) 评论(0) 推荐(0)

2021年4月5日

mysql 数据导出

摘要: use movie; #CMD命令 查看MySql的导入与导出的目录【其他目录无权限】 # 使用mysql -u root -p 连接mysql # show variables like '%secure%' #+ + + #| Variable_name | Value | #+ + + #| 阅读全文

posted @ 2021-04-05 11:39 iUpoint 阅读(85) 评论(0) 推荐(0)

2021年4月4日

neo4j

摘要: neo4j简介 开源 NoSQL 数据库,原生的图数据库,2003 年开始开发,使用 scala和java 语言,2007年开始发布; 世界上最先进的图数据库之一,提供原生的图数据存储,检索和处理; 采用属性图模型(Property graph model),极大的完善和丰富图数据模型; 专属查询语 阅读全文

posted @ 2021-04-04 22:08 iUpoint 阅读(510) 评论(0) 推荐(0)

2021年4月2日

windows系统下pyspark安装

摘要: 1. spark环境搭建 Win7 系统下用IDEA创建Spark工程,由于版本之间相互依赖,下载时要看清楚版本。 jdk-8u281-windows-x64.exe spark-3.1.1-bin-hadoop2.7.tgz spark是基于scala开发,具体可从 spark与scala版本对应 阅读全文

posted @ 2021-04-02 14:16 iUpoint 阅读(1353) 评论(0) 推荐(0)

2021年3月31日

sqluldr用法

摘要: --参考链接:http://blog.itpub.net/10951282/viewspace-757712/ --ctl中默认记录间的分割符是回车换行符,当记录中含回车换行符时,可运用str属性指定记录分隔符:infile test.dat "str '|\r\n" --设置字符集:UTF8、AL 阅读全文

posted @ 2021-03-31 10:27 iUpoint 阅读(1159) 评论(0) 推荐(0)

2021年3月30日

对于特征离散化,特征交叉,连续特征离散化非常经典的解释

摘要: 转自: 对于特征离散化,特征交叉,连续特征离散化非常经典的解释 一.互联网广告特征工程 博文《互联网广告综述之点击率系统》论述了互联网广告的点击率系统,可以看到,其中的logistic regression模型是比较简单而且实用的,其训练方法虽然有多种,但目标是一致的,训练结果对效果的影响是比较大, 阅读全文

posted @ 2021-03-30 07:58 iUpoint 阅读(291) 评论(0) 推荐(0)

2021年3月26日

multi-class、multi-label、multi-output的区别与联系

摘要: 一直很纠结Multi-class, Multi-label 以及 Multi-task 各自的区别和联系,最近找到了以下的说明资料: Multiclass classification means a classification task with more than two classes; e 阅读全文

posted @ 2021-03-26 07:45 iUpoint 阅读(891) 评论(0) 推荐(0)

上一页 1 2 3 4 5 6 7 8 ··· 18 下一页

导航