摘要: 1.spark_ml: https://www.cnblogs.com/TiePiHeTao/p/aefd22e3972417daaedb414942df7ed6.html 2.机器学习简介I https://www.cnblogs.com/anliven/p/10187975.html#_labe 阅读全文
posted @ 2020-05-08 17:39 哒哒哒2018 阅读(146) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-03-05 15:30 哒哒哒2018 阅读(130) 评论(0) 推荐(0) 编辑
摘要: 阅读全文
posted @ 2021-03-05 15:08 哒哒哒2018 阅读(186) 评论(0) 推荐(0) 编辑
摘要: #!/usr/bin/env python # coding: utf-8 # # 推荐系统 # # - 音乐数据处理 # # - 基于商品相似性的推荐 # # - 基于SVD矩阵分解的推荐 # In[1]: import os os.getcwd() # ## 数据读取 # In[2]: impo 阅读全文
posted @ 2021-03-05 14:58 哒哒哒2018 阅读(247) 评论(0) 推荐(0) 编辑
摘要: 我们先来看看现行规则,用公式表示为: BlogScore = BeRead + 10 * BeComment + 50 * CommentBlogScore:博客积分BeRead:个人博客所有随笔和文章的阅读数之和BeComment:个人博客被评论总数Comment: 个人所发表的评论总数 我从这个 阅读全文
posted @ 2020-05-24 18:04 哒哒哒2018 阅读(440) 评论(3) 推荐(3) 编辑
摘要: 机器学习是计算机科学的分支——人工智能的一个子集,它通常使用统计学方法,借助数据,赋予计算机“学习”的能力(例如,逐渐提高在特定任务上的表现)而不需要明确编写学习过程[1]。 机器学习的名字是Arthur Samuel [2] 在1959年创建的。它由人工智能 [3] 中的模式识别与计算学习理论研究 阅读全文
posted @ 2020-05-08 17:29 哒哒哒2018 阅读(229) 评论(0) 推荐(0) 编辑
摘要: SparkMLlib的简介 MLLIB是Spark的机器学习库。提供了利用Spark构建大规模和易用性的机器学习平台,组件: ML 算法:包括了分类、聚类、降维、协同过滤 Featurization特征化:特征抽取、特征转换、特征降维、特征选择 Pipelines管道:tools for const 阅读全文
posted @ 2020-05-08 17:27 哒哒哒2018 阅读(478) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: utf-8 -*- """ Created on Sun Jun 11 09:56:39 2017 @author: Raghav Bali """ """ This script visualizes data using matplotlib ``Execute`` 阅读全文
posted @ 2020-04-25 11:46 哒哒哒2018 阅读(241) 评论(0) 推荐(0) 编辑
摘要: def rdic(): fr = open('dic.txt','r') for line in fr: line = line.replace("\n",'') v = line.split(':') dic[v[0]] = v[1] keys.append(v[0]) fr.close() de 阅读全文
posted @ 2020-03-04 23:01 哒哒哒2018 阅读(2557) 评论(0) 推荐(0) 编辑
摘要: #python语言 import pandas as pd import time data = pd.read_excel('ETL_数据清洗挑战.xlsx','测试数据',dtype=str)#读取数据 data_dict = data.to_dict(orient = 'dict')#将数据转 阅读全文
posted @ 2019-04-28 16:06 哒哒哒2018 阅读(1574) 评论(0) 推荐(0) 编辑