随笔分类 -  Python

摘要:1 阅读全文
posted @ 2021-03-10 21:22 大数据程序员 阅读(33) 评论(0) 推荐(0)
摘要:1 阅读全文
posted @ 2021-03-10 12:29 大数据程序员 阅读(39) 评论(0) 推荐(0)
摘要:KMeans聚类基于python有两种实现方式,一种是手动写算法实现聚类,另一种是采用写好的算法自动实现聚类,下面针对两种方法进行代码实现 一、数据准备 文件 testSet.txt 数据如下: 1.658985 4.285136 -3.453687 3.424321 4.838138 -1.151 阅读全文
posted @ 2021-03-09 21:29 大数据程序员 阅读(1112) 评论(0) 推荐(0)
摘要:一、数据准备:文件 words数据如下: hello spark hello python hello scala hello spark hello python 二、python代码实现如下: 1 from pyspark import SparkConf, SparkContext 2 3 i 阅读全文
posted @ 2021-03-09 21:27 大数据程序员 阅读(89) 评论(0) 推荐(0)
摘要:1 阅读全文
posted @ 2021-03-09 20:31 大数据程序员 阅读(55) 评论(0) 推荐(0)
摘要:转载于https://www.cnblogs.com/qy1234/p/8520691.html 阅读全文
posted @ 2021-03-09 20:19 大数据程序员 阅读(167) 评论(0) 推荐(0)
摘要:1) 安装python环境 安装python有两种方式:原生安装、Ancona安装 以上安装路径中不能有中文,不能有空格 2) window中必须配置SPARK_HOME 3) 在python中安装py4j模块 两种安装方式:建议使用第二(2)种 (1)使用 pip install py4j 进入 阅读全文
posted @ 2021-03-09 10:27 大数据程序员 阅读(532) 评论(0) 推荐(0)
摘要:使用pip安装py4j的方式:进入到安装Anaconda的Script目录下:cmd,然后输入 pip install py4j 进行安装 安装时出现问题:You are using pip version 10.0.1, however version 21.0.1 is available 完美 阅读全文
posted @ 2021-03-09 09:54 大数据程序员 阅读(2665) 评论(0) 推荐(0)
摘要:常用函数 阅读全文
posted @ 2021-03-08 14:41 大数据程序员 阅读(295) 评论(0) 推荐(0)
摘要:1 import numpy as np 2 # 一维数组 切片 3 # array = np.arange(10)**3 4 # print(array) 5 # #获取第三个元素 6 # print(array[2]) 7 # #获取第三到第五个元素 8 # print(array[2:5]) 阅读全文
posted @ 2021-03-08 11:29 大数据程序员 阅读(1194) 评论(0) 推荐(0)
摘要:1 import numpy as np 2 # 手动创建数组 3 # array = np.array([1,2,3]) 4 # array = np.array([[1,2,3],[4,5,6]],dtype=int) 5 # array = np.array([[1,2,3],[4,5,6]] 阅读全文
posted @ 2021-03-08 11:28 大数据程序员 阅读(643) 评论(0) 推荐(0)
摘要:1、所谓的列表推导式,就是指的轻量级循环创建列表: a = [i for i in range(1,10)] # [1, 2, 3, 4, 5, 6, 7, 8, 9] b= [11 for i in range(1,10)] # [11, 11, 11, 11, 11, 11, 11, 11, 1 阅读全文
posted @ 2021-03-08 11:27 大数据程序员 阅读(335) 评论(0) 推荐(0)
摘要:一、创建数据库实例 1 from pymysql import * 2 # 创建数据库实例 3 #1.建立数据库连接 4 conn = connect(host="192.168.20.101",user="root",password="123456") 5 # 2.获取游标对象 6 mycur 阅读全文
posted @ 2021-03-08 11:26 大数据程序员 阅读(3145) 评论(0) 推荐(0)
摘要:安装步骤: 一、在cmd中输入%HOMEPATH%目录打开,查看是否有 .condarc 文件,没有 .condarc 文件的话,新建一个 .condarc 文件,文件中的内容如下: channels: - http://mirrors.tuna.tsinghua.edu.cn/anaconda/p 阅读全文
posted @ 2021-03-07 16:40 大数据程序员 阅读(2519) 评论(0) 推荐(0)
摘要:https://www.cnblogs.com/yuxuefeng/articles/9235431.html 阅读全文
posted @ 2021-03-04 19:12 大数据程序员 阅读(80) 评论(0) 推荐(0)