摘要: 在Windows上,路径中以倒斜杠作为文件夹之间的分隔符,Linux或OS X中则是正斜杠。如果想要程序正确运行于所有操作系统上,就必须要处理这种情况。os.path.join()方法可以正确的根据不同的操作系统来合成路径,它的用法如下: 阅读全文
posted @ 2019-07-03 17:45 Dereen 阅读(2379) 评论(0) 推荐(0) 编辑
摘要: 正则表达式常用符号表格查询,及其详细用法以及一个小案例。 阅读全文
posted @ 2019-06-11 17:41 Dereen 阅读(1639) 评论(0) 推荐(1) 编辑
摘要: 打开CMD后先分别输入下面两条命令: 其中的本地IP 地址和端口号如果你没有改过的话应该是没问题的,改过的话就填改过的。 然后再输入你想用的命令就可以了,亲测速度提升很大,git 的速度从10KiB提高到700KiB。 需要注意的是这个方法不适用于PowerShell, 只适用于默认的CMD命令提示 阅读全文
posted @ 2019-05-01 23:07 Dereen 阅读(466) 评论(0) 推荐(0) 编辑
摘要: 目前清华开源镜像站和中科大开源镜像站均已发出公告表示已取得Anaconda授权,不久就将重新上线Anaconda软件源(见文末图)。那目前我知道的国内可用Anaconda源的镜像站就有3个,分别是清华、中科大、上交。大家可以分别测试一下下载速度和稳定性,自行选择最优的。 各个镜像站的设置方法如下,这 阅读全文
posted @ 2019-04-28 23:58 Dereen 阅读(42970) 评论(3) 推荐(2) 编辑
摘要: 最近在使用Anaconda的过程中,发现在Win10的PowerShell在使用 激活环境时无效,而CMD则可以。这里前提 必须将Anaconda 写入环境变量 。否则在PowerShell 输入conda 的任何命令都会无法识别。 首先在终端输入 查看自己的anaconda版本。 Conda版本低 阅读全文
posted @ 2019-03-24 22:16 Dereen 阅读(45239) 评论(4) 推荐(12) 编辑
摘要: 利用pandas对数据进行预处理然后再使用matplotlib对处理后的数据进行数据可视化是数据分析中常用的方法。 第一组例子(星巴克咖啡店) 假如我们现在有这样一组数据:星巴克在全球的咖啡店信息,如下图所示。数据来源: "starbucks_store_locations" 。 店铺总数排名前10 阅读全文
posted @ 2019-03-06 23:02 Dereen 阅读(3939) 评论(0) 推荐(0) 编辑
摘要: 图像识别和自然语言处理是目前应用极为广泛的AI技术,这些技术不管是速度还是准确度都已经达到了相当的高度,具体应用例如智能手机的人脸解锁、内置的语音助手。这些技术的实现和发展都离不开神经网络,可是传统的神经网络只能解决关于辨识的问题,并不能够为机器带来自主创造的能力,例如让机器写出一篇流畅的新闻报道, 阅读全文
posted @ 2019-02-28 11:32 Dereen 阅读(15397) 评论(1) 推荐(0) 编辑
摘要: 在使用pycharm学习pandas的过程中我发现好多时候会发生不能输出所有列的情况,上网搜了一下,发现解决的办法是使用一个输出控制的函数。 在下面的代码中我们只是输出 这个文件的第一行,想看一下各列的标签都会被省略。。。 输出的结果如下: 可以看到一共有13列,却只输出了4列,解决办法如下: 输出 阅读全文
posted @ 2019-02-28 11:30 Dereen 阅读(1060) 评论(0) 推荐(0) 编辑
摘要: 在处理列表的时候我们经常会遇到列表中嵌套列表的结构,如果我们要把所有元素放入一个新列表,或者要计算所有元素的个数的话应该怎么做呢? 第一个例子 对于上图中的这样一组数据,如果我们要知道这个CSV文件中所有演员的数量(同一个人只能出现一次)应该怎么做呢? 在pandas中我们可以先取 这一列,但是取出 阅读全文
posted @ 2019-02-28 11:28 Dereen 阅读(4368) 评论(0) 推荐(1) 编辑
摘要: 在使用pyplot绘制直方图的时候我发现了一个问题,在给函数.hist()传参的时候,如果传入的组数不是刚刚好(就是说这个组数如果是使用(最大值 最小值)/组距计算出来,而这个数字不是整除得来而是取整得来的话),图像就会产生偏移现象。 看下面这段代码:绘制IMDB排行前1000电影的时长分布直方图 阅读全文
posted @ 2019-02-28 11:26 Dereen 阅读(769) 评论(0) 推荐(0) 编辑