随笔分类 - databook
数据采集
    
摘要:文本的样式主要指颜色和字体相关的属性设置。 对于manim的两个文本对象 Text和 Tex来说, Text对象有更多的属性可以调整样式,相对来说,由于 Tex主要用来显示数学公式,所以关于样式的属性要少一些。 下面介绍一些我在视频制作时最常用的一些颜色和字体相关的属性。 1. 颜色相关 颜色设置主
        阅读全文
                
摘要:manim中提供了两种方式来表示文字信息,一种是 Text系列,一种是 Tex系列。 从目前我自己的使用的体验来看, Text系列在显示文字信息方面,提供了更多的的属性来调整显示效果。如果有大段的文字要排版,或者对文字的显示效果要求高的话,建议使用 Text。 而 Tex系列最大的优势是支持 Lat
        阅读全文
                
摘要:manim绘制图形时,除了上一节提到的那些必须的参数,还有一些可选的参数, 这些参数可以控制图形显示的样式。 绘制各类基本图形(点,线,圆,多边形等)时,每个图形都有自己的默认的样式,比如上一节的图形, 有的默认是白色,有的默认是红色。 控制图形样式的参数最常用的有以下四个: stroke_widt
        阅读全文
                
摘要:制作数学视频时,各类几何图形是使用最频繁的。 一般来说,常用的几何图形包括:点,线,圆以及多边形。 1. 点 点是最简单图形,也是其他所有图形的基础。 绘制其他任何图形时,都是用点来定位的。 manim中生成一个点很方便,只要给定一个坐标即可。 这里的坐标包含 [x, y, z]3个维度,如果绘制二
        阅读全文
                
摘要:manim是基于python语言开发的开源框架,是由 3blue1brown 开发的。 本来是他们自己用来制作数学视频用的,因为其友好的API和漂亮的UI效果,在开源之后,立刻流行起来。 原先开源的地址是: 后来托管给了社区,现在安装最新的版本请从这里下载: 改版之后,命令行更加清晰,简单。 支持的
        阅读全文
                
摘要:概要 最近,结合视频剪辑工具剪映制作短视频时, 如果不是数学相关的内容,使用视频剪辑工具配置字幕,添加图片等等比 manim更加方便。 所以,用 manim封装一个目录的动画,用来配合剪辑工具中的其他资源。 代码封装 基于manim封装一个目录显示的 class。 主要属性就是 titles,也就是
        阅读全文
                
摘要:1. 概述 新闻是我们了解外界的重要渠道,以前,我们一般通过报纸和电视来获取新闻,那时候,获取新闻不仅有一定的成本,效率还不高。 而如今,获取新闻的途径太多太方便了,大量重复的新闻充斥着各大平台,获取新闻已经没有什么成本,问题变成了过滤和鉴别新闻的可信程度。 下面用 【新浪新闻】 作为采集对象,抛砖
        阅读全文
                
摘要:颜色和排版一样,看似简单,其实非常复杂,往大了说,涉及到艺术和品味,不像数学公式,物理定理那样,是非分明。 但是,对 matplotlib 中的颜色有些基本的了解,可以让绘出的图形颜色不至于太突兀。 虽不能说选出完美的颜色搭配,至少是看着舒服,醒目的颜色搭配。 颜色的种类 颜色一般用 RGB 来表示
        阅读全文
                
摘要:排版虽然只是绘图中的辅助功能,但是好的排版能够提高图形的表现力。 让人一眼看出图形要表达的内容和数据,而不用去费力的睁大眼睛去图中查找。 如果说 matplotlib的坐标系统,各种基础元素,包括柱状图,折线图,散点图等它的硬实力, 那么,排版就是 matplotlib 的软实力,结合排版,能让分析
        阅读全文
                
摘要:有时候,我们将数据变换之后再绘图,一方面,可以突出某些区域的数据;另一方面,变换之后可以更好的看出数据之间的关系。 matplotlib 提供了两种变换数据的方式,一种是 Scale(缩放),一种是Projection(投影)。 Scale是对数据的一个维度进行变换,Projection则是对2个或
        阅读全文
                
摘要:了解 matplotlib 的坐标系统,绘制图形的时候,如果需要在图上添加一些额外的元素或者说明文字, 就可以很好的控制添加元素和说明文字的位置。 笛卡尔坐标系和极坐标系 matplotlib 使用2种坐标系,笛卡尔坐标系是默认的,一般我们绘制的二维图形基本都是笛卡尔坐标系的。 比如各种柱状图,折线
        阅读全文
                
摘要:箱图简介 箱型图是一种用作显示一组数据分布情况的统计图,因型状如箱子而得名。 1977年由美国著名统计学家约翰·图基(John Tukey)发明。它能显示出一组数据的最大值、最小值、中位数及上下四分位数。 其中,中位数(50%),上四分位数(75%)和下四分位数(25%)都很好理解。 上边缘和下边缘
        阅读全文
                
摘要:概要 matplotlib算是历史悠久的python可视化库了,2003年就发布了 v0.10 版本,现在已经到了 v3.x 版本了。  代码和功能虽然有翻天覆地改变,但由于其历史悠久,功能强大,用户基数庞大,所以,我们在使用 matplotlib 库的时候,几乎可以搜索到我们需要的各种示例。 
        阅读全文
                
摘要:概要 分析时间序列数据时,按照日期的维度进行统计几乎是必备的需求。 基于pandas,可以方便的进行各种日期维度(年份,季度,月,周等等)的统计,不用去遍历每行数据去统计。 示例-销售数据统计 演示数据来源一些销售数据,可以点击 这里 下载。  每行数据包括日期,国家,城市,地区,销售额和利润等字
        阅读全文
                
摘要:matplotlib 是基于 python 的著名可视化图表库。经常用来配合其他数据分析工具使用,将分析的结果可视化。  但是,matplotlib 默认是不支持中文的,中文显示成方块或者乱码,如下图:  让 matplotlib 支持中文也很简单,安装中文字体,并在引入库的设置引入的字体。 第
        阅读全文
                
摘要:1. 概述 现在学校越来越重视孩子课外知识的掌握,给孩子挑选课外书一般都是参考学校或者家长之间的推荐。 有时,也会想看看在儿童阶段,目前到底流行的是些什么样的书。  于是,就简单写了这个小爬虫,采集了畅销童书的前20名。 要想采集更多的畅销童书,后者采集其他类型的畅销书,调整相应的参数和URL就可
        阅读全文
                
摘要:1. 概述 前段时间在看一本很多人推荐的线性代数教材《线性代数应该这样学》第三版,这一版每个章节都有大量的习题。 官方网站上虽然按照章节提供了习题的答案,一来因为网站是国外的,访问不流畅,二来答案中还夹杂着广告,影响查看。 所以,想试着将答案爬取下来制作成pdf,查看起来方便,也不会受网络的影响。 
        阅读全文
                
摘要:1. 概述 王者荣耀是一直都挺喜欢的一个手游,玩了好几年,最近一段开始喜欢看比赛,所以想着采集点数据看看各个战队或者选手的情况。 顺便也练习练习 puppeteer 的使用。 数据来源于:尚牛电竞 。 2. 采集流程 王者荣耀最近正在进行的最大比赛就是 2021世冠杯,所以就选择采集这个赛事的数据。
        阅读全文
                
摘要:1. 概述 京粉(https://union.jd.com/)是京东联盟下的网站,通过分享其中的商品链接可以赚取佣金,类似淘客联盟。 采集京粉的商品,既可以练习 puppeteer的使用,平时想在京东购物时,也能用得上(采集看看有类似商品的价格和评价)。 2. 主要流程 采集的流程很简单: 2.1 
        阅读全文
                
摘要:概述 最近在学习python的各种数据分析库,为了尝试各种库中各种分析算法的效果,陆陆续续爬取了一些真实的数据来。 顺便也练习练习爬虫,踩了不少坑,后续将采集的经验逐步分享出来,希望能给后来者一些参考,也希望能够得到先驱者的指点! 采集工具 其实基本没用过什么现成的采集工具,都是自己通过编写代码来采
        阅读全文
                
 
                     
                    
                 
                    
                
 
         浙公网安备 33010602011771号
浙公网安备 33010602011771号