Python学习笔记(七)

七、文件和数据格式化

1、文件的使用

  1.1 文件的类型

    1.1.1 文件定义

      - 文件:文件是数据的抽象和集合

      

     1.1.2 文本文件和二进制文件区别

        

 

        文本文件:

         

          打开方式:

          

 

 

 

        二进制文件:

          

 

            打开方式:

           

 

  1.2 文件的打开和关闭

    

 

 

    1.2.1 文件的打开

 

     

 

 

      文件路径

 

      

 

 

      打开模式:

 

      

 

 

         

 

       1.2.2 文件的关闭 

 

          

 

  1.3 文件内容的读取

    

 

    

 

 

 

      - 文件的全文本操作:遍历全文本

      方法一:

      

 

      方法二:

      

 

     - 文件的逐行操作:逐行遍历文件

      方法一:

      

 

      方法二:

      

 

  1.4 数据的文件写入

    

 

    

 

    

 

     

 

 

 

 

2、一维数据的格式化和处理

  2.1 数据组织的维度

    - 维度:一组数据的组织形式

    

 

 

    

 

 

    

 

 

     

 

 

      

 

 

      

 

 

      

 

  2.2 一维数据的表示

    2.2.1 如果数据间有序:使用列表类型

      

 

 

    2.2.2 如果数据间无序:使用集合类型

 

      

 

  2.3 一维数据的存储

    2.3.1 存储方式一:空格分隔

      

 

 

    2.3.2 存储方式一:逗号分隔

 

      

 

    2.3.3 存储方式三:其他方式

 

       

 

  2.4 一维数据的处理

    

 

 

    2.4.1 一维数据的读入处理

 

      

 

       

 

    2.4.2 一维数据的写入处理  

 

         

          

 

3、二维数据的格式化和处理

  3.1 二维数据的表示

    

 

  3.2 CSV数据存储格式

    

 

     

 

      

 

  3.3 二维数据的存储

    

 

  3.4 二维数据的处理

    3.4.1 二维数据的读入处理

      

 

 

     3.4.2 二维数据的写入处理

 

      

 

 

      3.4.3 二维数据的逐一处理:采用二层循环

 

       

 

4、wordcloud库的使用

  4.1 概述

    

 

 

  4.2 基本使用

 

    

 

     

   4.3 方法和参数

      4.3.1 方法

 

     

 

      

      4.3.2 参数

     

      

      

      

 

   4.4 应用实例

     

 

    

 

 

5、实例1:自动轨迹绘制

  5.1 问题分析

    

 

 

  5.2 基本思路

 

    

 

 

    5.2.1 数据接口定义

 

     

 

 

  5.3 代码: 

  1. #AutoTraceDraw.py
  2. import turtle as t
  3. t.title('自动轨迹绘制')
  4. t.setup(80060000)
  5. t.pencolor("red")
  6. t.pensize(5)
  7. #数据读取
  8. datals []
  9. open("data.txt")
  10. for line in f:
  11.     line line.replace("\n","")
  12.     datals.append(list(map(eval, line.split(","))))
  13. f.close()
  14. #自动绘制
  15. for in range(len(datals)):
  16.     t.pencolor(datals[i][3],datals[i][4],datals[i][5])
  17.     t.fd(datals[i][0])
  18.     if datals[i][1]:
  19.         t.rt(datals[i][2])
  20.     else:
  21.         t.lt(datals[i][2])

 

  数据文件

  

 

 

 

6、实例2:政府工作报告词云

  6.1 基本思路

    

 

 

  6.2 规则词云代码:    

  1. #GovRptWordCloudv1.py
  2. import jieba
  3. import wordcloud
  4. open("新时代中国特色社会主义.txt""r", encoding="utf-8")
  5.  
  6. f.read()
  7. f.close()
  8. ls jieba.lcut(t)
  9.  
  10. txt " ".join(ls)
  11. wordcloud.WordCloud( \
  12.     width 1000, height 700,\
  13.     background_color "white",
  14.     font_path "msyh.ttc"    
  15.     )
  16. w.generate(txt)
  17. w.to_file("grwordcloud.png")

 

    运行结果:

    

 

  不规则词云代码:

    

#GovRptWordCloudv2.py
import jieba
import wordcloud
from scipy.misc import imread
mask = imread("chinamap.jpg")
excludes = { }
f = open("新时代中国特色社会主义.txt", "r", encoding="utf-8")
t = f.read()
f.close()
ls = jieba.lcut(t)
txt = " ".join(ls)
w = wordcloud.WordCloud(\
    width = 1000, height = 700,\
    background_color = "white",
    font_path = "msyh.ttc", mask = mask
    )
w.generate(txt)
w.to_file("grwordcloudm.png")

 

posted @ 2019-10-31 20:50  蓝子娃娃  阅读(313)  评论(0编辑  收藏  举报