工作日志-2018年5月

这里开辟出来记录工作日志,会有一些大概的工作介绍,因为有时候不会在具体文章中介绍,所以如果大家有类似的工作需求,可以留言询问。


9日

工作内容:

1、配置文件中添加开关,动态分析前判断开关状态,以确定是否进行动态分析;

----------

10日

工作内容:

1、分析邮件中头部信息,包含收发件人、发件时间、主题、附件等信息。主要解决,邮件编码问题。由于不同邮箱采取不同的编码方式,且附件的编码方式不固定。导致在读取邮件头部、附件时时常出现,编码错误。解决思路如下:

①在邮件头部中寻找其编码格式,并记录;

②用该编码格式对当前头部进行解析;

③若②失败(原因可能是,部分邮件中没有声明其编码格式),则使用python自带的函数猜测其编码,并用该编码进行解码;

对于附件,选择分块读取,再使用相同的方法即可。尝试了2000封邮件,都成功了。

----------

11日

工作内容:

1、分析邮件中出现的所有url,并添加至数据库中。解决思路如下:

①检测邮件正文中出现的所有a标签的位置;

②取出a标签中相应的url,存放在list中(这里注意需要判断是否已经存入了,否则容易出现多个相同的url)。

 

posted @ 2018-04-30 20:21  yiquriyue  阅读(186)  评论(0)    收藏  举报