工作日志-2018年5月
这里开辟出来记录工作日志,会有一些大概的工作介绍,因为有时候不会在具体文章中介绍,所以如果大家有类似的工作需求,可以留言询问。
9日
工作内容:
1、配置文件中添加开关,动态分析前判断开关状态,以确定是否进行动态分析;
----------
10日
工作内容:
1、分析邮件中头部信息,包含收发件人、发件时间、主题、附件等信息。主要解决,邮件编码问题。由于不同邮箱采取不同的编码方式,且附件的编码方式不固定。导致在读取邮件头部、附件时时常出现,编码错误。解决思路如下:
①在邮件头部中寻找其编码格式,并记录;
②用该编码格式对当前头部进行解析;
③若②失败(原因可能是,部分邮件中没有声明其编码格式),则使用python自带的函数猜测其编码,并用该编码进行解码;
对于附件,选择分块读取,再使用相同的方法即可。尝试了2000封邮件,都成功了。
----------
11日
工作内容:
1、分析邮件中出现的所有url,并添加至数据库中。解决思路如下:
①检测邮件正文中出现的所有a标签的位置;
②取出a标签中相应的url,存放在list中(这里注意需要判断是否已经存入了,否则容易出现多个相同的url)。


浙公网安备 33010602011771号