07 2018 档案

摘要:本次课主要讲正则化、特征选取以及梯度下降(部分内容参考了链接1,链接2) 在先前的讨论中,我们发现K值越高,或是线性回归的阶数越高,一定程度能够对训练数据产生更好的拟合效果,但是对于测试数据而言误差也许非常大,即过拟合 正则化就能够用来解决因为特征过多导致的过拟合问题 βj即惩罚项,用来减少某一个特 阅读全文
posted @ 2018-07-25 16:18 冷血无情康纳酱 阅读(223) 评论(0) 推荐(0)
摘要:今天学习了SQL注入以及XSS注入。推荐资料 本文仅做技术交流。研究攻击技术是为了更好地进行防御。 1.SQL注入 SQL注入的基础是对方在进行SQL查询时采用了如下结构的代码。 方法是输入 a' or '1'='1 这样的字符,导致原来的查询语句变成了如下代码,从而必定通过查询。 模仿上述样例,甚 阅读全文
posted @ 2018-07-24 18:32 冷血无情康纳酱 阅读(233) 评论(0) 推荐(0)
摘要:背景:正在进行一个无人机攻击的实验项目,一共七天时间,看看能不能实现nb操作 1.首先发现目标,目标是一台依靠wifi控制的无人机,自身向周围发射wifi信号,用户通过手机连接上wifi再通过指定app进行操作。 首先连接无线网卡 就是最下面的wlan0,将网卡关掉,然后修改模式为混杂模式,再开启网 阅读全文
posted @ 2018-07-24 00:18 冷血无情康纳酱 阅读(433) 评论(0) 推荐(0)
摘要:1.nmap使用 使用nmap扫描时请注意,不要随便乱扫,扫描是发起攻击的前期准备之一,随意扫描时可以被认定成攻击行为的 nmapx [ipaddr] 快速简单地对目标地址进行扫描,检查开启的端口以及对应服务。通过>filename 可以将结果输出到文件。 -sP参数时使用ping去扫描, 192. 阅读全文
posted @ 2018-07-23 22:35 冷血无情康纳酱 阅读(194) 评论(0) 推荐(0)
摘要:本次课有两部分,KNN的模型分析以及回归分析 KNN模型分析 1.K值选取 选择K的时候要特别注意K的大小,适中才最好 要求太高会导致过拟合,低bias(偏差),太低则无法拟合,高bias。 2.训练与测试 收集的数据集,先分成测试集与训练集,一般训练集略大于测试集。 训练集用来训练模型(fit t 阅读全文
posted @ 2018-07-22 18:22 冷血无情康纳酱 阅读(244) 评论(0) 推荐(0)
摘要:本章主要介绍一点机器学习的基础知识以及KNN算法 一.基础知识 监督式学习 supervised:提供已知输出的数据 无监督式学习 unsupervised:提供数据但不提供输出 监督式学习常用有两种算法:线性回归 regression和分类 classification 应用监督式学习基本上有如下 阅读全文
posted @ 2018-07-21 16:38 冷血无情康纳酱 阅读(362) 评论(0) 推荐(0)
摘要:找了一份intel提供给AI爱好者的学习资料,官网上可以找到。传送门 1.pandas介绍 pandas中一维变量转换为series,二维数组转换为dataframe 还可以给series添加日期,以及输出指定日期的值 支持对非法数据一键赋值 2.dataframe dataframe可以从列表、字 阅读全文
posted @ 2018-07-21 00:45 冷血无情康纳酱 阅读(355) 评论(0) 推荐(0)
摘要:首先导入模块 threading是线程模块,queue是系统提供的线程间通信队列,其中Queue为先进先出队列 应用这些就足以应对一般的python多线程编程场景了 阅读全文
posted @ 2018-07-17 20:24 冷血无情康纳酱 阅读(336) 评论(0) 推荐(0)
摘要:1.MD5 2.SHA-1 阅读全文
posted @ 2018-07-17 19:44 冷血无情康纳酱 阅读(256) 评论(0) 推荐(0)
摘要:本篇代码是在完成应用密码学RSA实验时所写,部分内容可供参考。关于RSA原理不做赘述 阅读全文
posted @ 2018-07-17 19:32 冷血无情康纳酱 阅读(401) 评论(0) 推荐(0)
摘要:本篇代码是在完成老师应用密码学实验时完成的,有一些想法还可以,可以留给自己以及后辈参考,关于DES加密的原理不多讲述。 编程语言:python3 阅读全文
posted @ 2018-07-17 19:08 冷血无情康纳酱 阅读(475) 评论(0) 推荐(0)
摘要:colin老师的机器学习第二堂课。主要讲了一些tensorflow和神经网络的东西。 1.神经网络概述 这里不讲太多专业的,数学的内容,只为和我一样的萌新讲一些形象的,落到代码上的东西 神经网络就像人的大脑一样,你只需要设计好结构,初始值都是随机的,我们只需要告诉它输入以及所对应的输出,以及告诉它如 阅读全文
posted @ 2018-07-16 00:50 冷血无情康纳酱 阅读(539) 评论(0) 推荐(0)
摘要:贝叶斯分类首先准备好数据材料 第一次获取20newsgroups时会花费数分钟时间来获取数据,通过获得target_names可以查看其中的类型。 为了进行分类,采用词袋模型的方法,即统计每篇新闻的单词,不考虑单词间的联系,仅仅考虑它们出现的频率。 11314代表有11314篇文章,130107意思 阅读全文
posted @ 2018-07-13 21:33 冷血无情康纳酱 阅读(5339) 评论(0) 推荐(0)
摘要:本文旨在记录colin老师workshop的exercise1讲解,包含入门级的sklearn操作 首先导入库 其次导入数据,这里使用的是sklearn中内置的数据集 使用pandas整理数据 pandas可以用来求相关性,取值为-1~1之间,-1为负相关,1为正相关,靠近0则是不相关。其中如果相关 阅读全文
posted @ 2018-07-13 19:38 冷血无情康纳酱 阅读(635) 评论(0) 推荐(0)
摘要:Linux中的anaconda和windows下有些许区别,这里做下介绍 1.安装 官网上下载.sh文件,通过bash进行安装 2.添加环境变量 为了使用conda指令,我们需要将它添加到环境变量 3.conda的使用 和windows10中不同,conda不再是一个命令行,而是单纯一个功能语句了, 阅读全文
posted @ 2018-07-13 00:29 冷血无情康纳酱 阅读(4285) 评论(0) 推荐(0)
摘要:词性标注 首先介绍Penn Treebank的常用POS标记库 具体使用如下: 阅读全文
posted @ 2018-07-09 10:58 冷血无情康纳酱 阅读(370) 评论(0) 推荐(0)
摘要:1.语句分离 主要是用来将句子与句子之间分开 2.分词 3.词干提取 将同一个单词的不同形式统一,使得结果不那么分散 阅读全文
posted @ 2018-07-09 10:41 冷血无情康纳酱 阅读(726) 评论(0) 推荐(0)
摘要:NLTK是python环境中的一个非常流行的NLP库,这篇记录主要记录NLTK的一些常见操作 1.去除网页html标记 我们常常通过爬虫获取网页信息,然后需要去除网页的html标签。为此我们可以这么做: 2.统计词频 这里使用的tokens就是上面图中的tokens 3.去除停用词 停用词就是类似t 阅读全文
posted @ 2018-07-09 09:31 冷血无情康纳酱 阅读(3981) 评论(0) 推荐(0)
摘要:1.首先先介绍常见的元字符 2.python中的re模块以及方法 re.match(pattern,string,flags=0) 尝试匹配,如果成功返回匹配对象,失败则返回none,其中flag可以选择为 re.I 即不区分大小写 re.search(pattern,string,flags=0) 阅读全文
posted @ 2018-07-08 11:03 冷血无情康纳酱 阅读(136) 评论(0) 推荐(0)