摘要: 现如今,智能手机是人手一份。每天我们都通过手机与外界沟通交流,手机作为必不可少的媒介,无形中记录着我们日常生活中的点点滴滴。这些信息主要包括个人位置信息、通信信息、账号密码信息、存储文件信息等四大类。由于Android是开源的,软件用户可自行对软件进行修改、复制及再分发,直接进行信息交换。有些用户还会自己对系统进行破解,获取权限,窃取个人信息。一些山寨手机甚至还留有后门程序,固化窃听软件,并通过远程遥控使手机话筒在用户不知情的情况下开启,把手机变成一个窃听-器,造成个人隐私泄露。 阅读全文
posted @ 2016-06-14 22:14 ShangFR 阅读(6879) 评论(1) 推荐(0) 编辑
摘要: XML是一种可扩展标记语言,它被设计用来传输和存储数据。XML是各种应用程序之间进行数据传输的最常用的工具。它与Access,Oracle和SQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,它仅仅是**存储数据**。事实上它与其他数据表现形式最大的不同是:它极其简单,这是一个看上去有点琐细的优点,但正是这点使它与众不同。针对XML格式数据,R语言XML包可以对其进行数据导入与处理,详见下面的案例说明。 阅读全文
posted @ 2016-06-06 16:15 ShangFR 阅读(12575) 评论(0) 推荐(0) 编辑
摘要: 单从外观上看,VAR&VaR两个模型很容易混淆,但就模型方法和用处两者截然不同,R语言作为数据分析的有力工具,其函数包库中包含各种各样的统计模型。通过vars包可以调用向量自回归模型,通过PerformanceAnalytics包的VaR函数可以调用风险价值模型。 阅读全文
posted @ 2016-06-05 23:20 ShangFR 阅读(6887) 评论(0) 推荐(0) 编辑
摘要: MySQL是一种开放源代码的关系型数据库管理系统(RDBMS),MySQL数据库系统使用最常用的数据库管理语言 结构化查询语言(SQL)进行数据库管理。 "百度百科" 1. MySQL安装 官网下载软件,选择 "MySQL on Windows (Installer & Tools)" 套装,包含如 阅读全文
posted @ 2016-05-30 12:02 ShangFR 阅读(2016) 评论(0) 推荐(0) 编辑
摘要: >中文分词就是将连续的字序列按照一定的规范重新组合成词序列的过程。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。准确度较高的是统计分词算法,常用的有最大概率法和隐式马尔科夫模型。分词结束后,使用TF-IDF文本关键词特征提取算法,TF-IDF是一种统计方法,用以评估一字词对于一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降,按词语重要性从中提取特定数量的词语组成这篇文章的关键词集合。 阅读全文
posted @ 2016-05-20 13:14 ShangFR 阅读(3766) 评论(0) 推荐(0) 编辑