szgzwf

http://www.etsec.com.cn

导航

2012年11月7日 #

java网页数据抓取

摘要: 对于加密的网站还没去研究,不知道能不能抓取,现在只是对一些没有加密的网站进行网页数据抓取。刚刚开始写的时候以为很多网站都能抓取,但是发现很多都加密了,本来以为一些地址可以通过网页数据检测工具测出他的数据变化,但是只能监测到一些通过js显示的数据,依然不能抓取到加密的网站。嗨,这个问题以后再说吧。我抓取的网站是手机号查询和身份证查询的网站。http://qq.ip138.com/idsearch/index.asp这个是查询身份证的网站,源地址是这个,但当你输入自己的身份证是地址就会变成http://qq.ip138.com/idsearch/index.asp?action=idcard&am 阅读全文

posted @ 2012-11-07 10:54 szgzwf 阅读(354) 评论(0) 推荐(0)

使用 Ruby r实现如何登录新浪微博

摘要: 看了网上有用 Python 登录的,不过有点过时了,现在加密算法也变了,所以就想自己写一个登录程序。然后把 ruby 也移植到我的 Linux 开发板上,然后就可以定时登录....... ,原来一直想用 PHP 实现,可以PHP 操作 http 用 curl 库,总觉着别扭,不够强大!登陆分为 三步1:prelogin发送用户名,密码前,先从新浪服务器获取 三个主要的变量servertimenoncersakv(RSA的Public Key,下一步用这个public key 加密密码)[ruby] view plaincopyprint?#pre login preloginurl =  阅读全文

posted @ 2012-11-07 10:51 szgzwf 阅读(621) 评论(0) 推荐(0)

Python 代码性能优化技巧

摘要: Python 代码优化常见技巧代码优化能够让程序运行更快,它是在不改变程序运行结果的情况下使得程序的运行效率更高,根据 80/20 原则,实现程序的重构、优化、扩展以及文档相关的事情通常需要消耗 80% 的工作量。优化通常包含两方面的内容:减小代码的体积,提高代码的运行效率。改进算法,选择合适的数据结构一个良好的算法能够对性能起到关键作用,因此性能改进的首要点是对算法的改进。在算法的时间复杂度排序上依次是:O(1) -> O(lg n) -> O(n lg n) -> O(n^2) -> O(n^3) -> O(n^k) -> O(k^n) -> O( 阅读全文

posted @ 2012-11-07 10:48 szgzwf 阅读(128) 评论(0) 推荐(0)

python-面向对象的编程

摘要: 最近在自学python,突然想写点什么, 同时也是为了加深自己的记忆,想记录自己的点点滴滴,好了进入主题:简介这被称为面向过程的编程。还有一种把数据和功能结合起来,用称为对象的东西包裹起来组织程序的方法。这种方法称为 面向对象的 编程理念。在大多数时候你可以使用过程性编程,但是有些时候当你想要编写大型程序或是寻求一个更加合适的解决方案的时候,你就得使用面向对象的编程技术。类和对象是面向对象编程的两个主要方面。类创建一个新类型,而对象这个类的 实例 。这类似于你有一个 int 类型的变量,这存储整数的变量是 int 类的实例(对象)。注意,即便是整数也被作为对象(属于 int 类)。这和 C++ 阅读全文

posted @ 2012-11-07 10:47 szgzwf 阅读(124) 评论(0) 推荐(0)