06 2013 档案

摘要:一直以来都很傻,浪费了不少时间纠缠在语言上。这段时间一直都在忙写Web爬虫的代码,这过程当中出现过一些比较无奈的情况,对此感觉不知道怎么去做好。前几天看到很多人说PYTHON写爬虫非常快,而且极度容易上手,然后就去了。一直以来的理解偏差应该就是在这。学任何一样东西总会有它的价值,仅仅因为你不熟悉它罢了。后来翻天覆地的思考,到底该不该转换下自己的思想,跑去学深入学习PYTHON。世界上没有十全十美的事情,如果我这么做了,W3A的平台不就等于是一句空话了吗?当初想做的东西就是做一个PERL原生的东西,现在居然脱离轨道?就因为这仅仅一个需求无法解决?就因为自己不懂?错了,我应该执着下去。不应该因为小 阅读全文
posted @ 2013-06-28 21:55 墨迹哥's 阅读(451) 评论(0) 推荐(1)
摘要:改进了一下,去掉哪些没用的。留下的都是些有用的。接着要拔下来,然后放到TXT。。#coding=utf-8import urllib2import refrom sgmllib import SGMLParser;class CatCh(SGMLParser): def reset(self): self.url=[] SGMLParser.reset(self) def start_a(self,attrs): href = [v for k, v in attrs if k == 'href'] if href: self.... 阅读全文
posted @ 2013-06-28 14:17 墨迹哥's 阅读(466) 评论(0) 推荐(0)
摘要:那天在新浪微博上看到北北出的题目,由于最近也在做类似的爬虫研究,所以就有了这个实验。后来在QQ上和北北说了下,要求是啥都抓,就抓乌云的。。。然后就开始了。。第一个版本如下,后续不断改进直到满足需求:import urllib2;from sgmllib import SGMLParser;class CatCh(SGMLParser): def reset(self): self.url=[] SGMLParser.reset(self) def start_a(self,attrs): href = [v for k, v in attrs if k ... 阅读全文
posted @ 2013-06-28 13:30 墨迹哥's 阅读(646) 评论(0) 推荐(1)
摘要:这是那天不知道谁发的,具体忘记那个人了。感觉这个类好像很牛B的样子,没实验过。。"条记录",'prev'=>"上一页",'next'=>"下一页",'first'=>"首页",'last'=>"尾页"); private $listNum=5; public Function __construct($total,$listRows=5,$parameter=''){ $this->to 阅读全文
posted @ 2013-06-25 23:27 墨迹哥's 阅读(204) 评论(0) 推荐(0)
摘要:上一篇说了数字型的的SQL注入修复,这篇继续加个字符串型的修复方法吧。其实就是一个函数。虽然没在真实场景遇到过,但是我觉得应该有效。['user_id']; echo $row->['target_name']; echo $row->['domain']; echo $row->['bug_number']; } }?> 阅读全文
posted @ 2013-06-25 20:24 墨迹哥's 阅读(787) 评论(0) 推荐(0)
摘要:昨天写了个小程序,发现了个注入的问题,今天翻了下Php手册,找到个函数解决该问题。把过程写出来,方便自己记忆吧。仅贴出部分代码。。。['username']; echo $row->['target_name']; echo $row->['domain']; echo $row->['bug_number']; } }?>由于没有对输入进行过滤,导致SQL注入的产生。给它加了个函数,就好了。['username']; echo $row->['target_name' 阅读全文
posted @ 2013-06-25 20:19 墨迹哥's 阅读(716) 评论(0) 推荐(0)
摘要:一开始都无法理解SELF是啥意思,昨晚睡觉的时候不停在幻想,到底这是啥东西呢。翻了下大脑JAVA中的构造器的代码,突然之间领悟了。SELF就好比是JAVA中的THIS。一瞬间就理解了。#coding=utf-8class test: def __init__(self,name,password): self.name=name self.password=password def sayhi(self): print "hello:",self.name,"password:",self.passw... 阅读全文
posted @ 2013-06-23 14:05 墨迹哥's 阅读(441) 评论(0) 推荐(0)
摘要:今天在看网页抓取,复习下JAVA,刚好没事情。package web.Catch;import java.io.BufferedReader;import java.io.InputStreamReader;import java.net.HttpURLConnection;import java.net.URL;public class Test { public static void main(String[] args) throws Exception { String strURL = "http://ip.chinaz.com/?IP=127.0.0.1"; 阅读全文
posted @ 2013-06-23 00:13 墨迹哥's 阅读(353) 评论(0) 推荐(0)
摘要:package basic.day12;class Car{ private String name;//私有成员,名称 private String color;//私有成员,颜色 private String size;//私有成员,大小 public String getName(){ return name; } public String getColor(){ return color; } public String getSize(){ return size; } public void setName(String name){ ... 阅读全文
posted @ 2013-06-22 23:51 墨迹哥's 阅读(546) 评论(0) 推荐(0)
摘要:package basic.day02;public interface People { String name(String name);//姓名 char xingbie(char a);//性别 long tel(long t);//电话 double shengao(double shengao);//身高}interface OnePeople extends People{ long qq(long num);//QQ号码 long menoy(long meoy);//财产}interface TwoPeople extends People... 阅读全文
posted @ 2013-06-22 23:50 墨迹哥's 阅读(215) 评论(0) 推荐(0)
摘要:package basic.day12;import java.util.ArrayList;public class ArrayListDemo3 { public static void main(String[] args) { ArrayList list = new ArrayList(); list.add(1); list.add(2); ArrayList other = new ArrayList(); other.add(2); other.add(3); list.ad... 阅读全文
posted @ 2013-06-22 23:49 墨迹哥's 阅读(586) 评论(0) 推荐(0)
摘要:package basic.day12;import java.util.ArrayList;import java.util.List;import java.util.Scanner;public class ArrayListScanfDemo { public static void main(String[] args) { Scanner rc = new Scanner(System.in); System.out.println("请输入学生的人数:"); int people = rc.nextInt(); Lis... 阅读全文
posted @ 2013-06-22 23:48 墨迹哥's 阅读(265) 评论(0) 推荐(0)
摘要:主要问题是在复习PYTHON的面对对象,所以看看JAVA找灵感。package basic.day12;public class User { String name; String pwd; int age; public User(String name,String pwd,int age){ this.name=name; this.pwd=pwd; this.age=age; } public String toString(){ return name+":"+age; }} 阅读全文
posted @ 2013-06-22 23:47 墨迹哥's 阅读(157) 评论(0) 推荐(0)
摘要:package basic.day08;public class Point { int x; int y; public Point(int x,int y){ this.x=x; this.y=y; } public Point(int x){// this.x=x;// this.y=x; this(x,x); } public double distance(){ return Math.sqrt(this.x*this.x+this.y*this.y); } public double distance(int x,int y){... 阅读全文
posted @ 2013-06-22 23:45 墨迹哥's 阅读(255) 评论(0) 推荐(0)
摘要:这个泛类型据说很少用得上,但是我觉得挺实用的。简单概括的就是,在封装里面,泛类型能够使用多种类型来进行匹配。而普通的封装里面不能进行这种操作,只能死定类型。例如说:privateintk;这个就等于是必须是整型。privateleixingk;这个就是泛类型的意思,作用是这个leixing可以随意替换掉,比如我喜欢换成整型什么型都可以。8种数据类型随你来。下面弄个实际案例来,融会贯通一下。package study3_day05;public class Car { private qieche price; //定义汽车的名称为name,这是个私有的变量,只能在本类使用。 ... 阅读全文
posted @ 2013-06-22 23:44 墨迹哥's 阅读(319) 评论(0) 推荐(0)
摘要:W3A系统缺乏亮点,突发奇想想到一个新的东西,别人没做过的功能,准备尝试下。居然发现该功能缺乏一些QT库,瞬间茫然了,开始了这个解决之旅。这个是报的错误:Unable to load library icui18n "Cannot load library icui18n: (libicui18n.so.48: 无法打开共享对象文件: 没有那个文件或目录)" 对此很是无奈,所以我去翻了/usr/lib/的库,找下看看有没有,结果还真没有。root@securityserver:~# ls -lh /usr/lib/libicu*ls: 初始化月份字符串出错ls: 无法访问/ 阅读全文
posted @ 2013-06-21 10:09 墨迹哥's 阅读(4869) 评论(0) 推荐(0)
摘要:网站一大堆抄袭,蛋腾死了。。找了很久都没有LINUX完美破解的。。后来一个哥们告诉我的方法。。发出来。。首先查看一下sublime-text 2安装路径,然后用vim打开sublime_text文件# whereis sublime-text-2输出结果:# sublime-text-2:/usr/bin/sublime-text-2 /usr/lib/sublime-text-2 /usr/bin/X11/sublime-text-2 --这里是两条信息,第二个/usr/前面有一个空格的然后,进入第一个路径下,查看有哪些文件,输入:# cd /usr/lib/sublime-te... 阅读全文
posted @ 2013-06-18 14:36 墨迹哥's 阅读(423) 评论(0) 推荐(0)
摘要:这个分页功能有些蛋疼,因为学的不深,所以一直在研究,今晚终于让我弄出来了,无比的开心,瞬间爆发了一下。把代码MARK下。。明天继续研究几种别的分类。<?php$page = $_GET["page"];function Page($rows,$page_size){ global $page,$select_from,$select_limit,$pagenav; $page_count = ceil($rows/$page_size); if($page <= 1 || $page == '') $page = 1; i... 阅读全文
posted @ 2013-06-16 21:28 墨迹哥's 阅读(226) 评论(0) 推荐(0)
摘要:1.根据时间备份2.同一秒不能有重复 1 <?php 2 function recurse_copy($src,$dst) { // 原目录,复制到的目录 3 //打开源目录 4 $dir = opendir($src); 5 //创建目标目录 6 @mkdir($dst); 7 //读取目录下的所有文件名称 8 while(( $file = readdir($dir))!==false ) { 9 //判断文件名称是否合法10 if (( $file != '.' ) && ( $file != '..' )... 阅读全文
posted @ 2013-06-13 11:26 墨迹哥's 阅读(264) 评论(0) 推荐(0)
摘要:今天弄了个小模块看看。。<?phpfunction recurse_copy($src,$dst) { // 原目录,复制到的目录 //打开源目录 $dir = opendir($src); //创建目标目录 @mkdir($dst); //读取目录下的所有文件名称 while(( $file = readdir($dir))!==false ) { //判断文件名称是否合法 if (( $file != '.' ) && ( $file != '..' )) { if ( is_dir($src . '/... 阅读全文
posted @ 2013-06-05 15:01 墨迹哥's 阅读(178) 评论(0) 推荐(0)
摘要:今天因为做到系统里面的一个功能,需要用到终止的过程,所以用到Fork的使用。公司里一大牛被我问烦了,甩了一句:“你懂不懂写代码?你到底懂不懂啊!”一瞬间不知道怎么说话了,对进行这块研究的真心不深入,所以虚心问了下,换了这结果。心里挺不是滋味,后续上Q问了下其它哥们,用得也不多,所以知道的也很有限,所以我只能发帖了。感谢CU上的laputa73 童鞋给我解答该疑惑,终于搞明白了。对此MARK一下,方便以后使用。#!/usr/bin/perl -wmy $pid = fork();if (!defined($pid)) { print "Error in fork: $!"; 阅读全文
posted @ 2013-06-04 19:47 墨迹哥's 阅读(286) 评论(0) 推荐(0)
摘要:原本的那个CONFIG模块不太好用,读取指定项目位置倒是还可以,但是如果一旦数量多了以后就不好使用了。在CPAN上找到了一个比较实用的模块,稍微摸索了一下就知道怎么实用了。给段示例代码,方便以后翻查学习。#!/usr/bin/perluse Config::Abstract::Ini;use strict;my $file = $ARGV[0];my $settings = new Config::Abstract::Ini($file);# 获取所有的项目my %allsettings = $settings->get_all_settings;# 获取指定类型项目my %entry 阅读全文
posted @ 2013-06-04 11:17 墨迹哥's 阅读(342) 评论(0) 推荐(0)
摘要:下面的代码目前只实现了抓取首页,后面会改下,要求抓2级到3级页面。 #!/usr/bin/perluse HTML::LinkExtor;use LWP::Simple;sub sparit{ local($base_url)= shift; # 抓取URL $parser = HTML::LinkExtor->new(undef,$base_url); $parser->parse(get($base_url))->eof; @links = $parser->links; foreach $linkarray (@links){ my @element = @$li 阅读全文
posted @ 2013-06-02 16:31 墨迹哥's 阅读(289) 评论(0) 推荐(0)
摘要:今天看了下当年云舒写的代码,发现一个很陌生的东西,基本上没见过。gg了一下,了解了该模块是一个大数据处理的模块,简单的来说,该模块的作用是,用于比较数据是否存在在已知列表中。对于我来说这模块甚至有点难以理解,对此搜索了下前人写的案例进行分析。把代码整理了下,写了下注释方便以后翻查。#!/usr/bin/perluse Bloom::Filter;# capacity:设置容器的大小# error_rate:容错的数量my $bf=Bloom::Filter->new(capacity => 10,error_rate => .001);# 被对比的列表my @keys=qw/ 阅读全文
posted @ 2013-06-02 16:28 墨迹哥's 阅读(214) 评论(0) 推荐(0)