04 2014 档案
摘要:本文将从个人经验出发,讲述为什么需要Chrome插件,如何开发,如何调试,到哪里找资料,会遇到怎样的问题以及如何解决等,同时给出一个个人认为的比较典型的例子——获取网页内容,和服务器交互,再把信息反馈给用户。OK,准备开始吧,我尽量把文章写得好看点,以免读者打瞌睡。目录为什么需要为什么是Chrome...
阅读全文
摘要:我为Chrome浏览器开发了一款插件,当我向朋友展示自己的插件时,受到他们的羡慕和称赞,那感觉酷极了!通过这次开发,我发现整个开发过程比较简单,有Javascript基础的朋友,都可以开发出属于自己的Chrome插件。 插件开发流程 1.开发语言和软件 开发语言就是Javascript,开发软...
阅读全文
摘要:using System.IO;Directory.CreateDirectory(FilePath);【使用WriteFile下载文件】using System.Netprivate string fileName = HttpContext.Current.Server.UrlEncode("规...
阅读全文
摘要:Python 連接 MySQLMySQL 是十分流行的開源資料庫系統,很多網站也是使用 MySQL 作為後台資料儲存,而 Python 要連接 MySQL 可以使用 MySQL 模組。MySQLdb 模組可以讓 Python 程式連線到 MySQL server, 執行 SQL 語句及擷取資料等。開...
阅读全文
摘要:每天刷开csdn的博客,看到一整个页面,其实对我而言,我只想看看访问量有没有上涨而已...于是萌生了一个想法:想写一个爬虫程序把csdn博客上边的访问量和评论数都爬下来。打算通过网络各种搜集资料,自学写Python代码。这次自学的历程,也打算及时的整理下来,发布在博客里。/*************...
阅读全文
摘要:使用HTMLParser模块解析HTML页面 HTMLParser是python用来解析html和xhtml文件格式的模块。它可以分析出html里面的标签、数据等等,是一种处理html的简便途径。HTMLParser采用的是一种事件驱动的模式,当HTMLParser找到一个特定的标记时,它会去调用一...
阅读全文
摘要:1.open使用open打开文件后一定要记得调用文件对象的close()方法。比如可以用try/finally语句来确保最后能关闭文件。file_object=open('thefile.txt')try: all_the_text=file_object.read( )finally: file_...
阅读全文
摘要:python中,有三个库可以解析html文本,HTMLParser,sgmllib,htmllib。他们的实现方法不通,但功能差不多。这三个库中 提供解析html的类都是基类,本身并不做具体的工作。他们在发现的元件后(如标签、注释、声名等),会调用相应的函数,这些函数必须重载,因为基类中不 作处理。...
阅读全文
摘要:HTMLParser是Python自带的模块,使用简单,能够很容易的实现HTML文件的分析。本文主要简单讲一下HTMLParser的用法.使用时需要定义一个从类HTMLParser继承的类,重定义函数:handle_starttag( tag, attrs)handle_startendtag( t...
阅读全文
摘要:Python 字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等)Python字符串操作(string替换、删除、截取、复制、连接、比较、查找、包含、大小写转换、分割等) 去空格及特殊符号 s.strip().lstrip().rstrip(',') 复制字符...
阅读全文
摘要:介绍字符串相关的:比较,截取,替换,长度,连接,反转,编码,格式化,查找,复制,大小写,分割等操作什么是字符串字符串字符串或串(String)是由数字、字母、下划线组成的一串字符。一般记为 s=“a1a2···an”(n>=0)。它是编程语言中表示文本的数据类型。 通常以串的整体作为操作对象,如:在...
阅读全文
摘要:所谓网页抓取,就是把URL地址中指定的网络资源从网络流中读取出来,保存到本地。类似于使用程序模拟IE浏览器的功能,把URL作为HTTP请求的内容发送到服务器端, 然后读取服务器端的响应资源。在Python中,我们使用urllib2这个组件来抓取网页。urllib2是Python的一个获取URLs(Uniform Resource Locators)的组件。它以urlopen函数的形式提供了一个非常简单的接口。最简单的urllib2的应用代码只需要四行。我们新建一个文件urllib2_test01.py来感受一下urllib2的作用:[python]view plaincopyimporturl
阅读全文
摘要:SuperSpider——打造功能强大的爬虫利器博文作者:加菲发布日期:2013-12-11阅读次数:4506博文内容:1.爬虫的介绍图1-1 爬虫(spider) 网络爬虫(web spider)是一个自动的通过网络抓取互联网上的网页的程序,在当今互联网中得到越来越广泛的使用。这种技术一般用来爬取网页中链接,资源等,当然,更为高级的技术是把网页中的相关数据保存下来,成为搜索引擎,例如著名的google和百度。常见的爬虫应用还有像一淘这样的比价网站,电影推荐网站等。 为了让大家进一步感受到爬虫的魅力,笔者编写了一个爬取淘宝和京东数据的比价网站(http://jiafei.org:8...
阅读全文
摘要:一、注册公司基本流程1、查询企业名称2、客户提供基本资料3、工商初审 刻章备案4、验资5、提交工商局审批,打印营业执照6、办理企业组织机构代码证7、办理税务登记证8、 领取全部执照,和其他相关材料。工具/原料注册公司所需要提供的材料1.申请注册公司的法人,股东身份证原件2.申请注册公司的名称(最少取10个名称)3.申请注册公司的经营范围4.申请注册公司的法人,股东投资比例5.申请注册公司的法人联系电话步骤/方法1选择公司的形式:普通的有限责任公司,最低注册资金3万元,需要2个(或以上)股东,从06年1月起新的公司法规定,允许1个股东注册有限责任公司,这种特殊的有限责任公司又称“一人有限公司”
阅读全文
摘要:在Linux使用grep命令,从文件中抓取显示特定的信息,如下:cat文件名 | grep 特定条件 ---> cat xxxx | grep 12345结果报错:Binary file (standard input) matches;经过查询后,意思为文件是二进制文件,不能直接grep,解决办法:cat 文件名 | grep -a 特定条件 ---> cat xxxx | grep -a 12345
阅读全文
摘要:引:有没有这样的经历:1、在shell中直接查看包含中文的文件时,出现一堆火星文,不得不下载下来window看.2、无法正常的在shell中输入中文。3、make的时候输出一堆乱码。以下是查阅各种网上包括公司内部KM得到的一些资料,通过下面的一些步骤应该就会被这些火星文困扰了。第一步:尝试修改SecureCRT上的显示配置:km上有这样一则帖子广为流传:SecureCRT的默认配置对中文支持不好。很容易出现中文乱码。即使显示出来没有乱码,将文本复制粘贴到其他windows程序中也会是乱码,或者从windows复制进SecureCRT会乱码,很不方便。这个归结起来还是字符编码的问题,需要进行以下
阅读全文
摘要:TheOGRDataSourcesupports executing commands against a datasource via theOGRDataSource::ExecuteSQL()method. While in theory any sort of command could be handled this way, in practice the mechanism is used to provide a subset of SQL SELECT capability to applications. This page discusses the generic SQ
阅读全文
摘要:TheOGRDataSourcesupports executing commands against a datasource via theOGRDataSource::ExecuteSQL()method. While in theory any sort of command could be handled this way, in practice the mechanism is used to provide a subset of SQL SELECT capability to applications. This page discusses the generic SQ
阅读全文
摘要:Perhaps you’relooking for this?ogr2ogr -f “CSV” “E:\4_GIS\NorthArkCartoData\UnitedStates\MO_wkt” “E:\4_GIS\NorthArkCartoData\UnitedStates\USStates.shp” -sql ” SELECT * FROM usstates WHERE STATE_NAME = ‘Missouri’ ” -lco “GEOMETRY=AS_WKT ” -lco “LINEFORMAT=CRLF” -lco “SEPARATOR=SEMICOLON”My buddy atwo
阅读全文
摘要:估计大家也都和我一样用过不少的编辑器,什么notepad2,emeditor,editplus,ultraedit,vs2005,sourceinsight,slickedit,emacs,vim(gvim),别看多,我其实还是比许多编辑器疯狂玩家(注意,真的是玩家)收敛多了,当然最后还是本分的从了vim(gvim),呵呵,因为Vim实在能带给我其他编辑器所没有的高效。很多编辑器都支持在源代码中自动添加作者信息的功能,据我所致sourceinsight就支持,虽然我们的Vim(gvim)默认没有这个功能,但是只需要几行代码自己配置一下,我们一样可以让Vim(gvim)支持自动添加作者信息!还是
阅读全文
摘要:查看表中已经存在 index:showindex from table_name;创建和删除索引索引的创建可以在CREATE TABLE语句中进行,也可以单独用CREATE INDEX或ALTER TABLE来给表增加索引。删除索引可以利用ALTER TABLE或DROP INDEX语句来实现。(1)使用ALTER TABLE语句创建索引。语法如下:alter table table_name add index index_name (column_list) ;alter table table_name add unique (column_list) ;alter table tabl
阅读全文
摘要:一、MySQL权限简介 关于mysql的权限简单的理解就是mysql允许你做你全力以内的事情,不可以越界。比如只允许你执行select操作,那么你就不能执行update操作。只允许你从某台机器上连接mysql,那么你就不能从除那台机器以外的其他机器连接mysql。 那么Mysql的权限是如何实现的呢?这就要说到mysql的两阶段验证,下面详细介绍:第一阶段:服务器首先会检查你是否允许连接。因为创建用户的时候会加上主机限制,可以限制成本地、某个IP、某个IP段、以及任何地方等,只允许你从配置的指定地方登陆。第二阶段:如果你能连接,Mysql会检查你发出的每个请求,看你是否有足够的权限实施它。比如
阅读全文
摘要:用awk进行文本处理,少不了就是它的数组处理。那么awk数组有那些特点,一般常见运算又会怎么样呢。我们先看下以下的一些介绍,结合样例我们会解说下它的不同之处。在 awk 中数组叫做关联数组(associative arrays),由于下标记能够是数也能够是串。awk 中的数组不必提前声明,也不必声明大小。数组元素用 0 或空串来初始化,这依据上下文而定。比如:一、定义方法1:能够用数值作数组索引(下标)Tarray[1]=“cheng mo”Tarray[2]=“800927”2:能够用字符串作数组索引(下标)Tarray[“first”]=“cheng ”Tarray[“last”]=”mo
阅读全文
摘要:由于最近工作的需要,本人学习了一下利用高性能web server - Nginx,来发布C/C++编写的fastCGI程序,详细细节如下。1.介绍 Nginx - 高性能web server,这个不用多说了,大家都知道。 FastCGI程序- 常驻型CGI程序,它是语言无关的、可伸缩架构的CGI开放扩展,其主要行为是将CGI解释器进程保持在内存中并因此获得较高的性能。 Nginx要调用FastCGI程序,需要用到FastCGI进程管理程序(因为nginx不能直接执行外部的cgi程序,我们可使用lighttpd中的spawn-fastcgi来让nginx可支持外部cgi运行。也有其他方法安...
阅读全文
摘要:由于最近工作的需要,本人学习了一下利用高性能web server - Nginx,来发布C/C++编写的fastCGI程序,详细细节如下。1.介绍 Nginx - 高性能web server,这个不用多说了,大家都知道。 FastCGI程序- 常驻型CGI程序,它是语言无关的、可伸缩架构的CGI开放扩展,其主要行为是将CGI解释器进程保持在内存中并因此获得较高的性能。 Nginx要调用FastCGI程序,需要用到FastCGI进程管理程序(因为nginx不能直接执行外部的cgi程序,我们可使用lighttpd中的spawn-fastcgi来让nginx可支持外部cgi运行。也有其他方法安...
阅读全文
浙公网安备 33010602011771号