上一页 1 2 3 4 5 6 ··· 8 下一页
摘要: 很多时候,一个字符串,你很难检测它的编码。是理论上就不行,比如一个字符串,你把他当作一个utf8的编码是一个汉字串,把他当成gb2312 还是一个汉字出串,而且在字库里面都存在。所以,我们检查也只能是说,大部分能检测出来。 我遇到的问题是这样的,百度搜索引擎的中关键字的问题。http://www.baidu.com/s?tn=159sifu_pg&wd=%E8%83%8E%E6%95%99%E9%9F%B3%E4%B9%90%E6%AC%A3%E8%B5%8F 在大多数情况下,百度默认编码是gb2312的,如果是utf8会加一个ie字段。但是比如在好hao123里面搜索的,或者其他地方搜索然后 阅读全文
posted @ 2010-12-20 18:46 暮夏 阅读(8736) 评论(0) 推荐(1) 编辑
摘要: 编码问题的确非常的棘手。很多时候,你一不小心,在某个阶段没有正确的转码,结果造成存储下来的文件 或者 保存进入数据库的字段是乱码。如果这个字段是非常重要的信息,你可能认为,你已经无法恢复这些信息了,其实,在大多数情况下面这个是能够恢复的,你要分析你转码的每个过程,确定出差错的位置,然后进行这个编码的逆转。这里我只举一个我实际中遇到的一个例子。这个例子的情况是这样的,我在cookie里面保存了一个username字段,写cookie是通过PHP程序写的,这个PHP程序的编码是gbk的。另外一个统计系统,这个统计系统,通过Javascript 读取cookie信息,然后通过url编码这些信息,发送 阅读全文
posted @ 2010-12-17 19:15 暮夏 阅读(1342) 评论(0) 推荐(0) 编辑
摘要: 钻研PHP很多年,想总结一下自己,但是不知从何说起,那就先谈一些我知道的PHP的用法,这些用法很多有多年的工作经验的人可能都不知道。实际中可能用不到,但是用到了,就是体现你实力的时候。现在问题是这样的,一个用户,用的是windows 的虚拟服务器,然后呢,当打开一个页面的时候,要并行的抓取大概10个网站的标题显示出来。这样的用法很少见,但是,有需求,就得解决。串行是一个解决方案,但是要等待的时间过长。于是我想到用curl 去并行抓取。不知道的可以参考这篇文章PHP多线程(四) 内部多线程 但是,最后发现,那个虚拟服务器上没有curl,这真是让人纠结。于是,我决定改变思路,用单个线程也实现多个线 阅读全文
posted @ 2010-12-15 14:03 暮夏 阅读(3723) 评论(1) 推荐(1) 编辑
摘要: 周末的时候看到腾讯的空间里面写日志的时候能自动提取关键字,感觉这个功能非常的好,于是我自己准备也写一个。因为,提取关键字,肯定要涉及分词,现在的分词算法,最好的估计是统计算法,但是实现稍微复杂一点,用PHP的话,性能往往也不够。于是,我一切从简,争取星期天一天能写完这个工具。 我翻了一下最简单的分词,好像就是向前最大匹配。而且如果字典好的话,据说准确率还挺高的。当然,我没有什么好字典,从中科院的分词软件里面,拿了一本字典。大概有10万的词汇量。当然,你可以用其他的字典,但是一定要有词频。 当然,只是简单的分词,算法没有什么好说的,我就说说我写的时候遇到的问题。1. 字典管理。本来我想把字典先读 阅读全文
posted @ 2010-12-06 14:36 暮夏 阅读(13297) 评论(11) 推荐(1) 编辑
摘要: 今天有个人问我如何判断一棵树是完全二叉树。我一下子想不出怎么解决这个问题,按照定义,严蔚敏那本教材上的说法:一个深度为k,节点个数为 2^k - 1 的二叉树为满二叉树。这个概念很好理解,就是一棵树,深度为k,并且没有空位。首先对满二叉树按照广度优先遍历(从左到右)的顺序进行编号。一颗深度为k二叉树,有n个节点,然后,也对这棵树进行编号,如果所有的编号都和满二叉树对应,那么这棵树是完全二叉树。 概... 阅读全文
posted @ 2010-11-11 20:33 暮夏 阅读(15740) 评论(2) 推荐(4) 编辑
摘要: 刚才我们网站的后台看到,IE6 依然有62%的客户在使用,IE7 有10%, IE8有23%。看来重点还是要把IE6给调整正确。虽然google 说不支持IE6了,可是中国有中国的国情。顺便说一句,.NET 只有在不到50%的机器上安装,至少我们的客户是这样的。 一般来说IE6 和 IE7 是相似的。IE8 和 firefox 是相似的。可以先把 IE8 和 firefox 调整好。然后,尝试调整... 阅读全文
posted @ 2010-11-08 20:23 暮夏 阅读(896) 评论(3) 推荐(1) 编辑
摘要: 最近大家可好。中国又内讧了。最近听说腾讯经常扫描用户电脑,获取用户安装软件的信息。所以,我就开始想想腾讯是怎么实现的。按照360的说法,腾讯是通过扫描桌面快捷方式的方式来实现的。我觉得腾讯很脑残,为什么要扫描桌面呢?直接用我的方法,保证不会扫描硬盘也能获取安装列表。开个玩笑,其实,聪明的人都知道360想干什么。还有说明一下,我对C#不是很熟悉,只是稍微了解一点。本来想用C++写的,但是,博客园的同... 阅读全文
posted @ 2010-11-04 23:06 暮夏 阅读(750) 评论(0) 推荐(2) 编辑
摘要: 写PHP也写了4,5年了,最近一年,很少会遇到在PHP 方面让我很困惑的问题,今天,就让我遇到了一个。不知道大家有没有遇到过这样的问题,在文件上传的时候,用 move_uploaded_file 这个函数不能移动文件,而用copy 或者 rename 确是可以的。我也一直很困惑。在文档上,说的比较模糊,就是 move_uploaded_file 这个函数,加了一步检查,检查这个文件是否是有 HTT... 阅读全文
posted @ 2010-09-03 19:38 暮夏 阅读(516) 评论(0) 推荐(0) 编辑
摘要: 本人比较穷,住的是平民窟。所以,要和别人共享网络。很多不厚道的人喜欢用arp 病毒攻击。害的我的网络不是很稳定,经常会断网。断网后,必须,重启网卡网络才能恢复。 一来重启网卡麻烦,每次断网了都要手动重启一下,二来,晚上挂机下载电影,经常下个半个小时,网络就断了,害我白开一晚上电脑。 对window操作系统,我的确是不是很精通,所以,我就换成linux, 这样,写个shell脚本自动检查网络,然后恢... 阅读全文
posted @ 2010-08-22 18:16 暮夏 阅读(3542) 评论(5) 推荐(0) 编辑
摘要:    .NET程序员,大多数时候是不需要数学的。因为,有了.NET, 数据结构和算法的重要性被弱化了,操作系统接口相关的东西被强化了。程序员只要求管理好代码,而不是设计好算法。     计算机,我只学会了技术,所以很多问题我都感觉似是而非,感觉是在学习一个API,而不是在学一门科学。     最近要实现一个哈希表,... 阅读全文
posted @ 2010-05-06 13:45 暮夏 阅读(5861) 评论(29) 推荐(6) 编辑
摘要: 注意:每个层次的知识都是渐增的,位于层次n,也蕴涵了你需了解所有低于层次n的知识。 计算机科学 Computer Science 2n (Level 0) n2 (Level 1) n (Level 2) log(n) (Level 3) Comments 数据结构 不知道数组和链表的差异 能够解释和使用数组,链表,字典等,并且能够用于实际的编程任务。 了解基本数据结构时间和空间的折中,比如数组v... 阅读全文
posted @ 2010-04-28 16:35 暮夏 阅读(723) 评论(0) 推荐(2) 编辑
摘要: javascript 的this 值,真的是非常的莫名奇妙。我一直被搞的很头晕,也许正是这个this,让大多数人感觉js 非常的莫名其妙。在查了大量的资料后,我总结了下面的三条规则,这三条规则,已经可以解决目前我所遇到的所有问题规则0:函数本身是一个特殊类型,大多数时候,可以认为是一个变量。function a(){ alert(this);}或者 var a = function(){ aler... 阅读全文
posted @ 2010-04-23 00:21 暮夏 阅读(1531) 评论(3) 推荐(2) 编辑
摘要: url 里面的 #后面的部分 可以实现无刷新的改变url 的值。这个特点非常有用。比如视频网站土豆中的豆单,你进入视频列表以后,点击播放某个视频。当然,页面最好不要刷新,但是,拷贝一下浏览器的链接,又希望是下次能定位到你播发的那个视频。方法很简单,改变一下 url 的 fragment 就可以了。 监听fragment 的变化是这类编程的核心。在主流的浏览器(IE firefox)里面 都有一个 ... 阅读全文
posted @ 2010-04-19 11:59 暮夏 阅读(1939) 评论(0) 推荐(1) 编辑
摘要: vista sp2 真是个难缠的东西。最近网络非常的不稳定,不知道怎么回事,经常断网,开始以为是别人用arp 软件攻击我,所以,请了高手来分析分析。高手觉得应该没有人攻击,然后,让它检查我的机器,为什么上不了网,高手也是搞不定。 后来安装了arp防火墙,发现有时会有人攻击,所以,我专门选了一个没有任何人上网的时间,晚上1点,去测试网络,发现还是非常的不稳定。 翻遍了英文论坛,邮件列表,找到了一篇文... 阅读全文
posted @ 2010-04-16 00:36 暮夏 阅读(809) 评论(2) 推荐(0) 编辑
摘要: 虽然,理论是可以一套又一套。但是,到了实战中,总会有些莫名其妙的问题,占用了你大量的时间。像Jquery 这样的框架,可以兼容各种各样的浏览器,可以非常完美的,简洁的进行编程。但是CSS 的设计没有这样简单,没有通用的解决方案。只能靠平时的点滴积累。 虽然,作为一个开发人员,CSS不要求精通,但是,简单的了解了解还是有必要的。最近,遇到的这个问题很简单,可以用下面的例子来表示。代码Code hig... 阅读全文
posted @ 2010-04-09 15:35 暮夏 阅读(1261) 评论(3) 推荐(0) 编辑
摘要: innerHTML 真的一个麻烦的东西。IE 和 firefox 对dom 处理的方式不是很一样。IE 对动态加载的很多dom 不支持动态更新。比如有这样一个问题。<div id="playlist"></div>在这div 中,加入一个播放吗列表。这列表用innerHTML 加入。var plst = null;plst = player.getPlaylist();if... 阅读全文
posted @ 2010-04-08 14:56 暮夏 阅读(824) 评论(0) 推荐(0) 编辑
摘要: 最近上网老是经常短线。一直以为是存在什么arp 攻击。可是查找路由器的日志,又不像是被攻击的样子。后来才发现是因为默认网关经常丢失。我找了好久,终于在一个国外论坛里面找到了解决方案:运行: regedit然后一路往下找:HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\Tcpip\Parameters\Interfaces\{DB531EAF... 阅读全文
posted @ 2010-04-04 17:20 暮夏 阅读(699) 评论(5) 推荐(0) 编辑
摘要: 一般来说,PHP数组的内存利用率只有 1/10, 也就是说,一个在C语言里面100M 内存的数组,在PHP里面就要1G。特别是在PHP作为后台服务器的系统中,经常会出现内存耗费太大的问题。 因为这个是语言的问题,常规方案比较难以解决。下面是一种通过string 解决的方案。 代码Code highlighting produced by Actipro CodeHighlighter (freew... 阅读全文
posted @ 2010-04-03 19:19 暮夏 阅读(3241) 评论(2) 推荐(1) 编辑
摘要: 最近有一个问题,要实外汇交易策略的优化问题。问题很简单:配置n 个参数,这n 个参数都取一定的范围,找出最优的参数组合。比如:a = [0, 10] (从 0, 10, a 是整数) b = [20, 30]当然,解决方案很简单,用一个两个for 循环就可以了。就可以求出所有的组合情况了。当然,问题的需求没有这样简单:1. 参数可能会很多个,比如 有10个。这样循环会写的很难看。(深度太深)2. ... 阅读全文
posted @ 2010-04-03 12:58 暮夏 阅读(586) 评论(0) 推荐(0) 编辑
摘要: 今天,我打开google ,可是只是显示然后再刷新几次,发现偶尔也能访问上。不知道为什么,连google.com 都访问不了了。真是郁闷啊。看来要用yahoo 或者 bing 了。 阅读全文
posted @ 2010-03-24 10:20 暮夏 阅读(229) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 8 下一页