随笔- 4  文章- 20  评论- 5 
2008年6月22日

【原文】Angelo’s Blog

1990年,万维网之父蒂姆•伯纳斯-李(Tim Berners-Lee)开发出了第一个网页浏览器ViolaWWW,随即很多出色的程序员加入了网页浏览器开发的行列。

终于在1993年1月,NCSA(National Center for Supercomputing Applications,美国国家超级电脑应用中心)完成革命性的创新,在Unix平台上开发出了第一个图形化的网页浏览器Mosaic(Alpha 版),同年九月发布的1.0正式版实现了在Apple Macintosh和Microsoft Windows平台上的运行,一时间Mosaic俨然成为 Web浏览器的标准。随后NCSA将Mosaic的商业运营权转售给了Spyglass公司,该公司又向包括微软公司在内的多家公司技术授权,允许其在 Mosaic的基础上开发自己的产品。

1994年Mosaic研发的核心成员马克•安德森(Marc Andreessen)和几何图形发生器的发明人吉姆•克拉克(Jim.H.Clark)共同创立了Mosaic Communication Corporation。同年11月为了避免与NCSA的法律纠葛,公司更名为Netscape Communication Corporation即网景公司,并一直沿用。其中后者还先后创立了Silicon Graphics(视算)公司和Healtheon(永健)公司。

在二人领导下,公司合力进行超越以往浏览器的新一代浏览器的研发,试图打破Mosaic的垄断并取得业界的领导地位。所以对新浏览器名为 Netscape Navigator,即“导航者”。对内其1.0版本的研发代号则为Mozilla!Mozilla一词是由“Mosaic Killa”(Mosaic杀手/终结者,Killa是俚语中Killer的拼法)和“Godzilla eat the Mosaic”(Godzilla,即“哥斯拉”,日本遭受核打击和“第五福龙丸”事件后创造的经典虚拟生物)合成而来。即Mosaic+ Godzilla+Killa=Mozilla!读作[mәu’zilʌ]。网景公司员工也常将其称作Moz或Mozzie。

起初,网景公司尝试了很多图标。最后考虑到哥斯拉是一只由遭到核辐射的蜥蜴演化而成的怪兽,最终决定采用一只会喷火的绿色蜥蜴造型。并由其员工戴夫 •泰特 斯(Dave Titus)于1994年设计完成。在1995年网景浏览器1.1版中,网景公司开发人员首先在浏览器内加入了启示文学《Mozilla之书》(《The Book of Mozilla》)!这并不是一本真的书,只要你在地址栏中键入about:mozilla便可以看到书中的“节录”(至今依旧如此,随版本不同内容亦不 同)。在这个首次出现被称为“12:10”(12:10这个章节编号实际上是指日期,即12月10日)的章节中,出现了一只野兽(“beast”,这也是 全书的主体),显然此时Mozilla已经被定位为一只野兽了。

在当时的环境下,网景浏览器的推出无疑是革命性的。如果说Mosaic是互联网热潮的燃点,那么NN(Netscape Navigator的官方简称)无疑是当时以至导致后来.COM热潮的最大的催化剂。自1.0的发行版推出,NN便迅速的占领了市场,并且成功取代 Mosaic成为新的Web标准。曾一度达到了超过90%的统治级市场占有率,并且一直保持这个占有率到1996年初,是其有力证据。

1995年,微软在取得NCSA授权后开发出了自己的第一代浏览器Internet Explorer 1.0(官方简称IE),并于同年8月开始在其新版32位操作系统Windows 95中搭售。目前普遍把这一时间看作是第一次浏览器大战的起点。

但是随后NN依旧保持着绝对垄断的市场占有率,故而“Mozilla”成为了几乎所有浏览器向Web浏览器发送的标识验证字符串。在网景公司的竞争 者中最 先采用这一办法的是微软公司,其IE验证字符串为Mozilla/<Mozilla版本号>(compatible;MSIE< MSIE版本号>)。直到1997年10月微软推出IE4.0版本的时候NN依然拥有72%的市场份额!

伴随着Windows 98系统的发售以及微软与ISP以及主机厂商的合作;可以加入IE专属标签的FrontPage软件的普及;对CSS的抢先支持;以及网景公司的错误决策。NN逐渐败下阵来。

为了扭转颓势,1998年2月23日。网景公司内部成立Mozilla组织(Mozilla.org),该组织独立运作来负责Mozilla Application Suite的研发。Mozilla Application Suite(简称Mozilla Suite)是一套自由的、跨平台的因特网应用套装软件,它的组件包括Navigator(网页浏览器)、Mail & Newsgroups(电子邮件客户端)和Composer(HTML编辑器)。3月31日,网景决定依托NPL(Netscape Public License,网景公共许可证)开放NN的源代码,意图在于吸引来大量的开发者完善软件。这一时期网景放弃了绿色蜥蜴的造型,开始使用一只凶猛的、线条 粗犷的、红色的、类似霸王龙的形象。在后来看到的《Mozilla之书》“3:31”章节中明显可以看出反攻的意图。并且使用了“玛门(Mammon)” 这一闪米特族语汇,用其贪婪和财富的内涵来隐喻微软。10月网景决定将Mozilla的源代码全部改写。

然而这些努力还是没有能够扭转颓势,终于在1998年11月24日,AOL(American On Line,美国在线)以42亿美元免税换股的方式收购了网景。其后Mozilla组织在AOL的资助下继续进行研发,期间IE夺取了浏览器市场的统治地 位,并于2002年达到96%的峰值。而Mozilla组织则接手了网景过去的很多事务,但是很多Mozilla的核心成员对成果并不很满意,他们把这归 结为受到投资方(AOL)的需求所累。

2002年6月5日,Mozilla推出了Mozilla Suite的1.0版本。由于Mozilla Suite主要是针对软件开发者而不是消费者,所以他们将每次的发行版本定名为milestone release(里程碑版),在每个版本为期4个月的研发周期里,第一个5周释放Alpha版(不稳定版,内测);第二个5周释放Beta版(较稳定版, 公测);最后几周发布正式版,期间还有可能发布RC版(release candidate,候选版)。在最后的几周中,程序的主体将用于下一版本的研发,分支将继续作稳定性适应改写。最后发行版的完成度和稳定性完全由这4个 月以及其中开发周期中程序员的完成度来决定。

2003年5月,著名的AOL诉微软垄断案达成和解。作为让步,AOL同意解散网景并中止其下业务。同年7月15日(AOL关停网景全部业务当 日), Mozilla组织在得到了来自AOL的200万美元和米切•卡普尔(Mitch Kapor,Lotus创始人)30万美元资助后,正式注册成为了非牟利机构。并正式更名为Mozilla基金会(Mozilla Foundation,简称MF或MoFo),并注册Mozilla为期商标。标识为恐龙形态的Mozilla头部(右)半面相。该基金会主体拥有免税资 格。其成立目的在于保证Mozilla计划在没有网景之后可以继续下去。早在同年3月Mozilla组织就决定放弃冗杂的业务,把精力投入到其旗下的两个 旗舰产品Firefox和Thunderbird中。在9月释出的《Mozilla之书》“7:15”章节中,描述了巨鸟用火(Fire)与雷 (Thunder)驱散玛门信徒,令野兽重生的场景。此时Firefox还在使用其第二个名字“Firebird”,所以章节中只出现了巨鸟(great bird)这一个意象。

Mozilla组织在释出Mozilla Suite1.1版本之后,便放弃了NPL(Netscape Public License,网景公共许可证)转而采用MPL(Mozilla Public License,Mozilla公共许可证)其二者都类似于GPL(GNU General Public License,GNU通用公共许可证),但是都保留了部分不可更改的权利。当自由软件基金会(Free Software Foundation,FSF,GNU计划和GPL协议的官方机构)发现了GPL与NPL以及MPL的不兼容的事实之后便像会员建议不要采用 Mozilla系产品。故而Mozilla组织/基金会在2003年逐步对下属全部产品源代码进行了向GPL的过渡。

2004年,Mozilla基金会专注于Firefox和Thunder的开发。使其逐步成为一种界面友好的消费软件。4月Mozilla基金会协 同 Opera Software(Opera是其旗下浏览器品牌)以及Apple 公司(Safari是其旗下浏览器品牌)共同成立WHATWG(Web Hypertext Application Technology Working Group)工作组,致力于开发和制定新的Web标准。并且提交W3C(World Wide Web Consortium,万维网联盟,又称W3C理事会)审核。

2005年8月3日Mozilla基金成立了完全所有的应税牟利子公司Mozilla公司。其公司初始运营资金来自Mozilla基金,其成立目的 在于推 广Firefox和Thunderbird。11月29日,在三个RC版之后Mozilla终于发布了后来广受好评的Firefox1.5正式版。由于安 全问题等多方面原因导致IE的市场占有率再次下跌至85%左右,这一时间的回落主要源于Firefox的攻击。

在2006年Mozilla基金会加强了与非本土的爱好者以及那些对Mozilla文化的认同者的联系以扩大市场。研发周期不断缩短,基本每月都有 新版本 释出。2006年10月底微软和Mozilla同时释放出IE7以及Mozilla Firefox2.0的正式版本。虽然在短时间之内IE7的下载量就突破了百万,但是却不能挽救其市场占有率持续下降的势头。Mozilla Firefox和Opera成为其主要竞争对手,另外Safari也保有了一定的市场份额,在这一时期Firefox的市场份额一直稳定的保持在10%以 上。Firefox2.0和IE7的同时释出被很多人看作是浏览器第二次大战的开端。Mozilla公司在2005年底开始的与Google合作计划也顺 利的进行着,06年上半年正式推出了带有Google工具条的Firefox正式版本,伴随Google推广攻势的展开取得了显著的效果。但是 Mozilla公司一直没有公开06年的收益,年初计划启动的时候曾有媒体报道这一做法为Mozilla带来了7200万美元的收入。Mozilla的首 席执行官米切尔•贝克(Mitchell Baker)则表示说这数字不确切,但是相差不多。

进入2007年,Mozilla似乎已经安定了下来。不想过去那么复杂多变,而是基本以一个商标或者品牌的形象出现(虽然大家还是习惯说只用 Mozilla描述基金会和公司)。5月30日,Mozilla放出了Firefox1.5的最后一版(1.5.0.12),并且公布在07年的第三季度 放出3.0的正式版。前两个季度Mozilla旗下的Firefox和Thunderbird都在保持持续的增长,不仅在欧洲市场发展稳定而且在亚洲市场 也开始被认同。6月下旬Mozilla基金会决定在中国大陆投资成立子公司谋智网络公司(谋智,Mozilla的音译),由前微软Windows Live中国区总经理宫力出任董事长兼CEO。并于7月正式挂牌营业。

至此,Mozilla的历史还在延续……

posted @ 2008-06-22 14:44 巴别塔工人 阅读(89) 评论(0)  编辑
2008年5月23日
【原文】IT168
在Web工程过程中,基于Web系统的测试、确认和验收是一项重要而富有挑战性的工作。基于Web的系统测试与传统的软件测试不同,它不但需要检查和验证是否按照设计的要求运行,而且还要测试系统在不同用户的浏览器端的显示是否合适。重要的是,还要从最终用户的角度进行安全性和可用性测试。然而,Internet和Web媒体的不可预见性使测试基于Web的系统变得困难。因此,我们必须为测试和评估复杂的基于Web的系统研究新的方法和技术。

本文将 web 测试分为 6 个部分:
1. 功能测试
2. 性能测试(包括负载/压力测试)
3. 用户界面测试
4. 兼容性测试
5. 安全测试
6. 接口测试

本文的目的是覆盖 web 测试的各个方面,未就某一主题进行深入说明。

一、功能测试

1.1 链接测试
链接是Web应用系统的一个主要特征,它是在页面之间切换和指导用户去一些不知道地址的页面的主要手段。链接测试可分为三个方面。首先,测试所有链接是否按指示的那样确实链接到了该链接的页面;其次,测试所链接的页面是否存在;最后,保证Web应用系统上没有孤立的页面,所谓孤立页面是指没有链接指向该页面,只有知道正确的URL地址才能访问。
链接测试可以自动进行,现在已经有许多工具可以采用。链接测试必须在集成测试阶段完成,也就是说,在整个Web应用系统的所有页面开发完成之后进行链接测试。
采取措施:采用自动检测网站链接的软件来进行。
推荐软件:
Xenu Link Sleuth 免费 绿色免安装软件
HTML Link Validator 共享(30天试用)

1.2 表单测试
当用户通过表单提交信息的时候,都希望表单能正常工作。
如果使用表单来进行在线注册,要确保提交按钮能正常工作,当注册完成后应返回注册成功的消息。如果使用表单收集配送信息,应确保程序能够正确处理这些数据,最后能让顾客能让客户收到包裹。要测试这些程序,需要验证服务器能正确保存这些数据,而且后台运行的程序能正确解释和使用这些信息。
当用户使用表单进行用户注册、登陆、信息提交等操作时,我们必须测试提交操作的完整性,以校验提交给服务器的信息的正确性。例如:用户填写的出生日期与职业是否恰当,填写的所属省份与所在城市是否匹配等。如果使用了默认值,还要检验默认值的正确性。如果表单只能接受指定的某些值,则也要进行测试。例如:只能接受某些字符,测试时可以跳过这些字符,看系统是否会报错。

1.3 数据校验
如果系根据业务规则需要对用户输入进行校验,需要保证这些校验功能正常工作。例如,省份的字段可以用一个有效列表进行校验。在这种情况下,需要验证列表完整而且程序正确调用了该列表(例如在列表中添加一个测试值,确定系统能够接受这个测试值)。
在测试表单时,该项测试和表单测试可能会有一些重复。

1.2和1.3的采取措施:第一个完整的版本采用手动检查,同时形成WinRunner(QTP)脚本;回归测试以及升级版本主要靠WinRunner(QTP)自动回放测试。

1.4 cookies测试
Cookies通常用来存储用户信息和用户在某应用系统的操作,当一个用户使用Cookies访问了某一个应用系统时,Web服务器将发送关于用户的信息,把该信息以Cookies的形式存储在客户端计算机上,这可用来创建动态和自定义页面或者存储登陆等信息。
如果Web应用系统使用了Cookies,就必须检查Cookies是否能正常工作。测试的内容可包括Cookies是否起作用,是否按预定的时间进行保存,刷新对Cookies有什么影响等。如果在 cookies 中保存了注册信息,请确认该 cookie能够正常工作而且已对这些信息已经加密。如果使用 cookie 来统计次数,需要验证次数累计正确。
采取措施:
1 采用黑盒测试:采用上面提到的方法进行测试
2 采用查看cookies的软件进行(初步的想法)
可以选择采用的软件
IECookiesView v1.50
Cookies Manager v1.1

1.5 数据库测试
在Web应用技术中,数据库起着重要的作用,数据库为Web应用系统的管理、运行、查询和实现用户对数据存储的请求等提供空间。在Web应用中,最常用的数据库类型是关系型数据库,可以使用SQL对信息进行处理。
在使用了数据库的Web应用系统中,一般情况下,可能发生两种错误,分别是数据一致性错误和输出错误。数据一致性错误主要是由于用户提交的表单信息不正确而造成的,而输出错误主要是由于网络速度或程序设计问题等引起的,针对这两种情况,可分别进行测试。
采取措施:暂时没有更好的测试方法
考虑结合到1.2和1.3的测试中

1.6 应用程序特定的功能需求
最重要的是,测试人员需要对应用程序特定的功能需求进行验证。尝试用户可能进行的所有操作:下订单、更改订单、取消订单、核对订单状态、在货物发送之前更改送货信息、在线支付等等。这是用户之所以使用网站的原因,一定要确认网站能像广告宣传的那样神奇。
采取措施:深刻理解需求说明文档

1.7 设计语言测试
Web设计语言版本的差异可以引起客户端或服务器端严重的问题,例如使用哪种版本的HTML等。当在分布式环境中开发时,开发人员都不在一起,这个问题就显得尤为重要。除了HTML的版本问题外,不同的脚本语言,例如Java、javascript、 ActiveX、VBScript或Perl等也要进行验证。
暂时没有方法测试,可以多参考一点讨论组内的更新信息

二、性能测试

2.1 连接速度测试
用户连接到Web应用系统的速度根据上网方式的变化而变化,他们或许是电话拨号,或是宽带上网。当下载一个程序时,用户可以等较长的时间,但如果仅仅访问一个页面就不会这样。如果Web系统响应时间太长(例如超过5秒钟),用户就会因没有耐心等待而离开。
另外,有些页面有超时的限制,如果响应速度太慢,用户可能还没来得及浏览内容,就需要重新登陆了。而且,连接速度太慢,还可能引起数据丢失,使用户得不到真实的页面。

2.2 负载测试
负载测试是为了测量Web系统在某一负载级别上的性能,以保证Web系统在需求范围内能正常工作。负载级别可以是某个时刻同时访问Web系统的用户数量,也可以是在线数据处理的数量。例如:Web应用系统能允许多少个用户同时在线?如果超过了这个数量,会出现什么现象?Web应用系统能否处理大量用户对同一个页面的请求?

2.3 压力测试
负载测试应该安排在Web系统发布以后,在实际的网络环境中进行测试。因为一个企业内部员工,特别是项目组人员总是有限的,而一个Web系统能同时处理的请求数量将远远超出这个限度,所以,只有放在Internet上,接受负载测试,其结果才是正确可信的。
进行压力测试是指实际破坏一个Web应用系统,测试系统的反映。压力测试是测试系统的限制和故障恢复能力,也就是测试Web应用系统会不会崩溃,在什么情况下会崩溃。黑客常常提供错误的数据负载,直到Web应用系统崩溃,接着当系统重新启动时获得存取权。
压力测试的区域包括表单、登陆和其他信息传输页面等。
•负载/压力测试应该关注什么?
测试需要验证系统能否在同一时间响应大量的用户,在用户传送大量数据的时候能否响应,系统能否长时间运行。可访问性对用户来说是极其重要的。如果用户得到“系统忙”的信息,他们可能放弃,并转向竞争对手。系统检测不仅要使用户能够正常访问站点,在很多情况下,可能会有黑客试图通过发送大量数据包来攻击服务器。出于安全的原因,测试人员应该知道当系统过载时,需要采取哪些措施,而不是简单地提升系统性能。
•瞬间访问高峰
如果您的站点用于公布彩票的抽奖结果,最好使系统在中奖号码公布后的一段时间内能够响应上百万的请求。负载测试工具能够模拟 X 个用户同时访问测试站点。
•每个用户传送大量数据
网上书店的多数用户可能只订购 1-5 书,但是大学书店可能会订购 5000 本有关心理学介绍的课本? 或者一个祖母为她的 50 个儿孙购买圣诞礼物(当然每个孩子都有自己的邮件地址) 系统能处理单个用户的大量数据吗?
•长时间的使用
如果站点用于处理鲜花订单,那么至少希望它在母亲节前的一周内能持续运行。如果站点提供基于 web 的 email 服务,那么点最好能持续运行几个月,甚至几年。可能需要使用自动测试工具来完成这种类型的测试,因为很难通过手工完成这些测试。你可以想象组织100 个人同时点击某个站点。
但是同时组织 100000 个人呢。通常,测试工具在第二次使用的时候,它创造的效益,就足以支付成本。而且,测试工具安装完成之后,再次使用的时候,只要点击几下。
采取措施:采用测试工具WAS、ACT协助进行测试

三、用户界面测试

3.1 导航测试
导航描述了用户在一个页面内操作的方式,在不同的用户接口控制之间,例如按钮、对话框、列表和窗口等;或在不同的连接页面之间。通过考虑下列问题,可以决定一个Web应用系统是否易于导航:导航是否直观?Web系统的主要部分是否可通过主页存取?Web系统是否需要站点地图、搜索引擎或其他的导航帮助?
在一个页面上放太多的信息往往起到与预期相反的效果。Web应用系统的用户趋向于目的驱动,很快地扫描一个Web应用系统,看是否有满足自己需要的信息,如果没有,就会很快地离开。很少有用户愿意花时间去熟悉Web应用系统的结构,因此,Web应用系统导航帮助要尽可能地准确。
导航的另一个重要方面是Web应用系统的页面结构、导航、菜单、连接的风格是否一致。确保用户凭直觉就知道Web应用系统里面是否还有内容,内容在什么地方。
Web应用系统的层次一旦决定,就要着手测试用户导航功能,让最终用户参与这种测试,效果将更加明显。

3.2 图形测试
在Web应用系统中,适当的图片和动画既能起到广告宣传的作用,又能起到美化页面的功能。一个Web应用系统的图形可以包括图片、动画、边框、颜色、字体、背景、按钮等。图形测试的内容有:
(1)要确保图形有明确的用途,图片或动画不要胡乱地堆在一起,以免浪费传输时间。Web应用系统的图片尺寸要尽量地小,并且要能清楚地说明某件事情,一般都链接到某个具体的页面。
(2)验证所有页面字体的风格是否一致。
(3)背景颜色应该与字体颜色和前景颜色相搭配。
(4)图片的大小和质量也是一个很重要的因素,一般采用JPG或GIF压缩,最好能使图片的大小减小到 30k 以下
(5)最后,需要验证的是文字回绕是否正确。如果说明文字指向右边的图片,应该确保该图片出现在右边。不要因为使用图片而使窗口和段落排列古怪或者出现孤行。
通常来说,使用少许或尽量不使用背景是个不错的选择。如果您想用背景,那么最好使用单色的,和导航条一起放在页面的左边。另外,图案和图片可能会转移用户的注意力。

3.3 内容测试
内容测试用来检验Web应用系统提供信息的正确性、准确性和相关性。
信息的正确性是指信息是可靠的还是误传的。例如,在商品价格列表中,错误的价格可能引起财政问题甚至导致法律纠纷;信息的准确性是指是否有语法或拼写错误。这种测试通常使用一些文字处理软件来进行,例如使用Microsoft Word的"拼音与语法检查"功能;信息的相关性是指是否在当前页面可以找到与当前浏览信息相关的信息列表或入口,也就是一般Web站点中的所谓"相关文章列表"。
对于开发人员来说,可能先有功能然后才对这个功能进行描述。大家坐在一起讨论一些新的功能,然后开始开发,在开发的时候,开发人员可能不注重文字表达,他们添加文字可能只是为了对齐页面。不幸的是,这样出来的产品可能产生严重的误解。因此测试人员和公关部门一起检查内容的文字表达是否恰当。否则,公司可能陷入麻烦之中,也可能引起法律方面的问题。测试人员应确保站点看起来更专业些。过分地使用粗体字、大字体和下划线可能会让用户感到不舒服。
在进行用户可用性方面的测试时,最好先请图形设计专家对站点进行评估。你可能不希望看到一篇到处是黑体字的文章,所以相信您也希望自己的站点能更专业一些。最后,需要确定是否列出了相关站点的链接。很多站点希望用户将邮件发到一个特定的地址,或者从某个站点下载浏览器。但是如果用户无法点击这些地址,他们可能会觉得很迷惑。

3.4 表格测试
需要验证表格是否设置正确。用户是否需要向右滚动页面才能看见产品的价格?把价格放在左边,而把产品细节放在右边是否更有效? 每一栏的宽度是否足够宽,表格里的文字是否都有折行?是否有因为某一格的内容太多,而将整行的内容拉长?

3.5 整体界面测试
整体界面是指整个Web应用系统的页面结构设计,是给用户的一个整体感。例如:当用户浏览Web应用系统时是否感到舒适,是否凭直觉就知道要找的信息在什么地方?整个Web应用系统的设计风格是否一致?
对整体界面的测试过程,其实是一个对最终用户进行调查的过程。一般Web应用系统采取在主页上做一个调查问卷的形式,来得到最终用户的反馈信息。
对所有的用户界面测试来说,都需要有外部人员(与Web应用系统开发没有联系或联系很少的人员)的参与,最好是最终用户的参与。
采取措施:手动测试,参与人员最好有外部人员

四、兼容性测试

4.1 平台测试
市场上有很多不同的操作系统类型,最常见的有Windows、Unix、Macintosh、Linux等。Web应用系统的最终用户究竟使用哪一种操作系统,取决于用户系统的配置。这样,就可能会发生兼容性问题,同一个应用可能在某些操作系统下能正常运行,但在另外的操作系统下可能会运行失败。
因此,在Web系统发布之前,需要在各种操作系统下对Web系统进行兼容性测试。

4.2 浏览器测试
浏览器是Web客户端最核心的构件,来自不同厂商的浏览器对Java,、javascript、 ActiveX、 plug-ins或不同的HTML规格有不同的支持。例如,ActiveX是Microsoft的产品,是为Internet Explorer而设计的,javascript是Netscape的产品,Java是Sun的产品等等。另外,框架和层次结构风格在不同的浏览器中也有不同的显示,甚至根本不显示。不同的浏览器对安全性和Java的设置也不一样。
测试浏览器兼容性的一个方法是创建一个兼容性矩阵。在这个矩阵中,测试不同厂商、不同版本的浏览器对某些构件和设置的适应性。

4.3 分辨率测试
页面版式在 640x400、600x800 或 1024x768 的分辨率模式下是否显示正常? 字体是否太小以至于无法浏览? 或者是太大? 文本和图片是否对齐?

4.4 Modem/连接速率
是否有这种情况,用户使用 28.8 modem下载一个页面需要 10 分钟,但测试人员在测试的时候使用的是 T1 专线? 用户在下载文章或演示的时候,可能会等待比较长的时间,但却不会耐心等待首页的出现。最后,需要确认图片不会太大。

4.5 打印机
用户可能会将网页打印下来。因此网也在设计的时候要考虑到打印问题,注意节约纸张和油墨。有不少用户喜欢阅读而不是盯着屏幕,因此需要验证网页打印是否正常。有时在屏幕上显示的图片和文本的对齐方式可能与打印出来的东西不一样。测试人员至少需要验证订单确认页面打印是正常的。

4.6 组合测试
最后需要进行组合测试。600x800 的分辨率在 MAC 机上可能不错,但是在 IBM 兼容机上却很难看。在 IBM 机器上使用Netscape 能正常显示,但却无法使用 Lynx 来浏览。如果是内部使用的 web 站点,测试可能会轻松一些。如果公司指定使用某个类型的浏览器,那么只需在该浏览器上进行测试。如果所有的人都使用 T1 专线,可能不需要测试下载施加。(但需要注意的是,可能会有员工从家里拨号进入系统) 有些内部应用程序,开发部门可能在系统需求中声明不支持某些系统而只支持一些那些已设置的系统。但是,理想的情况是,系统能在所有机器上运行,这样就不会限制将来的发展和变动。
采取措施:根据实际情况,采取等价划分的方法,列出兼容性矩阵

五、安全测试
即使站点不接受信用卡支付,安全问题也是非常重要的。Web 站点收集的用户资料只能在公司内部使用。如果用户信息被黑客泄露,客户在进行交易时,就不会有安全感。

5.1 目录设置
Web 安全的第一步就是正确设置目录。每个目录下应该有 index.html 或 main.html 页面,这样就不会显示该目录下的所有内容。我服务的一个公司没有执行这条规则。我选中一幅图片,单击鼠标右键,找到该图片所在的路径"…com/objects/images"。然后在浏览器地址栏中手工输入该路径,发现该站点所有图片的列表。这可能没什么关系。我进入下一级目录 "…com/objects" ,点击jackpot。在该目录下有很多资料,其中引起我注意的是已过期页面。该公司每个月都要更改产品价格,并且保存过期页面。我翻看了一下这些记录,就可以估计他们的边际利润以及他们为了争取一个合同还有多大的降价空间。如果某个客户在谈判之前查看了这些信息,他们在谈判桌上肯定处于上风。

5.2 SSL
很多站点使用 SSL 进行安全传送。你知道你进入一个 SSL 站点是因为浏览器出现了警告消息,而且在地址栏中的 HTTP 变成HTTPS。如果开发部门使用了SSL,测试人员需要确定是否有相应的替代页面(适用于3.0 以下版本的浏览器,这些浏览器不支持SSL。当用户进入或离开安全站点的时候,请确认有相应的提示信息。是否有连接时间限制?超过限制时间后出现什么情况?

5.3 登录
有些站点需要用户进行登录,以验证他们的身份。这样对用户是方便的,他们不需要每次都输入个人资料。你需要验证系统阻止非法的用户名/口令登录,而能够通过有效登录。用户登录是否有次数限制? 是否限制从某些 IP 地址登录? 如果允许登录失败的次数为3,你在第三次登录的时候输入正确的用户名和口令,能通过验证吗? 口令选择有规则限制吗? 是否可以不登陆而直接浏览某个页面?
Web应用系统是否有超时的限制,也就是说,用户登陆后在一定时间内(例如15分钟)没有点击任何页面,是否需要重新登陆才能正常使用。

5.4 日志文件
在后台,要注意验证服务器日志工作正常。日志是否记所有的事务处理? 是否记录失败的注册企图? 是否记录被盗信用卡的使用? 是否在每次事务完成的时候都进行保存? 记录IP 地址吗? 记录用户名吗?

5.5 脚本语言
脚本语言是常见的安全隐患。每种语言的细节有所不同。有些脚本允许访问根目录。其他只允许访问邮件服务器,但是经验丰富的黑客可以将服务器用户名和口令发送给他们自己。找出站点使用了哪些脚本语言,并研究该语言的缺陷。还要需要测试没有经过授权,就不能在服务器端放置和编辑脚本的问题。最好的办法是订阅一个讨论站点使用的脚本语言安全性的新闻组。

六、接口测试
在很多情况下,web 站点不是孤立。Web 站点可能会与外部服务器通讯,请求数据、验证数据或提交订单。

6.1 服务器接口
第一个需要测试的接口是浏览器与服务器的接口。测试人员提交事务,然后查看服务器记录,并验证在浏览器上看到的正好是服务器上发生的。测试人员还可以查询数据库,确认事务数据已正确保存。
这种测试可以归到功能测试中的表单测试和数据校验测试中

6.2 外部接口
有些 web 系统有外部接口。例如,网上商店可能要实时验证信用卡数据以减少欺诈行为的发生。测试的时候,要使用 web 接口发送一些事务数据,分别对有效信用卡、无效信用卡和被盗信用卡进行验证。如果商店只使用 Visa 卡和 Mastercard 卡, 可以尝试使用Discover 卡的数据。(简单的客户端脚本能够在提交事务之前对代码进行识别,例如 3 表示 American Express,4 表示Visa,5 表示 Mastercard,6 代表Discover。)通常,测试人员需要确认软件能够处理外部服务器返回的所有可能的消息。
这种情况在远程抄表中可能会体现到

6.3 错误处理
最容易被测试人员忽略的地方是接口错误处理。通常我们试图确认系统能够处理所有错误,但却无法预期系统所有可能的错误。尝试在处理过程中中断事务,看看会发生什么情况?订单是否完成?尝试中断用户到服务器的网络连接。尝试中断 web 服务器到信用卡验证服务器的连接。在这些情况下,系统能否正确处理这些错误?是否已对信用卡进行收费?如果用户自己中断事务处理,在订单已保存而用户没有返回网站确认的时候,需要由客户代表致电用户进行订单确认。
采取措施:在理解需求的基础上,充分发挥想象力,尽量比较全面的列出各种异常情况。

七、结论
无论你在测试 internet、intranet 或者是 extranet 应用程序,web 测试相对于非 web 测试来说都是更具挑战性的工作。用户对 web 页面质量有很高的期望。在很多情况下,就像业务功能一样,页面用于维护和发展公共关系,所以第一印象非常重要。
posted @ 2008-05-23 17:21 巴别塔工人 阅读(189) 评论(0)  编辑
2008年5月14日
【作者】刘科垠
【原文】http://china.manufacturer.com/article/study_for_character_encoding_java.htm
1. 概述
本文主要包括以下几个方面:编码基本知识,java,系统软件,url,工具软件等。
在下面的描述中,将以"中文"两个字为例,经查表可以知道其GB2312编码是"d6d0 cec4",Unicode编码为"4e2d 6587",UTF编码就是"e4b8ad e69687"。注意,这两个字没有iso8859-1编码,但可以用iso8859-1编码来"表示"。

2. 编码基本知识
最早的编码是iso8859-1,和ascii编码相似。但为了方便表示各种各样的语言,逐渐出现了很多标准编码,重要的有如下几个。

2.1. iso8859-1
属于单字节编码,最多能表示的字符范围是0-255,应用于英文系列。比如,字母'a'的编码为0x61=97。
很明显,iso8859-1编码表 示的字符范围很窄,无法表示中文字符。但是,由于是单字节编码,和计算机最基础的表示单位一致,所以很多时候,仍旧使用iso8859-1编码来表示。而 且在很多协议上,默认使用该编码。比如,虽然"中文"两个字不存在iso8859-1编码,以gb2312编码为例,应该是"d6d0 cec4"两个字符,使用iso8859-1编码的时候则将它拆开为4个字节来表示:"d6 d0 ce c4"(事实上,在进行存储的时候,也是以字节为单位处理的)。而如果是UTF编码,则是6个字节"e4 b8 ad e6 96 87"。很明显,这种表示方法还需要以另一种编码为基础。

2.2. GB2312/GBK
这就是汉子的国标码,专门用来表示汉字,是双字节编码,而英文字母和iso8859-1一致(兼容iso8859-1编码)。其中gbk编码能够用来同时表示繁体字和简体字,而gb2312只能表示简体字,gbk是兼容gb2312编码的。

2.3. unicode
这是最统一的编码,可以用来表示所 有语言的字符,而且是定长双字节(也有四字节的)编码,包括英文字母在内。所以可以说它是不兼容iso8859-1编码的,也不兼容任何编码。不过,相对 于iso8859-1编码来说,uniocode编码只是在前面增加了一个0字节,比如字母'a'为"00 61"。
需要说明的是,定长编码便于计算机处理(注意GB2312/GBK不是定长编码),而unicode又可以用来表示所有字符,所以在很多软件内部是使用unicode编码来处理的,比如java。

2.4. UTF
考虑到unicode编码不兼容 iso8859-1编码,而且容易占用更多的空间:因为对于英文字母,unicode也需要两个字节来表示。所以unicode不便于传输和存储。因此而 产生了utf编码,utf编码兼容iso8859-1编码,同时也可以用来表示所有语言的字符,不过,utf编码是不定长编码,每一个字符的长度从1-6 个字节不等。另外,utf编码自带简单的校验功能。一般来讲,英文字母都是用一个字节表示,而汉字使用三个字节。

注意,虽然说utf是为了使用更少 的空间而使用的,但那只是相对于unicode编码来说,如果已经知道是汉字,则使用GB2312/GBK无疑是最节省的。不过另一方面,值得说明的是, 虽然utf编码对汉字使用3个字节,但即使对于汉字网页,utf编码也会比unicode编码节省,因为网页中包含了很多的英文字符。

3. java对字符的处理
在java应用软件中,会有多处涉及到字符集编码,有些地方需要进行正确的设置,有些地方需要进行一定程度的处理。

3.1. getBytes(charset)
这是java字符串处理的一个标准函数,其作用是将字符串所表示的字符按照charset编码,并以字节方式表示。注意字符串在java内存中总是按unicode编码存储的。比如"中文",正常情况下(即没有错误的时候)存储为"4e2d 6587",如果charset为"gbk",则被编码为"d6d0 cec4",然后返回字节"d6 d0 ce c4"。如果charset为"utf8"则最后是"e4 b8 ad e6 96 87"。如果是"iso8859-1",则由于无法编码,最后返回 "3f 3f"(两个问号)。

3.2. new String(charset)
这是java字符串处理的另一个标准函数,和上一个函数的作用相反,将字节数组按照charset编码进行组合识别,最后转换为unicode存储。参考上述getBytes的例子,"gbk" 和"utf8"都可以得出正确的结果"4e2d 6587",但iso8859-1最后变成了"003f 003f"(两个问号)。
因为utf8可以用来表示/编码所有字符,所以new String( str.getBytes( "utf8" ), "utf8" ) === str,即完全可逆。

3.3. setCharacterEncoding()
该函数用来设置http请求或者相应的编码。
对于request,是指提交内容 的编码,指定后可以通过getParameter()则直接获得正确的字符串,如果不指定,则默认使用iso8859-1编码,需要进一步处理。参见下述 "表单输入"。值得注意的是在执行setCharacterEncoding()之前,不能执行任何getParameter()。java doc上说明:This method must be called prior to reading request parameters or reading input using getReader()。而且,该指定只对POST方法有效,对GET方法无效。分析原因,应该是在执行第一个getParameter()的时候, java将会按照编码分析所有的提交内容,而后续的getParameter()不再进行分析,所以setCharacterEncoding()无效。 而对于GET方法提交表单是,提交的内容在URL中,一开始就已经按照编码分析所有的提交内容,setCharacterEncoding()自然就无 效。
对于response,则是指定输出内容的编码,同时,该设置会传递给浏览器,告诉浏览器输出内容所采用的编码。

3.4. 处理过程
下面分析两个有代表性的例子,说明java对编码有关问题的处理方法。

3.4.1. 表单输入
User input  *(gbk:d6d0 cec4)  browser  *(gbk:d6d0 cec4)  web server  iso8859-1(00d6 00d 000ce 00c4)  class,需要在class中进行处理:getbytes("iso8859-1")为d6 d0 ce c4,new String("gbk")为d6d0 cec4,内存中以unicode编码则为4e2d 6587
l 用户输入的编码方式和页面指定的编码有关,也和用户的操作系统有关,所以是不确定的,上例以gbk为例。
l 从browser到web server,可以在表单中指定提交内容时使用的字符集,否则会使用页面指定的编码。而如果在url中直接用?的方式输入参数,则其编码往往是操作系统本身的编码,因为这时和页面无关。上述仍旧以gbk编码为例。
l Web server接收到的是字节流,默认时(getParameter)会以iso8859-1编码处理之,结果是不正确的,所以需要进行处理。但如果预先设 置了编码(通过request. setCharacterEncoding ()),则能够直接获取到正确的结果。
l 在页面中指定编码是个好习惯,否则可能失去控制,无法指定正确的编码。

3.4.2. 文件编译
假设文件是gbk编码保存的,而编译有两种编码选择:gbk或者iso8859-1,前者是中文windows的默认编码,后者是linux的默认编码,当然也可以在编译时指定编码。
Jsp  *(gbk:d6d0 cec4)  java file  *(gbk:d6d0 cec4)  compiler read  uincode(gbk: 4e2d 6587; iso8859-1: 00d6 00d 000ce 00c4)  compiler write  utf(gbk: e4b8ad e69687; iso8859-1: *)  compiled file  unicode(gbk: 4e2d 6587; iso8859-1: 00d6 00d 000ce 00c4)  class。所以用gbk编码保存,而用iso8859-1编译的结果是不正确的。
class  unicode(4e2d 6587)  system.out / jsp.out  gbk(d6d0 cec4)  os console / browser。
l 文件可以以多种编码方式保存,中文windows下,默认为ansi/gbk。
l 编译器读取文件时,需要得到文件的编码,如果未指定,则使用系统默认编码。一般class文件,是以系统默认编码保存的,所以编译不会出问题,但对于 jsp文件,如果在中文windows下编辑保存,而部署在英文linux下运行/编译,则会出现问题。所以需要在jsp文件中用 pageEncoding指定编码。
l Java编译的时候会转换成统一的unicode编码处理,最后保存的时候再转换为utf编码。
l 当系统输出字符的时候,会按指定编码输出,对于中文windows下,System.out将使用gbk编码,而对于response(浏览器),则使用 jsp文件头指定的contentType,或者可以直接为response指定编码。同时,会告诉browser网页的编码。如果未指定,则会使用 iso8859-1编码。对于中文,应该为browser指定输出字符串的编码。
l browser显示网页的时候,首先使用response中指定的编码(jsp文件头指定的contentType最终也反映在response上),如果未指定,则会使用网页中meta项指定中的contentType。

3.5. 几处设置
对于web应用程序,和编码有关的设置或者函数如下。

3.5.1. jsp编译
指定文件的存储编码,很明显,该设置应该置于文件的开头。例如:<%@page pageEncoding="GBK"%>。另外,对于一般class文件,可以在编译的时候指定编码。

3.5.2. jsp输出
指定文件输出到browser是使 用的编码,该设置也应该置于文件的开头。例如:<%@ page contentType="text/html; charset= GBK" %>。该设置和response.setCharacterEncoding("GBK")等效。

3.5.3. meta设置
指定网页使用的编码,该设置对静态网页尤其有作用。因为静态网页无法采用jsp的设置,而且也无法执行response.setCharacterEncoding()。例如:<META http-equiv="Content-Type" content="text/html; charset=GBK" />
如果同时采用了jsp输出和meta设置两种编码指定方式,则jsp指定的优先。因为jsp指定的直接体现在response中。
需要注意的是,apache有一个设置可以给无编码指定的网页指定编码,该指定等同于jsp的编码指定方式,所以会覆盖静态网页中的meta指定。所以有人建议关闭该设置。

3.5.4. form设置
当浏览器提交表单的时候,可以指定相应的编码。例如:<form accept-charset= "gb2312">。一般不必不使用该设置,浏览器会直接使用网页的编码。

4. 系统软件
下面讨论几个相关的系统软件。

4.1. mysql数据库
很明显,要支持多语言,应该将数据库的编码设置成utf或者unicode,而utf更适合与存储。但是,如果中文数据中包含的英文字母很少,其实unicode更为适合。
数据库的编码可以通过mysql的 配置文件设置,例如default-character-set=utf8。还可以在数据库链接URL中设置,例如: useUnicode=true&characterEncoding=UTF-8。注意这两者应该保持一致,在新的sql版本里,在数据库链接 URL里可以不进行设置,但也不能是错误的设置。

4.2. apache
appache和编码有关的配置在httpd.conf中,例如AddDefaultCharset UTF-8。如前所述,该功能会将所有静态页面的编码设置为UTF-8,最好关闭该功能。
另外,apache还有单独的模块来处理网页响应头,其中也可能对编码进行设置。

4.3. linux默认编码
这里所说的linux默认编码,是指运行时的环境变量。两个重要的环境变量是LC_ALL和LANG,默认编码会影响到java URLEncode的行为,下面有描述。
建议都设置为"zh_CN.UTF-8"。

4.4. 其它
为了支持中文文件名,linux在加载磁盘时应该指定字符集,例如:mount /dev/hda5 /mnt/hda5/ -t ntfs -o iocharset=gb2312。
另外,如前所述,使用GET方法提 交的信息不支持request.setCharacterEncoding(),但可以通过tomcat的配置文件指定字符集,在tomcat的 server.xml文件中,形如:<Connector ... URIEncoding="GBK"/>。这种方法将统一设置所有请求,而不能针对具体页面进行设置,也不一定和browser使用的编码相同,所 以有时候并不是所期望的。

5. URL地址
URL地址中含有中文字符是很麻烦的,前面描述过使用GET方法提交表单的情况,使用GET方法时,参数就是包含在URL中。

5.1. URL编码
对于URL中的一些特殊字符,浏览器会自动进行编码。这些字符除了"/?&"等外,还包括unicode字符,比如汉子。这时的编码比较特殊。
IE有一个选项"总是使用UTF- 8发送URL",当该选项有效时,IE将会对特殊字符进行UTF-8编码,同时进行URL编码。如果改选项无效,则使用默认编码"GBK",并且不进行 URL编码。但是,对于URL后面的参数,则总是不进行编码,相当于UTF-8选项无效。比如"中文.html?a=中文",当UTF-8选项有效时,将 发送链接"%e4%b8%ad%e6%96%87.html?a="x4e"x2d"x65"x87";而UTF-8选项无效时,将发送链接""x4e"x2d"x65"x87.html?a="x4e"x2d"x65"x87"。注意后者前面的"中文"两个字只有4个字节,而前者却有18个字节,这主要时URL编码的原因。
当web server(tomcat)接收到该链接时,将会进行URL解码,即去掉"%",同时按照ISO8859-1编码(上面已经描述,可以使用URLEncoding来设置成其它编码)识别。上述例子的结果分别是""ue4"ub8"uad"ue6"u96"u87.html?a="u4e"u2d"u65"u87"和""u4e"u2d"u65"u87.html?a="u4e"u2d"u65"u87",注意前者前面的"中文"两个字恢复成了6个字符。这里用""u",表示是unicode。
所以,由于客户端设置的不同,相同的链接,在服务器上得到了不同结果。这个问题不少人都遇到,却没有很好的解决办法。所以有的网站会建议用户尝试关闭UTF-8选项。不过,下面会描述一个更好的处理办法。

5.2. rewrite
熟悉的人都知道,apache有一 个功能强大的rewrite模块,这里不描述其功能。需要说明的是该模块会自动将URL解码(去除%),即完成上述web server(tomcat)的部分功能。有相关文档介绍说可以使用[NE]参数来关闭该功能,但我试验并未成功,可能是因为版本(我使用的是 apache 2.0.54)问题。另外,当参数中含有"?& "等符号的时候,该功能将导致系统得不到正常结果。
rewrite本身似乎完全是采用字节处理的方式,而不考虑字符串的编码,所以不会带来编码问题。

5.3. URLEncode.encode()
这是Java本身提供对的URL编码函数,完成的工作和上述UTF-8选项有效时浏览器所做的工作相似。值得说明的是,java已经不赞成不指定编码来使用该方法(deprecated)。应该在使用的时候增加编码指定。
当不指定编码的时候,该方法使用系统默认编码,这会导致软件运行结果得不确定。比如对于"中文",当系统默认编码为"gb2312"时,结果是"%4e%2d%65%87",而默认编码为"UTF-8",结果却是"%e4%b8%ad%e6%96%87",后续程序将难以处理。另外,这儿说的系统默认编码是由运行tomcat时的环境变量LC_ALL和LANG等决定的,曾经出现过tomcat重启后就出现乱码的问题,最后才郁闷的发现是因为修改修改了这两个环境变量。
建议统一指定为"UTF-8"编码,可能需要修改相应的程序。

5.4. 一个解决方案
上面说起过,因为浏览器设置的不同,对于同一个链接,web server收到的是不同内容,而软件系统有无法知道这中间的区别,所以这一协议目前还存在缺陷。
针对具体问题,不应该侥幸认为所有客户的IE设置都是UTF-8有效的,也不应该粗暴的建议用户修改IE设置,要知道,用户不可能去记住每一个web server的设置。所以,接下来的解决办法就只能是让自己的程序多一点智能:根据内容来分析编码是否UTF-8。
比较幸运的是UTF-8编码相当有规律,所以可以通过分析传输过来的链接内容,来判断是否是正确的UTF-8字符,如果是,则以UTF-8处理之,如果不是,则使用客户默认编码(比如"GBK"),下面是一个判断是否UTF-8的例子,如果你了解相应规律,就容易理解。
public static boolean isValidUtf8(byte[] b,int aMaxCount){
       int lLen=b.length,lCharCount=0;
       for(int i=0;i<lLen && lCharCount<aMaxCount;++lCharCount){
              byte lByte=b[i++];//to fast operation, ++ now, ready for the following for(;;)
              if(lByte>=0) continue;//>=0 is normal ascii
              if(lByte<(byte)0xc0 || lByte>(byte)0xfd) return false;
              int lCount=lByte>(byte)0xfc?5:lByte>(byte)0xf8?4
                     :lByte>(byte)0xf0?3:lByte>(byte)0xe0?2:1;
              if(i+lCount>lLen) return false;
              for(int j=0;j<lCount;++j,++i) if(b[i]>=(byte)0xc0) return false;
       }
       return true;
}
相应地,一个使用上述方法的例子如下:
public static String getUrlParam(String aStr,String aDefaultCharset)
throws UnsupportedEncodingException{
       if(aStr==null) return null;
       byte[] lBytes=aStr.getBytes("ISO-8859-1");
       return new String(lBytes,StringUtil.isValidUtf8(lBytes)?"utf8":aDefaultCharset);
}
不过,该方法也存在缺陷,如下两方面:
l 没有包括对用户默认编码的识别,这可以根据请求信息的语言来判断,但不一定正确,因为我们有时候也会输入一些韩文,或者其他文字。
l 可能会错误判断UTF-8字符,一个例子是"学习"两个字,其GBK编码是" "xd1"xa7"xcf"xb0",如果使用上述isValidUtf8方法判断,将返回true。可以考虑使用更严格的判断方法,不过估计效果不大。
有一个例子可以证明google也遇到了上述问题,而且也采用了和上述相似的处理方法,比如,如果在地址栏中输入"http://www.google.com/search?hl=zh-CN&newwindow=1&q=学习",google将无法正确识别,而其他汉字一般能够正常识别。
最后,应该补充说明一下,如果不使用rewrite规则,或者通过表单提交数据,其实并不一定会遇到上述问题,因为这时可以在提交数据时指定希望的编码。另外,中文文件名确实会带来问题,应该谨慎使用。

6. 其它
下面描述一些和编码有关的其他问题。

6.1. SecureCRT
除了浏览器和控制台与编码有关外,一些客户端也很有关系。比如在使用SecureCRT连接linux时,应该让SecureCRT的显示编码(不同的session,可以有不同的编码设置)和linux的编码环境变量保持一致。否则看到的一些帮助信息,就可能是乱码。
另外,mysql有自己的编码设置,也应该保持和SecureCRT的显示编码一致。否则通过SecureCRT执行sql语句的时候,可能无法处理中文字符,查询结果也会出现乱码。
对于Utf-8文件,很多编辑器 (比如记事本)会在文件开头增加三个不可见的标志字节,如果作为mysql的输入文件,则必须要去掉这三个字符。(用linux的vi保存可以去掉这三个 字符)。一个有趣的现象是,在中文windows下,创建一个新txt文件,用记事本打开,输入"连通"两个字,保存,再打开,你会发现两个字没了,只留 下一个小黑点。

6.2. 过滤器
如果需要统一设置编码,则通过 filter进行设置是个不错的选择。在filter class中,可以统一为需要的请求或者回应设置编码。参加上述setCharacterEncoding()。这个类apache已经给出了可以直接使 用的例子SetCharacterEncodingFilter。

6.3. POST和GET
很明显,以POST提交信息时,URL有更好的可读性,而且可以方便的使用setCharacterEncoding()来处理字符集问题。但GET方法形成的URL能够更容易表达网页的实际内容,也能够用于收藏。
从统一的角度考虑问题,建议采用 GET方法,这要求在程序中获得参数是进行特殊处理,而无法使用setCharacterEncoding()的便利,如果不考虑rewrite,就不存 在IE的UTF-8问题,可以考虑通过设置URIEncoding来方便获取URL中的参数。

6.4. 简繁体编码转换
GBK同时包含简体和繁体编码,也 就是说同一个字,由于编码不同,在GBK编码下属于两个字。有时候,为了正确取得完整的结果,应该将繁体和简体进行统一。可以考虑将UTF、GBK中的所 有繁体字,转换为相应的简体字,BIG5编码的数据,也应该转化成相应的简体字。当然,仍旧以UTF编码存储。
例如,对于"语言 語言",用UTF表示为""xE8"xAF"xAD"xE8"xA8"x80 "xE8"xAA"x9E"xE8"xA8"x80",进行简繁体编码转换后应该是两个相同的 ""xE8"xAF"xAD"xE8"xA8"x80>"。
posted @ 2008-05-14 19:09 巴别塔工人 阅读(170) 评论(0)  编辑
2008年4月25日
Web页面开发分为静态网页开发和动态网页开发。动态网页是基于静态网页的,静态网页的软件配置对于动态网页来说,是成必要条件的。

一、静态网页开发的计算机软件配置
(1)浏览器和浏览器插件:
提到Web设计,不得不说浏览器。我们无从得知用户使用什么浏览器以及哪个版本的浏览器,根据各浏览器的市场占有率,我们必须尽可能地满足绝大多数用户的浏览需求。抛开上个世纪的“浏览器大战”不说,从现在开始,我们必须在计算机上安装三个以上的基于不同核心的浏览器:IE浏览器,Firefox浏览器,Safari浏览器。如果实在不想安装那么多的浏览器,退一万步讲,最少我们也得有IE和Firefox。就目前的市场占有率来看,IE6和Firefox2是浏览器市场的主角。不仅仅是因为市场占有率的原因,对于我们开发者来说,这两款浏览器对于开发的插件也是最全面的。好的,就选择它们了。
浏览器插件是必不可少的。IE的浏览器开发插件有IE Developer Tools;Firefox浏览器的开发插件相比之下就更丰富了,Web Developer、Firebug、YSlow,这几乎是任何Web开发人员的必备了。其中Firebug最为强大,今后若是有时间,我会写一个Firebug的专题的。
(2)HTML代码编写软件:
我不得不说,像Dreamweaver(简称DW)之类的“所见即所得”网页设计软件“毒害”了一批人。DW开发网页实在是太方便了,于是就有了一批人不学HTML语言,就成为“Web开发人员”了。这些人做出来的网页,我不做评论,但“Web开发人员”的却因此而饱受批评。我认为DW没有错,好的工具可以提高开发效率,更容易的查错。但是我们必须记住的是,工具只是辅助的,我们还是必须认真的学习HTML,认真的检查DW生成的每一行代码。
在软件的选择上,几乎已经没有选择的余地了。Microsoft Frontpage和Adobe Golive已经被淘汰,NVU几乎不被人所知。Adobe Dreamweaver是最好的选择了,当然并不是唯一的,Microsoft Expression的出现可能会形成一定的竞争力,但是根据“3版本原则”,我们现在还是选择Dreamweaver。就DW的版本来说,最好选择DW8或更高版本,因为这几个版本对CSS的创建有更好的效果。
我们不能忘记“全能冠军”——记事本。据说高手都是用记事本编网页的,我曾冒充过高手,但痛苦不已。我的朋友用“人和动物的区别是人会使用工具”这句话来教育我,从那之后,我就用更高级的工具了。
(3)测试软件:
Fiddler,监测浏览器和服务器之间的数据流的。其实这个应该归于动态网页设计里的,呵呵。关于Fiddler的内容太多了,以后有时间再说吧。

二、动态网页开发的计算机软件配置(以ASP.NET为例)
之所以用ASP.NET为例,是因为我对ASP.NET更熟悉一些。知道的就说,不知道的就不说,呵呵。
ASP.NET运行于Windows平台,需要安装IIS和.NET Framework。我选择的是IIS5.1和.NET Framework 2.0。Visual Studio 2005是目前针对ASP.NET最好的开发环境了,毕竟是微软自己的东西,组件之间结合的很好,并且有很完整的帮助文档。
在安装VS的时候,我有这样的心得:
1、如果硬盘空间允许,尽量将VS及其相关组件安装到系统盘C盘中。若是安装到其它盘,偶尔在更新组件时出现组件关联错误。
2、先安装.NET Framework,再安装IIS,最后安装VS2005,可能会减少很多麻烦。
3、安装完毕后,测试网页时,偶尔会出现ASP.NET的报错,解决方式如下两步:第一步,卸载ASP.NET,使用命令C:"WINDOWS"Microsoft.NET"Framework"v2.0.50727"aspnet_regiis.exe -u;第二步,注册ASP.NET,使用命令C:"WINDOWS"Microsoft.NET"Framework"v2.0.50727"aspnet_regiis.exe -i。注意,这里使用的是.NET Framework v2.0.50727,这个版本号和正式发布版本的.NET Framework 2.0以及VS2005中的.NET Framework 2.0是一致的。
4、根据“VS2008白皮书”所述,VS2008对Firefox的支持才更完善。从实际使用VS2005的情况来看,ASP.NET对Firefox的支持算是一般般吧。不过,ASP.NET宣称是针对所有平台和所有浏览器的,他已经很努力了。

三、其它软件环境
闭门造车,不应该是Web开发人员的作风。保持良好的心情,保持开放的心态,对Web开发是有益的。
(1)即时通讯软件:QQ、MSN。很多有实战经验的Web开发人员,因为在公司里上班,而绝大多数公司禁止使用QQ,那么MSN是我们向他们学习的重要联系方式。
(2)音乐播放软件:iTunes,Winamp。我不想说什么了,没有音乐的世界是多么的痛苦!
(3)……:呵呵,大家一起去发挥吧!
posted @ 2008-04-25 20:30 巴别塔工人 阅读(293) 评论(0)  编辑
2008年4月24日
Mozilla ThunderBird是Mozilla社区推出的邮件客户端。Yahoo邮箱因其优异的性能而广受赞誉,却又因邮件客户端的设置复杂而饱受批评。直入正题,现在说说如何在Thunderbird中设置yahoo.cn邮箱帐户。

第一步:准备一个yahoo.cn邮箱,我以自己的andyyard@yahoo.cn为例说明。
第二步:开通Yahoo的POP功能。Yahoo以邮件订阅作为支持POP的条件,我们打开这样一个网址http://edit.my.yahoo.com/config/set_popfwd?.src=ym&done=http://cn.<andyyard>.mail.com/。你可以根据自己的@yahoo.cn帐户名改变其中的andyyard部分。查看打开的网页内容,选择打开POP服务的复选框,确认。
第三步:设置Thunderbird。
先上一张图,如下

Thunderbird中默认在不同的邮件帐户中使用相同的发送服务器(SMTP),你可以在不同的帐户下更改这个默认设置。Yahoo的Smtp服务器是smtp.mail.yahoo.com,端口号是465,使用安全连接;POP服务器是pop.mail.yahoo.cn,端口号是995,使用安全连接。注意不要选中POP安全设置中的“使用安全认证”复选框,Yahoo的POP服务器并不支持安全认证,只是支持安全连接。用户名一定要写成andyyard@yahoo.cn这样的全称,这样才是Yahoo!ID。
点确定,OK!
posted @ 2008-04-24 13:39 巴别塔工人 阅读(2199) 评论(0)  编辑