集美大学 计算机 郑如滨

教学博客

  博客园 :: 首页 :: 博问 :: 闪存 :: 新随笔 :: 联系 :: 订阅 订阅 :: 管理 ::

参考资料

本次实验参考文件
正则表达式参考资料
漫画:HTTP 协议极简教程,傻瓜都能看懂!

注:主要根据"本次实验参考文件"中实验任务书的指导完成本次实验。

1. 网络基础

  1. 使用ipconfig、ping查看网络状况。
  2. 使用ConnectionWatcher资源监视器查看本机连接情况。
  3. 可选:使用curl访问HTTP服务器。
  4. 使用telnet或网络调试助手作为客户端连接远程主机
    • 连接BBS、连接网络调试助手创建的服务器,连接Web服务器。
    • 电脑如未安装telnet,可以在控制面板-程序-添加/删除Windows功能中选择Telnet客户端进行安装。

2. 编写TCP客户端程序

任务

  1. 编写一个简单的TCP客户端TCPClient.java(参考TCPClientTest.java)
    注:TCPClient中远程服务器IP不要填入127.0.0.1或localhost,否则可能会出现Connection Refused!
  2. 使用网络调试助手建立一个TCP Server。然后运行TCPClient.java连接该TCP Server
    注意:服务器向客户端发送信息时,因为客户端使用hasNextLine()方法,所以服务器端发送的消息需带回车换行,客户端才能将消息读出。
    在网络调试助手中使用Shift+Enter加回车换行。
  3. 使用ConnectionWatcher或者资源监视器查看本机所占用的端口。

思考

  1. 这个实验里,客户端与服务器端分别是谁?他们之间使用什么传输层协议进行通信?
  2. 客户端使用nextLine()读取服务器端发来的信息,可能会碰到什么问题?怎么解决?
  3. 启动ConnectionWatcher或者资源监视器,查看客户端与服务器端对应的进程名是什么?分别使用了哪两个端口进行通信?怎么证明是这两个进程在进行通信?
  4. 先用网络调试助手连接服务器。然后使用telnet连接这个服务器,能否连接成功?为什么?使用ConnectionWatcher查看telnet与服务器的连接。

注意事项:

  • 客户端发送给服务器端(输出流,PrintWriter缓冲区与autoflush)
  • 常见错误:网络调试助手显示bind() failed表示相应端口已经被其他程序占用,请结束其他程序。

3.ServerSocket与TCP服务器(考核)

任务:

  1. 编写单线程MenuServer服务器(参考TCPEchoServer.java)
    • 验证:在另外一台电脑上启动网络调试助手,连接你编写的服务器端。注意:IP地址能设定为127.0.0.1吗?
    • 验证:两个同学,用一台电脑上的TCPClient连接另外一台电脑上的MenuServer。只需接收到服务器端的信息即可。
    • 常见错误:Eclipse中显示Address already in use ,端口已经被占用,先关闭占用该端口的程序。
  2. 考核:编写多线程ThreadMenuServer服务器(参考TCPMultiThreadEchoServer.java与ThreadEchoTask.java)
    在单线程MenuServer程序中,服务器端只能允许一个客户端连接,如何允许服务器同时连接多个客户端?
  3. 进阶考核:建立基于TCP的可与服务器进行交互的TCPClient
    • 通过网络调试助手可以实现向服务器发送消息,同时从服务器接受消息。如何改造TCPClient.java实现同时收发消息的功能,即编写一个类似telnet的程序或者说编写一个网络调试助手的TCP Client。提示:使用多线程。
    • 进一步:将TCPClient.java改造成带图形界面的程序。

考核1:单线程服务器
完成实验任务书中的MenuServer,服务器可对连接进来的客户端发送字符菜单。
可根据客户端发送过来的字符串,执行相应的功能并将结果返回给客户端。
菜单中包含如下选项:1.显示服务器当前时间2.显示客户端的IP与端口3.退出菜单。功能2请查询Socket文档。

思考

  1. 如果碰到中文乱码?怎么解决?
  2. 当客户端选择退出菜单,服务器也终止运行从而无法被其他客户端访问。如何改进?

考核2:多线程服务器
将MenuServer改造成多线程服务器ThreadMenuServer。并能解释清楚,为什么改造后的服务器程序可以接收多个客户端连接。
请详细解释修改后的代码。

特别考核3
改写题目2的TCPClient.java,连接MenuServer。观察返回结果?
思考:如何让TCPClient.java既可向MenuServer发送命令,同时还能接收MenuServer的信息。提示:使用多线程。

参考资料:

EchoServer.java,ThreadedEchoServer.java (多线程服务器)

进阶思考:
前面实验中,服务器与客户端之间传递的都是字符。如果希望服务器与客户端之间传递字节,比如传递一个对象或一个字节数组。要怎么实现?如果要实现从服务器端搜索文件并下载,怎么编写客户端与服务器端(特别加分)。

4. 访问HTTP服务器

使用Socket类访问Web服务器

  • 目的:编写可以读写Web网页的程序。
  • 改造TCPClient.java,让其可以访问Web服务器上页面。

编写该程序时,需要了解简单的HTTP协议。即,如何使用符合HTTP协议的命令向Web服务器请求一个网页。
可使用Firefox的开发者工具,可查看使用HTTP访问Web服务器的请求头(request header)。具体步骤如下:
1.打开Firefox按F12,启动开发者工具,点击“网络”标签。然后输入网址访问。或者使用curl工具完成。
2.在"网络"标签点击"HTML",找到相应条目。右键点击该条目,选择“复制”-“复制请求头”。

请求头中的关键信息如下:

GET / HTTP/1.1
Host: cec.jmu.edu.cn

改造TCPClient.java,使用请求头中的关键信息实现对指定网址的访问。
注意:除了上面两行字符串。还应输出一个空行(使用out.println()实现。)

3.网页中的中文是乱码,如何解决?提示:使用InputStreamReader。
4.进一步改造TCPClient.java,将网页下载存为文件。

使用URL类访问Web服务器

HTTP进阶:

  • 使用JDK 11中的HTTP Client来改写URLReader.java
  • 编写客户端访问jwc.jmu.edu.cn网站,尝试用客户端程序能直接使用网页上的搜索功能。
  • 使用jsoup实现简单网络爬虫

5. UDP服务器(考核)

使用UDP改造前面的MenuServer与对应的MenuClient

6. 综合实验:使用正则表达式进行网页信息爬取

想要编写一个程序,可以将指定网址的所有普通链接

<a href="....." >

与图片链接

<img src=".....">)

都抓取下来。完成此程序需要进行复杂的字符串匹配,需要使用正则表达式。

正则表达式练习:

  1. 如何使用正则表达式判断一个给定的字符串是否是10进制数字格式?尝试编程进行验证。
  2. 修改HrefMatch.java
    • 尝试匹配网页中的数字字符串
    • 尝试匹配网页中的图片字符串

注意:

  • 图片字符串的格式类似img src="style/suizi/more.gif",还要注意特例。如img border= "0" src=....
  • 可使用java HrefMatch http://cec.jmu.edu.com 来进行测试。

参考资料:

HrefMatch.java
常用正则表达式.txt
Java正则表达式的语法与示例

特别考核(较难):进一步改造上面的程序,获得图片的链接,如IMG src=“images/mail1.gif”,然后经过处理,生成该图片的实际链接地址http://cec.jmu.edu.com/images/mail1.gif最后将生成的若干地址,放入一个队列。编写方法,可以依照该队列的所有图片地址,一次将图片下载下来。

其他参考文件

网络调试助手4.2

下次实验

Java第11次实验(数据库)

posted on 2017-05-16 23:03  zhrb  阅读(1337)  评论(0编辑  收藏  举报