构造.NET环境下的网页下载器 (1)

发表于:2007-06-30来源:作者:点击数: 标签:
一.前言: 微软的.Net框架为我们进行 网络 编程提供了以下两个名字空间:System.Net以及System.Net.Sockets。通过合理运用其中的类和方法,我们可以很容易地编写出各种网络应用程序。这种网络应用程序既可以是基于流套接字的,也可以是基于数据报套接字的。
一.前言:

  微软的.Net框架为我们进行网络编程提供了以下两个名字空间:System.Net以及System.Net.Sockets。通过合理运用其中的类和方法,我们可以很容易地编写出各种网络应用程序。这种网络应用程序既可以是基于流套接字的,也可以是基于数据报套接字的。而基于流套接字的通讯中采用最广泛的协议就是TCP协议,基于数据报套接字的通讯中采用最广泛的自然就是UDP协议了。下面我将重点向大家介绍.NET网络编程中的一些类:Dns类、IPHostEntry类、IPEndPoint类以及Socket类,并会在最后给出一个网页下载器的实例以加深读者对.NET网络编程的理解。

  二.网络编程类介绍:

  Dns 类:

  向使用 TCP/IP Internet 服务的应用程序提供域名服务。其Resolve()方法查询DNS服务器以将用户友好的域名(如"www.google.com")映射到数字形式的 Internet 地址(如 192.168.1.1)。Resolve()方法返回一个IPHostEnty实例,该实例包含所请求名称的地址和别名的列表。大多数情况下,可以使用 AddressList 数组中返回的第一个地址。

  Resolve()方法的函数原型如下:

public static IPHostEntry Resolve(string hostName);



  下面的代码获取一个 IPAddress 实例,该实例包含服务器 www.google.com 的IP地址:

IPHostEntry ipHostInfo = Dns.Resolve("www.google.com");
IPAddress ipAddress = ipHostInfo.AddressList[0];



  不过在Dns类中,除了通过Resolve()方法,你还可以通过GetHostByAddress()方法以及GetHostByName()方法来得到相应的IPHostEntry实例,函数原型如下:

public static IPHostEntry GetHostByAddress(string IPAddress);
public static IPHostEntry GetHostByName(string hostName);



  下面的代码显示了如何分别运用以上两种方法获得包含服务器www.google.com的相关信息的IPHostEntry实例:

IPHostEntry hostInfo=Dns.GetHostByAddress("192.168.1.1");
IPHostEntry hostInfo=Dns.GetHostByName("www.google.com");



  在使用以上方法时,你将可能需要处理以下几种异常:

SocketException异常:访问Socket时操作系统发生错误引发

ArgumentNullException异常:参数为空引用引发

ObjectDisposedException异常:Socket已经关闭引发

以上,我向大家简要地介绍了Dns类中一些方法以及其用法,并列举出了可能出现的异常,下面就让我们转到和Dns类密切相关的IPHostEntry类。

  IPHostEntry类:

  该类的实例对象中包含了Internet主机的地址相关信息。此类型的所有公共静态成员对多线程操作而言都是安全的,但不保证任何实例成员是线程安全的。其中主要的一些属性有:AddressList属性、Aliases属性以及HostName属性。

  AddressList属性和Aliases属性的作用分别是获取或设置与主机关联的IP地址列表以及获取或设置与主机关联的别名列表。其中AddressList属性值是一个IPAddress类型的数组,包含解析为Aliases属性中包含的主机名的IP地址;Aliases属性值是一组字符串,包含解析为AddressList 属性中的IP地址的DNS名。而HostName属性比较好理解,它包含了服务器的主要主机名,这光从名称上就可以知道了。如果服务器的DNS项定义了附加别名,则可在Aliases属性中使用这些别名。

  下面的代码列出了服务器www.google.com的相关别名列表以及IP地址列表的长度并将所有的IP地址列出:

IPHostEntry IPHost = Dns.Resolve("www.google.com/");
string[] aliases = IPHost.Aliases;
Console.WriteLine(aliases.Length);

IPAddress[] addr = IPHost.AddressList;
Console.WriteLine(addr.Length);
for(int i= 0; i < addr.Length ; i++)
{
Console.WriteLine(addr[i]);
}



介绍完IPHostEntry类,我们能获得了所要连接的主机的相关IP地址以及别名列表,但是真正要和主机取得连接还需要一个很重要的类-IPEndPoint类。



  IPEndPoint类:

  在Internet中,TCP/IP使用一个网络地址和一个服务端口号来唯一标识设备。网络地址标识网络上的特定设备;端口号标识要连接到的该设备上的特定服务。网络地址和服务端口的组合称为终结点,在.NET框架中正是由EndPoint类表示这个终结点,它提供表示网络资源或服务的抽象,用以标志网络地址等信息。.Net同时也为每个受支持的地址族定义了 EndPoint的子代;对于IP地址族,该类为IPEndPoint。IPEndPoint类包含应用程序连接到主机上的服务所需的主机和端口信息,通过组合服务的主机IP地址和端口号,IPEndPoint类形成到服务的连接点。

  在IPEndPoint类中有两个很有用的构造函数:

public IPEndPoint(long, int);
public IPEndPoint(IPAddress, int);



  它们的作用就是用指定的地址和端口号初始化 IPEndPoint 类的新实例。该类中的属性有:Address属性、AddressFamily属性以及Port属性,这些属性相对比较容易理解,这里就不作多介绍。下面的代码显示了如何取得服务器www.google.com的终结点:

IPHostEntry IPHost = Dns.Resolve("www.google.com");
IPAddress[] addr = IPHost.AddressList;
IPEndPoint ep = new IPEndPoint(addr[0],80);



  这样,我们已经了解了和主机取得连接的一些必要的基本类,有了这些知识,我们就可以运用下面的Socket类真正地和主机取得连接并进行通讯了。

  Socket类:

  Socket类是包含在System.Net.Sockets名字空间中的一个非常重要的类。一个Socket实例包含了一个本地以及一个远程的终结点,就像上面介绍的那样,该终结点包含了该Socket实例的一些相关信息。

  需要知道的是Socket 类支持两种基本模式:同步和异步。其区别在于:在同步模式中,对执行网络操作的函数(如Send和Receive)的调用一直等到操作完成后才将控制返回给调用程序。在异步模式中,这些调用立即返回。

  下面我们重点讨论同步模式的Socket编程。首先,同步模式的Socket编程的基本过程如下:

1.创建一个Socket实例对象。

2.将上述实例对象连接到一个具体的终结点(EndPoint)。

3.连接完毕,就可以和服务器进行通讯:接收并发送信息。

4.通讯完毕,用ShutDown()方法来禁用Socket。

5.最后用Close()方法来关闭Socket。

知道了以上基本过程,我们就开始进一步实现连接并通讯了。在使用之前,你需要首先创建Socket对象的实例,这可以通过Socket类的构造方法来实现:

public Socket(AddressFamily addressFamily,SocketType
socketType,ProtocolType protocolType);



其中,addressFamily 参数指定Socket使用的寻址方案,比如AddressFamily.InterNetwork表明为IP版本4的地址;socketType参数指定Socket的类型,比如SocketType.Stream表明连接是基于流套接字的,而SocketType.Dgram表示连接是基于数据报套接字的。protocolType参数指定Socket使用的协议,比如ProtocolType.Tcp表明连接协议是运用TCP协议的,而Protocol.Udp则表明连接协议是运用UDP协议的。

在创建了Socket实例后,我们就可以通过一个远程主机的终结点和它取得连接,运用的方法就是Connect()方法:

public Connect (EndPoint ep);



该方法只可以被运用在客户端。进行连接后,我们可以运用套接字的Connected属性来验证连接是否成功。如果返回的值为true,则表示连接成功,否则就是失败。下面的代码就显示了如何创建Socket实例并通过终结点与之取得连接的过程:

IPHostEntry IPHost = Dns.Resolve("http://www.google.com/");
string []aliases = IPHost.Aliases;
IPAddress[] addr = IPHost.AddressList;
EndPoint ep = new IPEndPoint(addr[0],80);

Socket sock = newSocket(AddressFamily.InterNetwork,
SocketType.Stream,ProtocolType.Tcp);
sock.Connect(ep);
if(sock.Connected)
Console.WriteLine("OK");



一旦连接成功,我们就可以运用Send()和Receive()方法来进行通讯。

Send()方法的函数原型如下:

public int Send (byte[] buffer, int size, SocketFlags flags);



其中,参数buffer包含了要发送的数据,参数size表示要发送数据的大小,而参数flags则可以是以下一些值:SocketFlags.None、SocketFlags.DontRoute、SocketFlags.OutOfBnd。

该方法返回的是一个System.Int32类型的值,它表明了已发送数据的大小。同时,该方法还有以下几种已被重载了的函数实现:

public int Send (byte[] buffer);
public int Send (byte[] buffer, SocketFlags flags);
public int Send (byte[] buffer,int offset, int size,
SocketFlags flags);



介绍完Send()方法,下面是Receive()方法,其函数原型如下:

public int Receive(byte[] buffer, int size, SocketFlags flags);



其中的参数和Send()方法的参数类似,在这里就不再赘述。

同样,该方法还有以下一些已被重载了的函数实现:

public int Receive (byte[] buffer);
public int Receive (byte[] buffer, SocketFlags flags);
public int Receive (byte[] buffer,int offset, int size,
SocketFlags flags);



在通讯完成后,我们就通过ShutDown()方法来禁用Socket,函数原型如下:

public void ShutDown(SocketShutdown how);



其中的参数how表明了禁用的类型,SoketShutdown.Send表明关闭用于发送的套接字;SoketShutdown.Receive表明关闭用于接收的套接字;而SoketShutdown.Both则表明发送和接收的套接字同时被关闭。

应该注意的是在调用Close()方法以前必须调用ShutDown()方法以确保在Socket关闭之前已发送或接收所有挂起的数据。一旦ShutDown()调用完毕,就调用Close()方法来关闭Socket,其函数原型如下:

public void Close();



该方法强制关闭一个Socket连接并释放所有托管资源和非托管资源。该方法在内部其实是调用了方法Dispose(),该函数是受保护类型的,其函数原型如下:

protected virtual void Dispose(bool disposing);



其中,参数disposing为true或是false,如果为true,则同时释放托管资源和非托管资源;如果为false,则仅释放非托管资源。因为Close()方法调用Dispose()方法时的参数是true,所以它释放了所有托管资源和非托管资源。

这样,一个Socket从创建到连接到通讯最后的关闭的过程就完成了。虽然整个过程比较复杂,但相对以前在SDK或是其他环境下进行Socket编程,这个过程就显得相当轻松了。

原文转自:http://www.ltesting.net