JAVA/JSP学习系列之十一简单的“抓网页”代码_Java

刘慈欣谈ChatGPT：人类的无能反而

OpenAI 因使用“窃取”的个人数据

搜狐回应员工遭遇工资补助诈骗：

软件测试 > 测试开发技术 > 软件测试开发语言 > Java >

JAVA/JSP学习系列之十一简单的“抓网页”代码

发表于：2007-06-22来源：作者：点击数：标签：

一、前言从一个网站上，看到一个“抓网页”的代码，觉得有点意思，但是没有提供源代码，于是，自己想写一个，其实代码比较简单的。二、代码 %@ page contentType="text/html;charset=gb2312"%> % String sCurrentLine; String sTotalString; sCurrentLine=

　　
　　一、前言
　　从一个网站上，看到一个“抓网页”的代码，觉得有点意思，但是没有提供源代码，于是，自己想写一个，其实代码比较简单的。
　　
　　二、代码
　　<%@ page contentType="text/html;charset=gb2312"%>
　　

　　<%
　　
　　String sCurrentLine;
　　
　　String sTotalString;
　　
　　sCurrentLine="";
　　
　　sTotalString="";
　　
　　java.io.InputStream l_urlStream;
　　
　　java.net.URL l_url = new java.net.URL("http://www.163.net/");
　　
　　java.net.HttpURLConnection l_connection = (java.net.HttpURLConnection) l_url.openConnection();
　　
　　l_connection.connect();
　　
　　l_urlStream = l_connection.getInputStream();
　　
　　java.io.BufferedReader l_reader = new java.io.BufferedReader(new java.io.InputStreamReader(l_urlStream));
　　
　　while ((sCurrentLine = l_reader.readLine()) != null)
　　
　　{
　　
　　sTotalString+=sCurrentLine;
　　
　　}
　　
　　out.println(sTotalString);
　　
　　%>
　　
　　三、后记
　　虽然代码比较简单，但是，我认为根据这个，可以实现“网络爬虫”的功能，比如从页面找href连接，然后再得到那个连接，然后再“抓”，不停止地（当然可以限定层数），这样，可以实现“网页搜索”功能。

原文转自：http://www.ltesting.net

软件测试 > 测试开发技术 > 软件测试开发语言 > Java >

JAVA/JSP学习系列之十一简单的“抓网页”代码

相关文章

让Java的反射更得简单

如何写出更好的Java代码

用来理解 Java 编程语言的 8 个图表

maven环境快速搭建

配置JDK环境

Java简单游戏开发之碰撞检测

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

全网最详细的接口测试实战

先测试再开发？TDD测试驱动

自动化测试架构

软件测试架构师的知识能力

大数据平台测试方法

用不同的测试模型来构建测

当软件测试遇上ChatGPT：软件

MBT基于模型的测试介绍资料

iso29119相关介绍性资料

HP QTP 10 中文版官方中文补丁

HP QTP 10 英文版下载地址

HP ALM 11 官方中文版下载地址

Quality Center 9.0中文版下载地

HttpWatch Basic Edition Version 7.

WIN2003+ORACLE11G+QC11(ALM11) 安装

WIN2003+SQL2005(SP3)+QC11(ALM11) 安

软件测试沙龙 More>>

新浪微博 More>>

热门标签

《测试团队的招聘与管理

《我们应该如何构建我们

软件测试 > 测试开发技术 > 软件测试开发语言 > Java >

JAVA/JSP学习系列之十一简单的“抓网页”代码