`
you_java
  • 浏览: 95495 次
  • 性别: Icon_minigender_1
  • 来自: 广州
社区版块
存档分类
最新评论

jsoup抓取其他网站的页面代码

    博客分类:
  • java
阅读更多

需要的jar包见http://you-java.iteye.com/blog/1457440

 

<%@ page language="java" contentType="text/html; charset=UTF-8"
	pageEncoding="UTF-8"%>
<%@ page import="org.jsoup.Jsoup"%>
<%@ page import="org.jsoup.nodes.Element"%>
<%@ page import="org.jsoup.select.Elements"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
	<head>
		<meta http-equiv="Content-Type"
			content="text/html; charset=UTF-8">
		<title>气象地图</title>
	</head>
	<body>
		<%
			org.jsoup.nodes.Document doc = 
				Jsoup.connect("http://www.weather.com.cn/forecast/").get(); // 根据网址获取Document对象
			Elements els = doc.select(".weatherNetwork"); // 获取class为weatherNetwork的标记 ,返回符合条件的元素集合

			for (int i = 0; i < els.size(); i++) {
				Element el = els.get(i);
				System.out.println(el.html());
		%>
		<pre>
	 		<%=el.html()%>
	 	</pre>
		<%
			}
		%>
	</body>
</html>
分享到:
评论

相关推荐

    安卓listview相关相关-实现浏览新浪新闻jsoup抓取网页信息listview列表下拉刷新.rar

    实现浏览新浪新闻jsoup抓取网页信息 listview列表 下拉刷新.rar,太多无法一一验证是否可用,程序如果跑不起来需要自调,部分代码功能进行参考学习。

    Jsoup 抓取页面的数据实例详解

    Jsoup 抓取页面的数据  需要使用的是jsoup-1.7.3.jar包 如果需要看文档我下载请借一步到官网:http://jsoup.org/   这里贴一下我用到的 Java工程的测试代码  package com.javen.Jsoup; import java.io....

    Android_Jsoup网页爬虫案例

    给出网址可以抓取网页上的代码 可自己根据抓取网页的源码来修改要追踪的标签。 此demo为了熟悉和使用jsoup。

    android使用Jsoup 抓取页面的数据

    在这个网站上你可以找到一些说明,.jar文件的下载,doc文档的说明等等  jsoup的主要功能如下: 从一个URL,文件或字符串中解析HTML; 使用DOM或CSS选择器来查找、取出数据; 可操作HTML元素、属性、文本; ...

    虾米音乐虾米歌单抓取

    使用jsoup抓取一个页面,把需要的内容处理下来,复杂的写完后不写注释自己都看不懂。最近我试了一下用 JSOUP 抓取虾米音乐网站的虾米歌单中的歌曲歌词,把抓取的内容存储到mysql数据库中。用过都知道JSOUP 是支持css...

    leetcode答案-fetch-leetcode-submission:抓取LeetCodeOJ个人提交的代码

    抓取、解析网页 使用说明 进入release文件夹 修改init.properties 中的配置 #登录账号 username=your_username #登录密码 password=your_password #登录类型,值暂时只能为leetcode或github logintype=leetcode #...

    使用java-jsoup解析html页面内容,爬取想要的信息(如号段)

    jsoup 是一款 Java 的 HTML 解析器,可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API,可通过 DOM,CSS...附件提供了详细的介绍,并通过http get请求方式抓取页面内容的java代码以及jsoup jar包。

    Jsoup+httpclient 模拟登陆和抓取

    Jsoup+httpclient 模拟登陆和抓取页面 package com.app.html; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io.FileReader...

    超级课程表 课程格子 教务系统抓取 SQLite Android Studio HttpWatch Jsoup解析网页.zip

    对于有一定基础或热衷于研究的人来说,可以在这些基础代码上进行修改和扩展,实现其他功能。 【沟通交流】: 有任何使用上的问题,欢迎随时与博主沟通,博主会及时解答。 鼓励下载和使用,并欢迎大家互相学习,共同...

    Android开发之利用jsoup解析HTML页面的方法

    由于在android开发过程中,不可避免的涉及到web页面的抓取,解析,展示等等,所以,在这里我主要展示下利用jsoup jar包来抓取cnbeta.com网站的话题分类的实例。 下面是主要的代码,由于使用及其简单,我这里就不再多...

    手把手教学Android用jsoup解析html实例

    很多时候,我们需要从各种网页上面抓取数据,而jsoup 是一款Java 的HTML解析器,可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API,可通过DOM,CSS以及类似于jQuery的操作方法来取出和操作数据。 ...

    软件工程相关资源

    这里我使用的是一个能方便处理html文本的java库Jsoup,对于它的具体用法可以参考我之前的文章《Android利用Jsoup抓取数据,再也不怕写App没有数据啦》,这里就不再赘述了。 作者:EoniJJ 链接:...

    高级爬虫进阶:HtmlUnit+多线线程+消息队列快速抓取大量信息数据

    高效的java爬虫,内附代码 sql数据表 ,main方法启动。...避免了jsoup无法抓取js代码生成的数据内容的弊端。避免了client无法一次性获取大量信息的弊端。有能获取静态页面形成之前的对方数据内容的高手 欢迎借阅指导

    jsoupScraping:使用 jsoup html 解析器从 Espncricinfo 抓取玩家数据

    jsoupScraping 使用 jsoup html 解析器从 Espncricinfo 抓取玩家数据 用于抓取数据并将其存储为 json 格式的 Java 代码。... ScrapePlayer - 函数将播放器 url 作为输入并从网页中抓取数据。 (访问 html 元素)

    猪猪RSS新闻抓取

    猪猪RSS新闻抓取源码新闻用的是Jsoup抓取自新浪RSS新闻源,天气信息用SAX解析器解析的一个网络XML天气源(2.3.3系统测试不可用,没有使用更高版本测试),新闻主页面可以实现类似于广告图片轮播的效果,新闻列表也可以...

    android阅读类的APP“指读”源码.rar

    这里的服务端数据指的是数据源,也许你会说可以用jsoup去抓取网页数据啊,确实,jsoup是个不错的工具,但是考虑到数据源的可控性上就不如指读的数据源来的靠谱了。只要你会简单的git命令,那么你完全可以让数据...

    Java爬虫:实现信息抓取的完整实例源码

    Java爬虫是一种基于Java编程语言的网络爬虫技术,它能够自动抓取互联网上的信息。通过编写Java爬虫,我们可以从网页中提取有用的数据,如文本、图片、链接等,并将其存储或用于进一步的处理。Java爬虫的实现通常涉及...

    getGank:抓取gank.io网页

    getGank.io抓取网页使用Jsoup抓取,但是使用的不多,后续需改进程序代码有点混乱,没有处理和使用好Java的函数和类关系,有待学习和掌握程序思路:爬取了网站所有页面,存储在content.txt文件,同时存储各个页面...

    最简单的爬虫-WebMagic 0.73 源码

    作为爬虫框架,它使用httpclient作为获取网页工具、使用Jsoup作为分析页面定位抓取内容、使用ExecutorService线程池作为定时增量抓取、Jdiy作为持久层框架。不熟悉这些名词的同学们可以先行百度一下这些都是什么,起...

    Java毕业设计-[搜索链接]Java网络爬虫(蜘蛛)源码_zhizhu.rar

    2. **网页抓取**:通过HTTP/HTTPS协议获取网页源代码,支持自定义User-Agent、代理IP等设置。 3. **数据解析**:利用正则表达式或HTML解析库(如Jsoup)从网页中提取所需数据。 4. **存储处理**:支持将抓取到的数据...

Global site tag (gtag.js) - Google Analytics