jsoup抓取其他网站的页面代码 - you_java - ITeye博客

`

you_java

浏览: 95495 次
性别:
来自: 广州

最近访客更多访客>>

geeksun

LinSiraaa

wssc198765

Joeygirl

博主相关

博客

微博

相册

收藏

留言

关于我

文章分类

社区版块

存档分类

最新评论

dragoo1：学习了
Oracle 获取本周、本月、本季、本年的第一天和最后一天
wilsonchen：楼主，谢谢分享。请教一个问题，如何做到既分页又排序呢？
java mail(接收邮件)

jsoup抓取其他网站的页面代码

博客分类：

java

阅读更多

需要的jar包见http://you-java.iteye.com/blog/1457440

<%@ page language="java" contentType="text/html; charset=UTF-8"
	pageEncoding="UTF-8"%>
<%@ page import="org.jsoup.Jsoup"%>
<%@ page import="org.jsoup.nodes.Element"%>
<%@ page import="org.jsoup.select.Elements"%>
<!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
<html>
	<head>
		<meta http-equiv="Content-Type"
			content="text/html; charset=UTF-8">
		<title>气象地图</title>
	</head>
	<body>
		<%
			org.jsoup.nodes.Document doc = 
				Jsoup.connect("http://www.weather.com.cn/forecast/").get(); // 根据网址获取Document对象
			Elements els = doc.select(".weatherNetwork"); // 获取class为weatherNetwork的标记 ，返回符合条件的元素集合

			for (int i = 0; i < els.size(); i++) {
				Element el = els.get(i);
				System.out.println(el.html());
		%>
		<pre>
	 		<%=el.html()%>
	 	</pre>
		<%
			}
		%>
	</body>
</html>

分享到：

jsoup httpclient 爬取网页并下载google图 ... | HttpClient根据jsoup解析网页

2012-03-19 15:29
浏览 1678
评论(0)
分类:编程语言
查看更多

评论

发表评论

您还没有登录,请您登录后再发表评论

相关推荐

安卓listview相关相关-实现浏览新浪新闻jsoup抓取网页信息listview列表下拉刷新.rar: 实现浏览新浪新闻jsoup抓取网页信息 listview列表下拉刷新.rar,太多无法一一验证是否可用，程序如果跑不起来需要自调，部分代码功能进行参考学习。

Jsoup 抓取页面的数据实例详解: Jsoup 抓取页面的数据　需要使用的是jsoup-1.7.3.jar包如果需要看文档我下载请借一步到官网：http://jsoup.org/　　这里贴一下我用到的 Java工程的测试代码　 package com.javen.Jsoup; import java.io....

Android_Jsoup网页爬虫案例: 给出网址可以抓取网页上的代码可自己根据抓取网页的源码来修改要追踪的标签。此demo为了熟悉和使用jsoup。

android使用Jsoup 抓取页面的数据: 在这个网站上你可以找到一些说明，.jar文件的下载，doc文档的说明等等　 jsoup的主要功能如下：从一个URL，文件或字符串中解析HTML；使用DOM或CSS选择器来查找、取出数据；可操作HTML元素、属性、文本； ...

虾米音乐虾米歌单抓取: 使用jsoup抓取一个页面，把需要的内容处理下来，复杂的写完后不写注释自己都看不懂。最近我试了一下用 JSOUP 抓取虾米音乐网站的虾米歌单中的歌曲歌词，把抓取的内容存储到mysql数据库中。用过都知道JSOUP 是支持css...

leetcode答案-fetch-leetcode-submission:抓取LeetCodeOJ个人提交的代码: 抓取、解析网页使用说明进入release文件夹修改init.properties 中的配置 #登录账号 username=your_username #登录密码 password=your_password #登录类型，值暂时只能为leetcode或github logintype=leetcode #...

使用java-jsoup解析html页面内容，爬取想要的信息（如号段）: jsoup 是一款 Java 的 HTML 解析器，可直接解析某个 URL 地址、HTML 文本内容。它提供了一套非常省力的 API，可通过 DOM，CSS...附件提供了详细的介绍，并通过http get请求方式抓取页面内容的java代码以及jsoup jar包。

Jsoup+httpclient 模拟登陆和抓取: Jsoup+httpclient 模拟登陆和抓取页面 package com.app.html; import java.io.BufferedReader; import java.io.BufferedWriter; import java.io.File; import java.io.FileOutputStream; import java.io.FileReader...

超级课程表课程格子教务系统抓取 SQLite Android Studio HttpWatch Jsoup解析网页.zip: 对于有一定基础或热衷于研究的人来说，可以在这些基础代码上进行修改和扩展，实现其他功能。【沟通交流】：有任何使用上的问题，欢迎随时与博主沟通，博主会及时解答。鼓励下载和使用，并欢迎大家互相学习，共同...

Android开发之利用jsoup解析HTML页面的方法: 由于在android开发过程中，不可避免的涉及到web页面的抓取，解析，展示等等，所以，在这里我主要展示下利用jsoup jar包来抓取cnbeta.com网站的话题分类的实例。下面是主要的代码，由于使用及其简单，我这里就不再多...

手把手教学Android用jsoup解析html实例: 很多时候，我们需要从各种网页上面抓取数据，而jsoup 是一款Java 的HTML解析器，可直接解析某个URL地址、HTML文本内容。它提供了一套非常省力的API，可通过DOM，CSS以及类似于jQuery的操作方法来取出和操作数据。 ...

软件工程相关资源: 这里我使用的是一个能方便处理html文本的java库Jsoup，对于它的具体用法可以参考我之前的文章《Android利用Jsoup抓取数据，再也不怕写App没有数据啦》，这里就不再赘述了。作者：EoniJJ 链接：...

高级爬虫进阶：HtmlUnit+多线线程+消息队列快速抓取大量信息数据: 高效的java爬虫,内附代码 sql数据表，main方法启动。...避免了jsoup无法抓取js代码生成的数据内容的弊端。避免了client无法一次性获取大量信息的弊端。有能获取静态页面形成之前的对方数据内容的高手欢迎借阅指导

jsoupScraping:使用 jsoup html 解析器从 Espncricinfo 抓取玩家数据: jsoupScraping 使用 jsoup html 解析器从 Espncricinfo 抓取玩家数据用于抓取数据并将其存储为 json 格式的 Java 代码。... ScrapePlayer - 函数将播放器 url 作为输入并从网页中抓取数据。（访问 html 元素）

猪猪RSS新闻抓取: 猪猪RSS新闻抓取源码新闻用的是Jsoup抓取自新浪RSS新闻源，天气信息用SAX解析器解析的一个网络XML天气源(2.3.3系统测试不可用，没有使用更高版本测试)，新闻主页面可以实现类似于广告图片轮播的效果，新闻列表也可以...

android阅读类的APP“指读”源码.rar: 这里的服务端数据指的是数据源，也许你会说可以用jsoup去抓取网页数据啊，确实，jsoup是个不错的工具，但是考虑到数据源的可控性上就不如指读的数据源来的靠谱了。只要你会简单的git命令，那么你完全可以让数据...

Java爬虫：实现信息抓取的完整实例源码: Java爬虫是一种基于Java编程语言的网络爬虫技术，它能够自动抓取互联网上的信息。通过编写Java爬虫，我们可以从网页中提取有用的数据，如文本、图片、链接等，并将其存储或用于进一步的处理。Java爬虫的实现通常涉及...

getGank:抓取gank.io网页: getGank.io抓取网页使用Jsoup抓取，但是使用的不多，后续需改进程序代码有点混乱，没有处理和使用好Java的函数和类关系，有待学习和掌握程序思路：爬取了网站所有页面，存储在content.txt文件，同时存储各个页面...

最简单的爬虫-WebMagic 0.73 源码: 作为爬虫框架，它使用httpclient作为获取网页工具、使用Jsoup作为分析页面定位抓取内容、使用ExecutorService线程池作为定时增量抓取、Jdiy作为持久层框架。不熟悉这些名词的同学们可以先行百度一下这些都是什么，起...

Java毕业设计-[搜索链接]Java网络爬虫(蜘蛛)源码_zhizhu.rar: 2. **网页抓取**：通过HTTP/HTTPS协议获取网页源代码，支持自定义User-Agent、代理IP等设置。 3. **数据解析**：利用正则表达式或HTML解析库（如Jsoup）从网页中提取所需数据。 4. **存储处理**：支持将抓取到的数据...

Global site tag (gtag.js) - Google Analytics