由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 请教个python抓网页的问题
相关主题
从网页周期性抓取信息然后自动发邮件,应该怎么做?求entry/junior level 软工,python/CPP (转载)
问个HTML DOM JavaScript相关的问题啥脚本可以进行网页操作?
求教Python的一个问题Python日报 一周回顾 2015-01-24
问个Python问题Google test engineer求内推 (转载)
请教一个初级问题2007年9月编程语言指数
如何用Python或者Perl抓取文本?问一下Python的情况
python login网站问个web page manipulation的问题
用python测webpage小孩子学哪种编程语言比较好?
相关话题的讨论汇总
话题: mechanize话题: 网页话题: python话题: 网站
进入Programming版参与讨论
1 (共1页)
n********s
发帖数: 196
1
真诚请教各位:
我对编程语言不熟,python了解点皮毛,能编简单的程式
我想从一个动态网站抓取数据
我输入一个input,然后把网站返回的结果存下来
输入input的过程中可能会有新窗口跳出来
网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
请问用哪个module比较容易实现?
谢谢!
D*****r
发帖数: 6791
2
javascript少的话可以试试mechanize?

【在 n********s 的大作中提到】
: 真诚请教各位:
: 我对编程语言不熟,python了解点皮毛,能编简单的程式
: 我想从一个动态网站抓取数据
: 我输入一个input,然后把网站返回的结果存下来
: 输入input的过程中可能会有新窗口跳出来
: 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
: 请问用哪个module比较容易实现?
: 谢谢!

n********s
发帖数: 196
3
谢谢!
正在研究mechanize
有没有什么网站可以看sample code?
直接看documentation有点摸不着头脑

【在 D*****r 的大作中提到】
: javascript少的话可以试试mechanize?
h*******s
发帖数: 8454
4
要是动态的可以试试selenium

【在 n********s 的大作中提到】
: 谢谢!
: 正在研究mechanize
: 有没有什么网站可以看sample code?
: 直接看documentation有点摸不着头脑

n********s
发帖数: 196
5
这个看起来不错
值得学习
谢谢!

【在 h*******s 的大作中提到】
: 要是动态的可以试试selenium
n********s
发帖数: 196
6
真诚请教各位:
我对编程语言不熟,python了解点皮毛,能编简单的程式
我想从一个动态网站抓取数据
我输入一个input,然后把网站返回的结果存下来
输入input的过程中可能会有新窗口跳出来
网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
请问用哪个module比较容易实现?
谢谢!
D*****r
发帖数: 6791
7
javascript少的话可以试试mechanize?

【在 n********s 的大作中提到】
: 真诚请教各位:
: 我对编程语言不熟,python了解点皮毛,能编简单的程式
: 我想从一个动态网站抓取数据
: 我输入一个input,然后把网站返回的结果存下来
: 输入input的过程中可能会有新窗口跳出来
: 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
: 请问用哪个module比较容易实现?
: 谢谢!

n********s
发帖数: 196
8
谢谢!
正在研究mechanize
有没有什么网站可以看sample code?
直接看documentation有点摸不着头脑

【在 D*****r 的大作中提到】
: javascript少的话可以试试mechanize?
h*******s
发帖数: 8454
9
要是动态的可以试试selenium

【在 n********s 的大作中提到】
: 谢谢!
: 正在研究mechanize
: 有没有什么网站可以看sample code?
: 直接看documentation有点摸不着头脑

n********s
发帖数: 196
10
这个看起来不错
值得学习
谢谢!

【在 h*******s 的大作中提到】
: 要是动态的可以试试selenium
w*********u
发帖数: 392
11
这都很容易,看你抓个网页要干嘛了
网页已经不是简单的html了,那个DOM下面什么都有,还可以injection,这个问题太泛
泛了。

【在 n********s 的大作中提到】
: 真诚请教各位:
: 我对编程语言不熟,python了解点皮毛,能编简单的程式
: 我想从一个动态网站抓取数据
: 我输入一个input,然后把网站返回的结果存下来
: 输入input的过程中可能会有新窗口跳出来
: 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
: 请问用哪个module比较容易实现?
: 谢谢!

d**o
发帖数: 864
12
beautifulsoup + twill.commands

【在 n********s 的大作中提到】
: 真诚请教各位:
: 我对编程语言不熟,python了解点皮毛,能编简单的程式
: 我想从一个动态网站抓取数据
: 我输入一个input,然后把网站返回的结果存下来
: 输入input的过程中可能会有新窗口跳出来
: 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
: 请问用哪个module比较容易实现?
: 谢谢!

1 (共1页)
进入Programming版参与讨论
相关主题
小孩子学哪种编程语言比较好?请教一个初级问题
问问几个软件公司所用的编程语言 (转载)如何用Python或者Perl抓取文本?
求推荐:收费的python培训班python login网站
靠铁道部v5,竟然把Github给墙了用python测webpage
从网页周期性抓取信息然后自动发邮件,应该怎么做?求entry/junior level 软工,python/CPP (转载)
问个HTML DOM JavaScript相关的问题啥脚本可以进行网页操作?
求教Python的一个问题Python日报 一周回顾 2015-01-24
问个Python问题Google test engineer求内推 (转载)
相关话题的讨论汇总
话题: mechanize话题: 网页话题: python话题: 网站