n********s 发帖数: 196 | 1 真诚请教各位:
我对编程语言不熟,python了解点皮毛,能编简单的程式
我想从一个动态网站抓取数据
我输入一个input,然后把网站返回的结果存下来
输入input的过程中可能会有新窗口跳出来
网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
请问用哪个module比较容易实现?
谢谢! |
D*****r 发帖数: 6791 | 2 javascript少的话可以试试mechanize?
【在 n********s 的大作中提到】 : 真诚请教各位: : 我对编程语言不熟,python了解点皮毛,能编简单的程式 : 我想从一个动态网站抓取数据 : 我输入一个input,然后把网站返回的结果存下来 : 输入input的过程中可能会有新窗口跳出来 : 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏 : 请问用哪个module比较容易实现? : 谢谢!
|
n********s 发帖数: 196 | 3 谢谢!
正在研究mechanize
有没有什么网站可以看sample code?
直接看documentation有点摸不着头脑
【在 D*****r 的大作中提到】 : javascript少的话可以试试mechanize?
|
h*******s 发帖数: 8454 | 4 要是动态的可以试试selenium
【在 n********s 的大作中提到】 : 谢谢! : 正在研究mechanize : 有没有什么网站可以看sample code? : 直接看documentation有点摸不着头脑
|
n********s 发帖数: 196 | 5 这个看起来不错
值得学习
谢谢!
【在 h*******s 的大作中提到】 : 要是动态的可以试试selenium
|
n********s 发帖数: 196 | 6 真诚请教各位:
我对编程语言不熟,python了解点皮毛,能编简单的程式
我想从一个动态网站抓取数据
我输入一个input,然后把网站返回的结果存下来
输入input的过程中可能会有新窗口跳出来
网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏
请问用哪个module比较容易实现?
谢谢! |
D*****r 发帖数: 6791 | 7 javascript少的话可以试试mechanize?
【在 n********s 的大作中提到】 : 真诚请教各位: : 我对编程语言不熟,python了解点皮毛,能编简单的程式 : 我想从一个动态网站抓取数据 : 我输入一个input,然后把网站返回的结果存下来 : 输入input的过程中可能会有新窗口跳出来 : 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏 : 请问用哪个module比较容易实现? : 谢谢!
|
n********s 发帖数: 196 | 8 谢谢!
正在研究mechanize
有没有什么网站可以看sample code?
直接看documentation有点摸不着头脑
【在 D*****r 的大作中提到】 : javascript少的话可以试试mechanize?
|
h*******s 发帖数: 8454 | 9 要是动态的可以试试selenium
【在 n********s 的大作中提到】 : 谢谢! : 正在研究mechanize : 有没有什么网站可以看sample code? : 直接看documentation有点摸不着头脑
|
n********s 发帖数: 196 | 10 这个看起来不错
值得学习
谢谢!
【在 h*******s 的大作中提到】 : 要是动态的可以试试selenium
|
w*********u 发帖数: 392 | 11 这都很容易,看你抓个网页要干嘛了
网页已经不是简单的html了,那个DOM下面什么都有,还可以injection,这个问题太泛
泛了。
【在 n********s 的大作中提到】 : 真诚请教各位: : 我对编程语言不熟,python了解点皮毛,能编简单的程式 : 我想从一个动态网站抓取数据 : 我输入一个input,然后把网站返回的结果存下来 : 输入input的过程中可能会有新窗口跳出来 : 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏 : 请问用哪个module比较容易实现? : 谢谢!
|
d**o 发帖数: 864 | 12 beautifulsoup + twill.commands
【在 n********s 的大作中提到】 : 真诚请教各位: : 我对编程语言不熟,python了解点皮毛,能编简单的程式 : 我想从一个动态网站抓取数据 : 我输入一个input,然后把网站返回的结果存下来 : 输入input的过程中可能会有新窗口跳出来 : 网站返回的结果是多个网页的,而且有超链接,我想把所有的结果都存下来,不遗漏 : 请问用哪个module比较容易实现? : 谢谢!
|