由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Java版 - 可以用Java 做机器人吗?
相关主题
JAVA URL question, help读文件时,如何才能只将空白符当成分隔符?
java and javascript 问题请教,有包子问个简单的Java技术问题
Java HTMLEditorKit 中取得html的text?Re: 恳请各位JAVA大师:有没有这样一个东西?
Java.Net初学: 我的简单问题, 寻求简单方案是否可以通过Java的程序直接导入网页?
JQuery求助!怎样用java运行含Javascript的网页?
java 1.4 直接处理 http?URI和URL
Java XML parser的问题Linux下安装一个Java软件出现异常
[转载] Java Regular Expression Question //bow !Java练习题 6
相关话题的讨论汇总
话题: java话题: 机器人话题: ie话题: html话题: mitbbs
进入Java版参与讨论
1 (共1页)
jl
发帖数: 398
1
大概要用那些 Class! 结构如何啊?
g*****g
发帖数: 34805
2
sure, but what kind of robot do you need?

【在 jl 的大作中提到】
: 大概要用那些 Class! 结构如何啊?
jl
发帖数: 398
3
网络 搜索.

【在 g*****g 的大作中提到】
: sure, but what kind of robot do you need?
r***l
发帖数: 67
4
No need to build your own. There are quite a few open source java projects
doing the same thing.

【在 jl 的大作中提到】
: 网络 搜索.
l*****e
发帖数: 1431
5
以前做过一个针对mitbbs的搜索机器人,跟某ID吵架的时候,就用它搜该ID全站的历史言
论,功效显著。那时候还没有宽带,所以都是用单线程做的,搜完全站要半个晚上。前些
天想拿出来改改,发现还留在closet的旧电脑硬盘上,就作罢了。

【在 g*****g 的大作中提到】
: sure, but what kind of robot do you need?
m******t
发帖数: 2416
6

So that was what burned out look's harddrive...

【在 l*****e 的大作中提到】
: 以前做过一个针对mitbbs的搜索机器人,跟某ID吵架的时候,就用它搜该ID全站的历史言
: 论,功效显著。那时候还没有宽带,所以都是用单线程做的,搜完全站要半个晚上。前些
: 天想拿出来改改,发现还留在closet的旧电脑硬盘上,就作罢了。

c**g
发帖数: 274
7
说起这个机器人,我准备弄一个专门搞yahoo message. 各位可能没用过Yahoo
message, 真不一般的烂,界面图功能差也就算了,这个搜索简直是乱七八糟,
绝大部分时候啥都查不出来,很少的时候能查点玩意出来,我到现在也没明白
是怎么个玩法。真是烂啊。

【在 l*****e 的大作中提到】
: 以前做过一个针对mitbbs的搜索机器人,跟某ID吵架的时候,就用它搜该ID全站的历史言
: 论,功效显著。那时候还没有宽带,所以都是用单线程做的,搜完全站要半个晚上。前些
: 天想拿出来改改,发现还留在closet的旧电脑硬盘上,就作罢了。

t********k
发帖数: 808
8
你这个是怎么做的?
用搜索引擎的构思?
总不会直接从MITBBS里取数据吧
感兴趣
能介绍一下否?

【在 l*****e 的大作中提到】
: 以前做过一个针对mitbbs的搜索机器人,跟某ID吵架的时候,就用它搜该ID全站的历史言
: 论,功效显著。那时候还没有宽带,所以都是用单线程做的,搜完全站要半个晚上。前些
: 天想拿出来改改,发现还留在closet的旧电脑硬盘上,就作罢了。

l*****e
发帖数: 1431
9
就是直接取数据,挨个版搜,后来因为太慢,改进了一点,把要搜的版名放在一个文本文
件里面,运行的时候load进去,那些可能性不大的版就不包括进去了。

史言
前些

【在 t********k 的大作中提到】
: 你这个是怎么做的?
: 用搜索引擎的构思?
: 总不会直接从MITBBS里取数据吧
: 感兴趣
: 能介绍一下否?

t********k
发帖数: 808
10
想知道你是怎么取数据的
没接触过这方面的东西

【在 l*****e 的大作中提到】
: 就是直接取数据,挨个版搜,后来因为太慢,改进了一点,把要搜的版名放在一个文本文
: 件里面,运行的时候load进去,那些可能性不大的版就不包括进去了。
:
: 史言
: 前些

l*****e
发帖数: 1431
11
General purpose的我也不知道,如果只是针对某个网站的话很容易啊,看看它的URL
pattern, 再看看HTML source基本上就知道怎么取了。更简单的,写个基本的proxy,
把IE送出去的requests intercept下来,然后照葫芦画瓢模拟IE client也可以。

本文

【在 t********k 的大作中提到】
: 想知道你是怎么取数据的
: 没接触过这方面的东西

t********k
发帖数: 808
12
基本明白了

【在 l*****e 的大作中提到】
: General purpose的我也不知道,如果只是针对某个网站的话很容易啊,看看它的URL
: pattern, 再看看HTML source基本上就知道怎么取了。更简单的,写个基本的proxy,
: 把IE送出去的requests intercept下来,然后照葫芦画瓢模拟IE client也可以。
:
: 本文

c**g
发帖数: 274
13
http, parsing html.

【在 t********k 的大作中提到】
: 想知道你是怎么取数据的
: 没接触过这方面的东西

1 (共1页)
进入Java版参与讨论
相关主题
Java练习题 6JQuery
Java练习题 7java 1.4 直接处理 http?
Core Java2 Notes (2)Java XML parser的问题
Re: XML help?[转载] Java Regular Expression Question //bow !
JAVA URL question, help读文件时,如何才能只将空白符当成分隔符?
java and javascript 问题请教,有包子问个简单的Java技术问题
Java HTMLEditorKit 中取得html的text?Re: 恳请各位JAVA大师:有没有这样一个东西?
Java.Net初学: 我的简单问题, 寻求简单方案是否可以通过Java的程序直接导入网页?
相关话题的讨论汇总
话题: java话题: 机器人话题: ie话题: html话题: mitbbs