由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
CS版 - 【求教】Text Indexer for Large Volume of ASCII files【先谢】
相关主题
Basic Question About Indexing in Database大学里的CS课
请教一道算法题研究conference acceptance rate有意思吗?
some question about ucon请问这个词是什么意思?
【求助】Solr Indexing怎么去indexing两个HBase Table?请问关于tpc-H生成的data读取问题,数据库的大侠们帮帮忙啊!
想做个搜索引擎,Lucene行吗?请教把access编码由unicode换成ascii的方法
NP-complete problem collection【求助】如何能原封不动的将数字保存下来,而不出现所谓的e?
问一个CVS的问题A cluster question
有什么提供Source Version Control服务的网站吗?[转载] How to implement the "Contour" command
相关话题的讨论汇总
话题: indexer话题: ascii话题: text话题: large话题: volume
进入CS版参与讨论
1 (共1页)
t***s
发帖数: 48
1
我需要index大概四百万个ascii文件。哪位高人给推荐个好用的text indexer。多谢。
简单的说,就是个类似于text search engine里面indexer那一部分,但是提供比较方
便的command line access。最好在windows上。
具体点,就是能够index这四百万文件,把结果放在一个可以从command line方便读取
的repository里。可以是relational database或者其他proprietary的格式,只要能够
从command line或者perl之类的scripts读,结果能输出到ascii文件就可以。当然如果
可以从数据库里直接用SQL读更好。
安装越简单越好。最好都是command line。
我试过微软的search server和open source的lucene,都不太满意,主要是输出都是
web pages。像我的情况一个关键字上百页的输出。处理起来太麻烦。
再谢。
1 (共1页)
进入CS版参与讨论
相关主题
[转载] How to implement the "Contour" command想做个搜索引擎,Lucene行吗?
How about networking 2005 in Waterloo?NP-complete problem collection
[转载] 请教个perl 的问题问一个CVS的问题
Probabilistic Relational Models 搞什么的啊有什么提供Source Version Control服务的网站吗?
Basic Question About Indexing in Database大学里的CS课
请教一道算法题研究conference acceptance rate有意思吗?
some question about ucon请问这个词是什么意思?
【求助】Solr Indexing怎么去indexing两个HBase Table?请问关于tpc-H生成的data读取问题,数据库的大侠们帮帮忙啊!
相关话题的讨论汇总
话题: indexer话题: ascii话题: text话题: large话题: volume