由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 怎么做个文件的 index, 比如archive 这样的
相关主题
与其无意义的争论,不如干点实事算法求教
请大牛来谈谈对Solr的看法请教一个跟search中用到的auto suggestion问题
如何智能化合并数据库中属于相关objects的各种属性到一个object下?请问有什么好的开源中英文搜索引擎?
请教下本地搜索一个网站里的search功能,是在search这个网站的database,还是象IDE里面的search workspace?
StackOverflow的架构如何将相似字符串更加准确地找出来?
搜索 lucene 之类是不是不流行了?mongobd中的text search速度问题
架构设计问题,请各位大神指点solr shared index file solution (转载)
请教一下我的这个问题适合用NoSQL吗?你们能scale out的都是有福的
相关话题的讨论汇总
话题: solr话题: archive话题: google话题: 文档话题: sap
进入Programming版参与讨论
1 (共1页)
p*****n
发帖数: 387
1
请教版上的高手
老板让做一个简单的 archive, 把800个文档(.doc .pdf) 按照关键词 keyword 和
时间 date 分类能 sort
简单的就好,因为每周只有3小时做这个,就我一个人做。
像下面这个就好
http://www.utdallas.edu/~lkhan/Fall2013/EM/
好像sap adk 可以做这个。
https://help.sap.com/saphelp_nw7 ... 8323d3a/content.htm
但是sap实在不熟,而且办公室电脑上也没有装sap。有没有别的简单的我能用上的?如
果有sample能照葫芦画瓢最好~~
网上刚刚找到 php sample
https://codex.wordpress.org/Creating_an_Archive_Index
不知道是否是最有效的方法。因为看到的sample 大概放100文档上课放个slides 还行
,通常大家分层 parent directory<4
我有800+文档,每年还要增加200个,就算每个网页上放30文档,也有26页了。乌泱乌
泱的,不好查询。
恳请专家指点,多谢!
p*****n
发帖数: 387
2
up
恳请指点~~
w*******g
发帖数: 9
3
我靠,手贱点了,还看了,楼主你是来说笑话的吗?
p*****n
发帖数: 387
4
hehe, 我真的小白一个,不是专业做编程的,只是老板需要,临时做一个。
时间有点紧,我是无头苍蝇到处google。后来想到mitbbs问问。说不定高手百忙之中指
点我一二,我就省大发了。
恳请waterming 指点~~
有没有入门link让我看看?

【在 w*******g 的大作中提到】
: 我靠,手贱点了,还看了,楼主你是来说笑话的吗?
c******n
发帖数: 4965
5
Google solr, no coding at all

【在 p*****n 的大作中提到】
: 请教版上的高手
: 老板让做一个简单的 archive, 把800个文档(.doc .pdf) 按照关键词 keyword 和
: 时间 date 分类能 sort
: 简单的就好,因为每周只有3小时做这个,就我一个人做。
: 像下面这个就好
: http://www.utdallas.edu/~lkhan/Fall2013/EM/
: 好像sap adk 可以做这个。
: https://help.sap.com/saphelp_nw7 ... 8323d3a/content.htm
: 但是sap实在不熟,而且办公室电脑上也没有装sap。有没有别的简单的我能用上的?如
: 果有sample能照葫芦画瓢最好~~

p*****n
发帖数: 387
6
多谢creation !
否则我都不知道solr,还一头栽在php里面爬出不来呢。
谢谢~~

【在 c******n 的大作中提到】
: Google solr, no coding at all
w**z
发帖数: 8232
7
Elastic search is another option although both Solr and ES are built on top
of Lucene

【在 p*****n 的大作中提到】
: 多谢creation !
: 否则我都不知道solr,还一头栽在php里面爬出不来呢。
: 谢谢~~

c*********e
发帖数: 16335
8
solr要用到http,做全文检索有优势。
如果你只要按照keyword,文件名,时间检索就够了,才800个,用angularjs做个网
页就够了。它是
client side sort,不需要http
https://docs.angularjs.org/api/ng/filter/orderBy

【在 p*****n 的大作中提到】
: 请教版上的高手
: 老板让做一个简单的 archive, 把800个文档(.doc .pdf) 按照关键词 keyword 和
: 时间 date 分类能 sort
: 简单的就好,因为每周只有3小时做这个,就我一个人做。
: 像下面这个就好
: http://www.utdallas.edu/~lkhan/Fall2013/EM/
: 好像sap adk 可以做这个。
: https://help.sap.com/saphelp_nw7 ... 8323d3a/content.htm
: 但是sap实在不熟,而且办公室电脑上也没有装sap。有没有别的简单的我能用上的?如
: 果有sample能照葫芦画瓢最好~~

c******n
发帖数: 4965
9
其实我觉得最好的办法是开一个新 Google drive account, 全扔给 Google 去 search.
人家的 search 比简单的 solr/lucene 强太多

【在 p*****n 的大作中提到】
: 请教版上的高手
: 老板让做一个简单的 archive, 把800个文档(.doc .pdf) 按照关键词 keyword 和
: 时间 date 分类能 sort
: 简单的就好,因为每周只有3小时做这个,就我一个人做。
: 像下面这个就好
: http://www.utdallas.edu/~lkhan/Fall2013/EM/
: 好像sap adk 可以做这个。
: https://help.sap.com/saphelp_nw7 ... 8323d3a/content.htm
: 但是sap实在不熟,而且办公室电脑上也没有装sap。有没有别的简单的我能用上的?如
: 果有sample能照葫芦画瓢最好~~

1 (共1页)
进入Programming版参与讨论
相关主题
你们能scale out的都是有福的StackOverflow的架构
Index PDF和doc 是elasticsearch还是solr搜索 lucene 之类是不是不流行了?
有没有直接对pdf或者doc简历进行分析的开源软件?架构设计问题,请各位大神指点
如何评价google的Cloud AutoML请教一下我的这个问题适合用NoSQL吗?
与其无意义的争论,不如干点实事算法求教
请大牛来谈谈对Solr的看法请教一个跟search中用到的auto suggestion问题
如何智能化合并数据库中属于相关objects的各种属性到一个object下?请问有什么好的开源中英文搜索引擎?
请教下本地搜索一个网站里的search功能,是在search这个网站的database,还是象IDE里面的search workspace?
相关话题的讨论汇总
话题: solr话题: archive话题: google话题: 文档话题: sap