由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
Programming版 - 本地搜索local service 原理
相关主题
话说google的新三架马车是在抄袭传统的db啊准备面试一个java-based position,有什么书推荐一下?
谁用过Playorm 连nosql数据库[合集] 抛砖引玉-又一道M$面试题的解法... (转载)
node最好的关系型数据库是什么How difficult is it to write your own sprintf ?
【新手问题】Cassandra-Spark 哪个connector最好?A question
reverse geocoding建议大家介绍自己日常的编程任务,工具,如何选择
Javascript XMLHttpRequest里面哪里错了c++ 在mobile 客户端的应用
How to Search Users within 50 miles away from meGoogle员工给的api talk
大家在linux下面用什么C++的IDE呢?bad news:Oracle wins, Google loses in copyright ruling on J (转载)
相关话题的讨论汇总
话题: api话题: google话题: app话题: 搜索话题: data
进入Programming版参与讨论
1 (共1页)
t****2
发帖数: 125
1
一直有app,例如AroundMe, Yelp,可以根据你所在的位置搜索周围的service,例如加
油站, 餐馆,景点等等。我想知道,这些app搜索的依据或者原理是什么,是他们有一
个现成的数据库里存了很多地址based商家,然后只要知道了你的所在地,就等推荐给
你周围的service了吗? 那这些数据库最开始从哪里来的?例如yelp的,他们最开始的
时候是从哪里购买的吗?然后慢慢积累有了新的商家了,再加入数据库? 如果这样的
话,一些小的app是如何实现这样的搜索的呢,小app或者startup不可能有这些数据库
。或者有收费的公司,例如google 提供API,任何app都可以来用?
p**2
发帖数: 613
2
嘿嘿,这部分就是哥之前做的web spider(所谓的)+machine learn(所谓的)的主场
了。

【在 t****2 的大作中提到】
: 一直有app,例如AroundMe, Yelp,可以根据你所在的位置搜索周围的service,例如加
: 油站, 餐馆,景点等等。我想知道,这些app搜索的依据或者原理是什么,是他们有一
: 个现成的数据库里存了很多地址based商家,然后只要知道了你的所在地,就等推荐给
: 你周围的service了吗? 那这些数据库最开始从哪里来的?例如yelp的,他们最开始的
: 时候是从哪里购买的吗?然后慢慢积累有了新的商家了,再加入数据库? 如果这样的
: 话,一些小的app是如何实现这样的搜索的呢,小app或者startup不可能有这些数据库
: 。或者有收费的公司,例如google 提供API,任何app都可以来用?

t****2
发帖数: 125
3
能说说大概怎么做出来的吗?
需要自己去crawl web找到这些信息?还是有公司的API或者数据库使用?

【在 p**2 的大作中提到】
: 嘿嘿,这部分就是哥之前做的web spider(所谓的)+machine learn(所谓的)的主场
: 了。

a*f
发帖数: 1790
4
app可以返回你的座标,service用geocoding拿座标,两者spatial query
S*****e
发帖数: 6676
5
这个跟狗狗这样的搜索有什么本质的区别,不都得慢慢爬出来吗

【在 t****2 的大作中提到】
: 一直有app,例如AroundMe, Yelp,可以根据你所在的位置搜索周围的service,例如加
: 油站, 餐馆,景点等等。我想知道,这些app搜索的依据或者原理是什么,是他们有一
: 个现成的数据库里存了很多地址based商家,然后只要知道了你的所在地,就等推荐给
: 你周围的service了吗? 那这些数据库最开始从哪里来的?例如yelp的,他们最开始的
: 时候是从哪里购买的吗?然后慢慢积累有了新的商家了,再加入数据库? 如果这样的
: 话,一些小的app是如何实现这样的搜索的呢,小app或者startup不可能有这些数据库
: 。或者有收费的公司,例如google 提供API,任何app都可以来用?

t****2
发帖数: 125
6
我觉得是应该这么做,我知道google提供geocoding api,问题是,大家都是使用
google之类的geocoding API来实现service位置搜索吗?例如上面说的要crawl web来
抓地址的话,可能跟geocoding不一样吧?

【在 a*f 的大作中提到】
: app可以返回你的座标,service用geocoding拿座标,两者spatial query
p**2
发帖数: 613
7
自己放虫出去抓mass data,然后过滤。
自己做,类似产品上线之前必然有个积累过程。
现在已经很好了,网上什么数据都有,只是自己要做整理。
10年前,哥还是学生兼职做地图的项目的时候
当时光地图部分的数据,都是找了无数的摩托党去人力跑出来的。
现在多舒服,地图数据部分,
不求精确,你可以自己经纬度自己算,
求精确,你可以出点小钱,调用GOOGLE API。

【在 t****2 的大作中提到】
: 能说说大概怎么做出来的吗?
: 需要自己去crawl web找到这些信息?还是有公司的API或者数据库使用?

p**2
发帖数: 613
8
他说的不是同一件事情,GEO/Location如果通过API做,那就是kid tool,
稍微麻烦一点的是漫山遍野的去抓相关数据,再过滤。

【在 t****2 的大作中提到】
: 我觉得是应该这么做,我知道google提供geocoding api,问题是,大家都是使用
: google之类的geocoding API来实现service位置搜索吗?例如上面说的要crawl web来
: 抓地址的话,可能跟geocoding不一样吧?

a*f
发帖数: 1790
9
geocoding就是一个数据库,很多公司都提供,比如ESRI, Yahoo,原始数据基本都出自
USPS或者USGS。如果你是national的app,subscribe一个commercial service接口就可
以了。USPS和USGS的官方数据比较权威,只是他们不一定提供应用的接口。

【在 t****2 的大作中提到】
: 我觉得是应该这么做,我知道google提供geocoding api,问题是,大家都是使用
: google之类的geocoding API来实现service位置搜索吗?例如上面说的要crawl web来
: 抓地址的话,可能跟geocoding不一样吧?

a*f
发帖数: 1790
10
用google api做一radar search就可以了
https://developers.google.com/places/web-service/search#RadarSe

【在 p**2 的大作中提到】
: 他说的不是同一件事情,GEO/Location如果通过API做,那就是kid tool,
: 稍微麻烦一点的是漫山遍野的去抓相关数据,再过滤。

相关主题
Javascript XMLHttpRequest里面哪里错了准备面试一个java-based position,有什么书推荐一下?
How to Search Users within 50 miles away from me[合集] 抛砖引玉-又一道M$面试题的解法... (转载)
大家在linux下面用什么C++的IDE呢?How difficult is it to write your own sprintf ?
进入Programming版参与讨论
t****2
发帖数: 125
11
谢谢回复。
从你的回复,我的理解是,要做类似的应用,最好自己先去抓data,然后自己把data分
析留下想要的,然后建立自己的database。之后就可以在自己的数据库里搜索。例如,
用户搜索“博物馆”,数据库里会根据用户的位置,返回他附近的所有相关博物馆的地
址。
那这个database应该是放在server上面的吧,集成的app里面肯定太大。但是进程在app
里面会不会读取速度更快,而且不需要网络也可以用?
另外,如果需要提供app内导航的话,是不是一定需要用到google 或者apple,的导航
api了?还是最好自己写一个?

【在 p**2 的大作中提到】
: 自己放虫出去抓mass data,然后过滤。
: 自己做,类似产品上线之前必然有个积累过程。
: 现在已经很好了,网上什么数据都有,只是自己要做整理。
: 10年前,哥还是学生兼职做地图的项目的时候
: 当时光地图部分的数据,都是找了无数的摩托党去人力跑出来的。
: 现在多舒服,地图数据部分,
: 不求精确,你可以自己经纬度自己算,
: 求精确,你可以出点小钱,调用GOOGLE API。

p**2
发帖数: 613
12
对,我人穷猥琐一分钱夹在菊花里走10个mile不掉下来的主,
所以俺没钱用google付钱api,
自己拿了个USPS的数据做了一个。

【在 a*f 的大作中提到】
: geocoding就是一个数据库,很多公司都提供,比如ESRI, Yahoo,原始数据基本都出自
: USPS或者USGS。如果你是national的app,subscribe一个commercial service接口就可
: 以了。USPS和USGS的官方数据比较权威,只是他们不一定提供应用的接口。

p**2
发帖数: 613
13
用多了还是要银子啊。。。
https://developers.google.com/places/web-service/usage#verify_y
by_enabling_billing
俺还要留着钱给俺老婆俺娃买新衣服新包包呢。

RadarSearchRequests

【在 a*f 的大作中提到】
: 用google api做一radar search就可以了
: https://developers.google.com/places/web-service/search#RadarSe

p**2
发帖数: 613
14
我基本就是这样做的,不过我属于斧头帮街头水平,
你再问问版上大神有没有更好的方法
数据怎么读看你自己,
你客户群经常offline,那就放客户端。
不然就是放服务端。
性能方面有很多方法,cache,NOSQL,ES等等
版上有很多这方面的大神大牛,你可以问问。

app

【在 t****2 的大作中提到】
: 谢谢回复。
: 从你的回复,我的理解是,要做类似的应用,最好自己先去抓data,然后自己把data分
: 析留下想要的,然后建立自己的database。之后就可以在自己的数据库里搜索。例如,
: 用户搜索“博物馆”,数据库里会根据用户的位置,返回他附近的所有相关博物馆的地
: 址。
: 那这个database应该是放在server上面的吧,集成的app里面肯定太大。但是进程在app
: 里面会不会读取速度更快,而且不需要网络也可以用?
: 另外,如果需要提供app内导航的话,是不是一定需要用到google 或者apple,的导航
: api了?还是最好自己写一个?

n*********u
发帖数: 1030
15
many places provide the data, none of them are perfect. and pretty much all
of them cost money. (i.e. navteq)
big company like google use multiple sources, and they need to collect data
from their users (anyone can suggest data to google, etc).
it's not that much data if you just want to use locally, (whole US address
data together is maybe 5GB level, depends on how you compress and how
detailed you like). Not that much when you accurate to state or city.
for small project or personal use, just use google's.
t****2
发帖数: 125
16
多谢建议,我来研究一下google api。

all
data

【在 n*********u 的大作中提到】
: many places provide the data, none of them are perfect. and pretty much all
: of them cost money. (i.e. navteq)
: big company like google use multiple sources, and they need to collect data
: from their users (anyone can suggest data to google, etc).
: it's not that much data if you just want to use locally, (whole US address
: data together is maybe 5GB level, depends on how you compress and how
: detailed you like). Not that much when you accurate to state or city.
: for small project or personal use, just use google's.

1 (共1页)
进入Programming版参与讨论
相关主题
bad news:Oracle wins, Google loses in copyright ruling on J (转载)reverse geocoding
选择 WCF 还是 ASP.NET WebApiJavascript XMLHttpRequest里面哪里错了
一个关于zipcode的小问题How to Search Users within 50 miles away from me
dba和程序员,哪个是青春饭? (转载)大家在linux下面用什么C++的IDE呢?
话说google的新三架马车是在抄袭传统的db啊准备面试一个java-based position,有什么书推荐一下?
谁用过Playorm 连nosql数据库[合集] 抛砖引玉-又一道M$面试题的解法... (转载)
node最好的关系型数据库是什么How difficult is it to write your own sprintf ?
【新手问题】Cassandra-Spark 哪个connector最好?A question
相关话题的讨论汇总
话题: api话题: google话题: app话题: 搜索话题: data