由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
JobHunting版 - 有没有可能爬虫(crawl)wechat?
相关主题
求讨论一道SYSTEM DESIGN题,CC10.1how to parse json to csv , using python?
网页爬虫的时候,用requests, get 爬url 时,能有什么参数设定现在写android 有什么好用的framework么?
问一个关于python web crawling 的问题, 内有代码刚刚FB电面试完
贡献最近面的T家电面一题,顺便求个bless下面这道uber电面,怎么做?
Front-End Developer @ Verizon Wireless NJAmazon.com电面
Job Opening @ Verizon Wireless @ Central NJ发一个Startup的面经 - Affirm
Dev Position at Verizon Wireless in Central NJpython的list和array是一个东西?
新鲜,可以通过HTTP POST发送你的简历找工作也蛮欢乐了,一个SDET职位的很奇葩的问题
相关话题的讨论汇总
话题: 爬虫话题: wechat话题: crawl话题: 文章话题: webchat
进入JobHunting版参与讨论
1 (共1页)
o****g
发帖数: 174
1
公司有一个project 是爬虫(crawl) wechat, 找出相关某个产品的文章,并计算相关某
个产品的文章的数目。请问有没有可能爬虫wechat? 如果能,怎么爬虫wechat?
d*******n
发帖数: 43
2
没有能不能 只有难不难
爬虫说到底还是模拟 看你怎么模拟了
o****g
发帖数: 174
3
多谢。怎么模拟。主要这是一个apple 的app 怎么爬呢?得在mac 系统里爬吧?怎么爬
?在windows 系统下能爬吗?

【在 d*******n 的大作中提到】
: 没有能不能 只有难不难
: 爬虫说到底还是模拟 看你怎么模拟了

x********9
发帖数: 208
4
爬虫是个技术活。得雇人。
f****n
发帖数: 399
5
你这是爬公众号的文章吧
[在 oovbbg (Old Old Virgin, Big Big Girl) 的大作中提到:]
:公司有一个project 是爬虫(crawl) wechat, 找出相关某个产品的文章,并计算相关
某个产品的文章的数目。请问有没有可能爬虫wechat? 如果能,怎么爬虫wechat?
o****g
发帖数: 174
6
是的,爬公众号的文章怎么爬?多谢!

【在 f****n 的大作中提到】
: 你这是爬公众号的文章吧
: [在 oovbbg (Old Old Virgin, Big Big Girl) 的大作中提到:]
: :公司有一个project 是爬虫(crawl) wechat, 找出相关某个产品的文章,并计算相关
: 某个产品的文章的数目。请问有没有可能爬虫wechat? 如果能,怎么爬虫wechat?

z*********n
发帖数: 1451
7
wechat有api就能爬啊,跟网页区别不大吧,你觉着难点在哪?会被wechat当ddos
block了吗?
e*******o
发帖数: 4654
8
爬不了。
都是私有的内容。
s******r
发帖数: 267
9
你公司的project
问同事啊
R*********4
发帖数: 293
10
当然有可能,
【1】uwp或者wpf应用,
你可以加个 webview, 然webview去登陆webchat
然后用 invokescript 和 notify 让自己得程序和webchat通信
【2】chrome 或者 firefox
你也以 extension得形式和webchat通信
即使是这两种方法,也需要Dynamic Proxy才能实现
楼上有个人说api, 但现在api可以通过各种复杂token避免攻击得,比如次数限制,ip
限制,设备限制等
无非就是 parse html, parse json, GET, POST
只是如果想以服务器得模式,会有困难,现在webchat验证是比较严得
b***e
发帖数: 1
11
用chrome extension的话,可以考虑使用http://www.swiftformatter.com/webpage,安装之后可以自己写JS code来实现网页操作。好处是不用再从头实现完整的chrome extension了。
1 (共1页)
进入JobHunting版参与讨论
相关主题
找工作也蛮欢乐了,一个SDET职位的很奇葩的问题Front-End Developer @ Verizon Wireless NJ
这里有 google 的人吗?问个问题Job Opening @ Verizon Wireless @ Central NJ
龟板主题Dev Position at Verizon Wireless in Central NJ
com上搜索关键字新鲜,可以通过HTTP POST发送你的简历
求讨论一道SYSTEM DESIGN题,CC10.1how to parse json to csv , using python?
网页爬虫的时候,用requests, get 爬url 时,能有什么参数设定现在写android 有什么好用的framework么?
问一个关于python web crawling 的问题, 内有代码刚刚FB电面试完
贡献最近面的T家电面一题,顺便求个bless下面这道uber电面,怎么做?
相关话题的讨论汇总
话题: 爬虫话题: wechat话题: crawl话题: 文章话题: webchat