由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 机器学习日报2015年2月楼
相关主题
机器学习日报 2015年3月楼[经验帖] 我是如何当上DS的
大数据日报 2015年2月楼请推荐一个NLP的data set (转载)
恭喜开版,发个刚看到的好玩的machine learning的图Regression中噪音项是一个AR(1),如何做MLE或者其它Fit?
机器学习周报 2015-02-08机器学习日报
机器学习周报 2015-02-08讨论一下:几种clustering方法的特点,区别,长处各是什么?
最近有没有DS有关的会议啊?机器学习日报 2015-01-29 LDA入门与Java实现
大数据日报 2015年3月楼求问一道关于NLP的面试题
[Data Science Project Case] Parsing URLS如何evaluate an unsupervised learning method?
相关话题的讨论汇总
话题: 关键词话题: 学习话题: 机器话题: 订阅话题: 日报
进入DataSciences版参与讨论
1 (共1页)
m***r
发帖数: 359
1
2月开始的内容都分享在这个楼里
机器学习日报 2015-02-01
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-01/short.html
1) 【机器学习公开课的资料汇总】 by @52nlp
关键词:经验总结, 资源, 博客, 课程
这是我们发布在课程图谱博客上的一个机器学习公开课的资料汇总,做了一点更新发布
到这里,供感兴趣的同学参考 [1]
[1] http://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=203014228&idx=1&sn=3c04984f25429033cf279f0627797f2b#rd
2) 【邹博在线讲EM、GMM】 by @研究者July
关键词:算法, 资源, GMM, 幻灯片, 课程, 邹博
Machine Learning在线公开课第 4 期:邹博在线讲EM、GMM结束,被称赞为:“最清楚
的一次GMM”,“老师讲的太好,太多人想听”等等。PPT下载地址请见: [1] ,更多3
月在线精品课程见。欢迎转发分享,thanks。
[1] http://ask.julyedu.com/question/64
3) 【利用张量实现词汇间的语义组合操作】 by @刘知远THU
关键词:会议活动, 资源, 自然语言处理, AAAI, PDF, 会议, 教育网站, 神经网络,
赵宇
语义组合是人类语言的重要特性之一,例如短语“神经网络”的语义可由其中的词汇“
神经”和“网络”的语义组合而成。我组博士生赵宇同学利用张量实现词汇间的语义组
合操作,可以自动根据词汇表示构建低频短语或新产生短语的表示。相关论文: [1]
[1] http://nlp.csai.tsinghua.edu.cn/~lzy/publications/aaai2015_tim.pdf
4) 【topical word embeddings 利用LDA为词汇提供的补充信息】 by @刘知远THU
关键词:会议活动, 算法, 资源, 自然语言处理, AAAI, PDF, 代码, 会议, 教育网站,
刘扬, 主题模型
隐含主题模型LDA的学习过程可为文档每个词分配隐含主题,我组本科生刘扬同学利用
LDA为词汇提供的补充信息,提出topical word embeddings,在词汇相似度计算和文本
分类上得到一些有趣的结果。论文: [1] 代码: [2] 以及paragraph vector代码: [
3]
[1] http://nlp.csai.tsinghua.edu.cn/~lzy/publications/aaai2015_twe.pdf
[2] https://github.com/largelymfs/topical_word_embeddings
[3] https://github.com/largelymfs/paragraph2vec
5) 【关系提取开源实现 relation_extraction】 by @刘知远THU
关键词:会议活动, 知识工程, 资源, AAAI, PDF, 代码, 会议, 教育网站, 林衍凯,
知识库, 知识提取
TransE通过h + r = t的目标学习知识图谱表示,效果引人关注。最近我组林衍凯同学
针对TransE对1-N、N-1类型关系效果不佳的问题,提出TransR将实体映射到不同关系空
间中构建优化目标,效果最高比TransE提升近20%。论文 [1] ,实现TransE、TransH和
TransR全部开源: [2]
[1] http://nlp.csai.tsinghua.edu.cn/~lzy/publications/aaai2015_transr.pdf
[2] https://github.com/mrlyk423/relation_extraction
--------
完整版 62条
http://ml.memect.com/archive/2015-02-01/long.html
m***r
发帖数: 359
2
机器学习日报 2015-02-02
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-02/short.html
1) 【GloVe算法(另一种词向量训练算法)相关资源】 by @爱可可-爱生活
关键词:算法, 自然语言处理, 教育网站, 可视化
[开源]《GloVe: Global Vectors for Word Representation》 [1] GloVe算法(另一种
词向量训练算法)相关资源:论文、源码、数据集及训练好的模型文件、相关脚本、相
似词向量和线性子结构等代表性结果、训练方法、模型概述以及可视化等,可以和
word2vec对比看看 云: [2]
[1] http://nlp.stanford.edu/projects/glove/
[2] http://pan.baidu.com/s/1mgqUFxe
2) 【Large-scale L-BFGS using MapReduce】 by @长翅膀的羊_nash
关键词:会议活动, 算法, NIPS, Weizhu Chen, 会议
LBFGS里面的双循环(最耗时,计算量巨大)居然可以这么简单地被并行化。NIPS14
Weizhu Chen的Large-scale L-BFGS using MapReduce真是一言惊醒梦中人。赞。 [1]
[1] http://nips.cc/Conferences/2014/Program/event.php?ID=4397
3) 【面向MOOC的课程知识图谱构建】 by @刘知远THU
关键词:会议活动, 知识工程, 资源, PDF, WSDM, Yiming Yang, 会议, 教育网站, 课
程, 知识库
(2015_WSDM)Concept Graph Learning from Educational Data。面向MOOC的课程知识
图谱构建,来自CMU的Yiming Yang的大作。 [1]
[1] http://nyc.lti.cs.cmu.edu/yiming/Publications/yang-wsdm15.pdf
4) 【贝叶斯生物统计课程】 by @bitslife
关键词:算法, 资源, PCA, R语言, 代码, 课程, 统计
2015 贝叶斯生物统计课程材料 [1] Bayesian Biostatistics 2015 数据/代码(R)见
:Github [2] 顺便研究下作者的 贝叶斯主成分分析R包 Bayesian Principal
Components Analysis (bPCA) [3] [4] 第一天内容见附图。
[1] http://www.petrkeil.com/?p=2331
[2] https://github.com/petrkeil/Bayesian-biostatistics-2015
[3] https://github.com/petrkeil/bPCA
[4] http://www.petrkeil.com/?p=2316
5) 【Andrew Ng的《机器学习应用建议》】 by @王威廉
关键词:资源, Andrew Ng, Jan Hendrik Metzen, PDF, Python, 教育网站
Andrew Ng的《机器学习应用建议》: [1] 以及不莱梅博士Jan Hendrik Metzen与其意
见相对应的一些Python交互式范例: [2]
[1] http://see.stanford.edu/materials/aimlcs229/ML-advice.pdf
[2] https://jmetzen.github.io/2015-01-29/ml_advice.html
--------
完整版 52条
http://ml.memect.com/archive/2015-02-02/long.html
m***r
发帖数: 359
3
机器学习日报 2015-02-03
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-03/short.html
1) 【讨论:词嵌入到底有用在何处?】 by @老师木
关键词:公告板, 自然语言处理, 问题
word embedding(如word2vec)到底有用在何处?china-beijing=japan-tokyo这种性质
又有什么用途呢?所以,通常用什么指标评价这个方法好/神奇。
2) 【Real-Time Bidding展示广告PPT】 by @zwner
关键词:会议活动, 算法, 应用, 资源, PDF, WSDM, 广告系统, 幻灯片, 会议, 课程
我们研究组在#WSDM2015#上关于Real-Time Bidding展示广告的教学演讲幻灯片可以下
载了: [1] 这次除了有各类DSP竞价算法、SSP底价算法外,还加入了anti-fraud和广
告期权交易的内容。另外也罗列了做互联网广告研究的公开数据集和开源工具。 @_袁
帅_
[1] http://tutorial.computational-advertising.org/images/WSDM2015.pdf
3) 【机器学习职位面试主要考察什么?】 by @好东西传送门
关键词:公告板, 算法, 招聘
国内互联网公司机器学习数据挖掘类的职位面试主要考察什么方面的东西? [1] 知乎
的这个问答里Orangeprince列出几类不同的从业者 ,招聘主要根据其中H和I两类模版
挑选人才。看 1.机器学习算法的理解 2.实际的项目经验 3.对于业务的理解能力和敏
感性 4.沟通表达能力
[1] http://zhi.hu/fL6w
4) 【CUDA系列学习 (四)】 by @Rachel____Zhang
关键词:经验总结, GPU, 博客
#CUDA系列学习 (四)终于写好了~ 首先介绍了Parallel communication patterns的几
种形式(map, gather, scatter, stencil, transpose), 然后复习了cuda memory
model并从high level上分析怎样写出高效代码,最后继续上一讲讨论流程控制(
control flow)以及原子操作。 [1]
[1] http://blog.csdn.net/abcjennifer/article/details/43374009
长微博图:http://ww1.sinaimg.cn/large/9b6c6e0fgw1eow8hq4fyqj20530eidgw.jpg
5) 【doc2vec实战效果】 by @cosmozhang
关键词:自然语言处理, 主题模型
我试了一下用doc2vec [1] 处理 Pang 和 Lee 的 sentimet analysis 的数据集,对于
每一个doc得到 一个feature vector 再用这个feature vector 作为输入用svmlight
进行分类,结果准确率在53%左右,和抛硬币没太大区别。[汗]
[1] http://radimrehurek.com/gensim/models/doc2vec.html
--------
完整版 44条
http://ml.memect.com/archive/2015-02-03/long.html
m***r
发帖数: 359
4
机器学习日报 2015-02-04
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-04/short.html
1) 【邓力等用深度学习处理语音、文本和图像讲座】 by @算文解字
关键词:深度学习, 视觉, 语音, 资源, 自然语言处理, Richard Socher, Ronan
Collobert, 邓力, 幻灯片, 贾扬清
Bay Area Multimedia Forum: 邓力,贾扬清,Ronan Collobert, Richard Socher 讲
用深度学习处理语音、文本和图像。有slides有视频 [1]
[1] http://www.bammf.org/
2) 【机器学习入门书单】 by @hankcs
关键词:自然语言处理
【机器学习入门书单】 继NLP之后,我又开了ML这个大坑。这是因为NLP涉及到太多的
ML模型,仅仅拿过来用的话,我实现的HanLP已经快到个人极限了。而模型背后的原理
、如何优化、如何并行化等问题,都需要寻根求源才能解决。所以我找了个书单自学,
电子书为主,顺便分享出… [1]
[1] http://www.hankcs.com/ml/machine-learning-entry-list.html
3) 【The Trouble with SVMs】 by @爱可可-爱生活
关键词:算法, SVM, 分类, 统计
[文章]《The Trouble with SVMs》 [1] 非常棒的强调特征选择对分类器重要性的文章
。情感分类中,根据互信息对复杂高维特征降维再使用朴素贝叶斯分类器,取得了比
SVM更理想的效果,训练和分类时间也大大降低——更重要的是,不必花大量时间在学
习和优化SVM上——特征也一样no free lunch
[1] http://v1v3kn.tumblr.com/post/47193952400/the-trouble-with-svms
4) 【领域实体识别工具】 by @好东西传送门
关键词:公告板, 自然语言处理, 讨论
讨论合集整理在这里 《领域实体识别工具》我发表了文章 [1] @波多野丽猪 @昊奋
[1] http://ml.memect.com/remix/3805927675611213.html
5) 【WSDM2015的论文】 by @AixinSG
关键词:会议活动, WSDM, 会议
#WSDM2015#的论文可以从ACM DL免费下载了 [1]
[1] http://dl.acm.org/citation.cfm?id=2684822
--------
完整版 43条
http://ml.memect.com/archive/2015-02-04/long.html
m***r
发帖数: 359
5
机器学习日报 2015-02-05
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-05/short.html
1) 【深圳大学发布的人脸检测库】 by @于亻士王其
关键词:视觉, 算法, 代码, 集成学习
本团队雕琢多年的人脸检测库现以MIT协议发布 [1] ,供商业和非商业无限制使用,包含
正面和多视角人脸检测两个算法.优点:速度快(OpenCV haar+adaboost的2-3倍), 准确
度高 (FDDB非公开类评测排名第二),能估计人脸角度. 例子看下图. 希望能帮助到有
需要的个人和公司。
[1] https://github.com/ShiqiYu/libfacedetection
2) 【带Freebase标注的TREC KBA 2014 StreamCorpus数据集】 by @ArnetMiner
关键词:会议活动, 知识工程, WSDM, 会议, 知识库
【知识图谱研究的福音】WSDM 2015上,看到Google分享了一个知识图谱的数据集,496
million的文档,其中394 million有实例标注结果,结果有94亿个entity的实例,平
均每个文档19个实例。 [1] (貌似需要翻墙)数据分享者之一还是WSDM 2015的PC co-
chair
[1] http://goo.gl/AXXOOz
3) 【千万级巨型汉语词库分享】 by @差哥
关键词:资源, 数据
千万级巨型汉语词库分享 – 码农场 [1]
[1] http://www.hankcs.com/nlp/corpus/tens-of-millions-of-giant-chinese-word-library-share.html#2011810-tsina-1-8391-9e42943ba0ef2c241be61f0be4a28b4b
4) 【ACM News报道了最近在深度学习方面的工业界动向】 by @刘知远THU
关键词:深度学习, Richard Socher, 行业动态
ACM News《Pursuing Deep Learning》报道了几家大公司最近在Deep Learning方面的
动向,以及几家以Deep Learning为卖点的创业公司:Enlitic,MetaMind(Richard
Socher好像就在这家公司)。 [1]
[1] http://cacm.acm.org/news/182881-pursuing-deep-learning/fulltext
5) 【WSDM2015最佳论文 Inverting a Steady-State】 by @王威廉
关键词:会议活动, 深度学习, WSDM, 会议
#WSDM2015# 最佳论文 Inverting a Steady-State [1]
[1] http://dl.acm.org/citation.cfm?doid=2684822.2685310
--------
完整版 37条
http://ml.memect.com/archive/2015-02-05/long.html
m***r
发帖数: 359
6
机器学习日报 2015-02-06
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-06/short.html
1) 【词向量性能测试脚本】 by @蒋振超
关键词:经验总结, Jeffrey Pennington, Omer Levy, Python, Richard Socher,
Tomas Mikolov, 博客
Mikolov、Socher、Levy、Pennington这些人提出的词表达训练模型是怎么测试的呢?
我的最新博客:word analogy task以及python的词向量性能测试脚本 [1] ,求转发,
求出名
[1] http://chaoslog.com/word-analogy-taskxiang-jie-ji-pythonban-ben-de-ce-shi-jiao-ben.html
2) 【IBM为沃森增添权衡分析等5项新测试服务】 by @Linuxeden开源社区
关键词:视觉, 语音, 自然语言处理
【IBM为沃森增添权衡分析等5项新测试服务】 据外媒报道,近日,IBM宣布为沃森开发
者云端(Watson Developer Cloud)引进5项新的测试服务内容:语音到文本、文本到语
音、视觉识别、概念理解、权衡分析。其中,权衡分… [1]
[1] http://www.linuxeden.com/html/itnews/20150206/158986.html
3) 【从零开始理解文本】 by @G_Auss
关键词:深度学习, 自然语言处理, Xiang Zhang, Yann Lecun, 论文, 情感分析
我们的论文《从零开始理解文本》(Xiang Zhang, Yann LeCun, Text Understanding
from Scratch)已放到Arxiv上!其思想是把卷积网络直接用到字符上,在大数据集上
取得了特别好的结果。在亚马逊商品评论情感分析中准确度比词袋好10%-20%,在中文
新闻分类上也得到了不错的结果。 [1]
[1] http://arxiv.org/abs/1502.01710
4) 【Alex Smola在CMU新一期的机器学习入门课程】 by @NLPJob
关键词:资源, Alex Smola, 课程, 视频
机器学习大神Alex Smola在CMU新一期的机器学习入门课程”Introduction to Machine
Learning“近期刚刚开课,课程4K高清视频同步到Youtube上,目前刚刚更新到 2.4
Exponential Families,课程主页 [1] ,课程视频playlist [2] , 感兴趣的同学可以
关注,非常适合入门
[1] http://alex.smola.org/teaching/10-701-15/
[2] https://www.youtube.com/playlist?list=PLZSO_6-bSqHTTV7w9u7grTXBHMH-mw3qn
5) 【Twitter时间序列异常检测算法(S-H-ESD)R包的介绍】 by @爱可可-爱生活
关键词:经验总结, 算法, R语言, 博客, 异常检测
[文章]《Introducing practical and robust anomaly detection in a time series
》 [1] Twitter技术团队对前段时间开源的时间序列异常检测算法(S-H-ESD)R包的介绍
,其中对异常的定义和分析很值得参考,文中也提到——异常是强针对性的,某个领域
开发的异常检测在其他领域直接用可不行
[1] https://blog.twitter.com/2015/introducing-practical-and-robust-anomaly-
detection-in-a-time-series
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1eoz8br2wk2j20jv3m6e6c.jpg
--------
完整版 39条
http://ml.memect.com/archive/2015-02-06/long.html
m***r
发帖数: 359
7
机器学习日报 2015-02-07
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-07/short.html
1) 【WSDM2015上腾讯和百度关于语义匹配的报告】 by @李航博士
关键词:会议活动, 算法, 应用, 资源, Juchao Zhuo, Kaihua Zhu, WSDM, 行业动态,
幻灯片, 会议, 集成学习, 信息检索
#WSDM2015#会议上,腾讯的报告Semantic Matching in APP Search (by Juchao Zhuo)
,百度的报告Boosting Search with Deep Understanding of Contents and Users (
by Kaihua Zhu) 讲的都是语义匹配,其实是搜索的核心问题。幻灯片: [1]
[1] http://www.wsdm-conference.org/2015/practice-and-experience-talks/
2) 【聚焦数据质量问题的应对】 by @爱可可-爱生活
关键词:数据质量
[文章]《Empower Your Team to Deal with Data-Quality Issues》 [1] 聚焦数据质
量问题的应对,数据质量对各种规模企业的性能和效率都至关重要,文中总结出(不限
于)22种典型数据质量问题显现的信号,以及典型的数据质量解决方案(清洗、去重、统
一、匹配、权限清理等)
[1] http://www.destinationcrm.com/Articles/Web-Exclusives/Viewpoints/Empower-Your-Team-to-Deal-with-Data-Quality-Issues-101308.aspx
3) 【中文分词入门之资源】 by @52nlp
关键词:入门, 自然语言处理
推一篇曾经在52nlp上浏览量很大的文章--中文分词入门之资源:backoff2005的中文分
词数据,有训练数据,有测试数据,也有评测脚本,很适合中文分词入门 [1]
[1] http://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=203164133&idx=1&sn=37443256188da545526c2c5d3dae4fb3#rd
4) 【TED上Hendler批评霍金对人工智能的看法】 by @西瓜大丸子汤
关键词:知识工程, 资源, Jim Hendler, 霍金, 视频, 语义网
Hendler老师也上TED了 [1] 这次是批评霍金对人工智能的看法。Hendler教授是AAAI
Fellow,语义网的奠基人之一,美国政府Internet政策核心顾问(Internet Web
Expert)
[1] https://www.youtube.com/watch?v=5rNKtramE-I&index=4&list=PLsRNoUx8w3rOZF
-aooqVchJx0Cq-iy2Ls
5) 【Block简化深度神经网络的实现】 by @phunter_lau
关键词:深度学习, 算法, Python, 神经网络
[1] Block说是能简化深度神经网络的实现(封装Theano),看起来比较碉堡的样子,
谁用过? @好东西传送门
[1] http://blocks.readthedocs.org/en/latest/
长微博图:http://ww1.sinaimg.cn/large/698da9a7gw1ep0bkr2mk2j20w920xwui.jpg
--------
完整版 34条
http://ml.memect.com/archive/2015-02-07/long.html
m***r
发帖数: 359
8
机器学习日报 2015-02-08
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-08/short.html
1) 【中国汉英平行语料大世界】 by @翻译技术与教学
关键词:资源, 自然语言处理, 教育网站, 数据
推荐国内语料库资源:你可能还没去过的“中国汉英平行语料大世界”,语料库内容丰
富多彩, [1]
[1] http://corpus.usx.edu.cn/
2) 【如何学习自然语言处理】 by @52nlp
关键词:经验总结, 资源, 自然语言处理, 博客, 课程
翻出一篇旧文《如何学习自然语言处理》,当时主要参考国外著名的nlp博客nlpers的
文章,结合自己的一些经验,现在还有更好的MOOC课程选择,真是一个学习的好时代 [
1]
[1] http://mp.weixin.qq.com/s?__biz=MjM5ODkzMzMwMQ==&mid=203184505&idx=1&sn=b6094b91dde6081b956c9c0d9a452b31#rd
3) 【《Ambient Findability》】 by @好东西传送门
关键词:应用, 资源, Peter Morville, 书籍, 信息检索
Peter Morville 关于可发现性的名著《Ambient Findability》,中文版《随意搜寻》
[1] 作者在书中提出的一些大胆设想(如移动搜索)在几年后都实现了。信息如何设
计得可被发现?交互、语义、设计、心理学如何综合运用?十年前的著作,但内容今天
对很多领域依然很有意义。
[1] http://book.douban.com/subject/25746680/
4) 【用社交用户行为学习图片的协同特征】 by @爱可可-爱生活
关键词:视觉, 应用, Chen Fang, Hailin Jin, 论文, 社交网络
[论文]《Collaborative Feature Learning from Social Media》(2015) Chen Fang,
Hailin Jin [1] 用社交用户行为学习图片的协同特征,可更好地表达图片内容相似性
。由于不依赖于人工标签(标注),可用于大规模图片处理,难在用户行为数据的获取和
清洗;利用社会化特征的思路值得借鉴
[1] http://arxiv.org/abs/1502.01423
5) 【技术上界与使用下界】 by @李航博士
关键词:经验总结, 博客
发表了博文《技术上界与使用下界》 [1]
[1] http://blog.sina.com.cn/s/blog_7ad48fee0102veje.html
--------
完整版 25条
http://ml.memect.com/archive/2015-02-08/long.html
m***r
发帖数: 359
9
机器学习日报 2015-02-09
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-09/short.html
1) 【ImageNet分类超过人的算法】 by @winsty
关键词:视觉, Tony Jebara, 论文
[1] 终于等来surpass human level on imagenet的这一天了,看到这paper我真是一言
难尽啊。。。实在是想到太多有趣的事情在一起了
[1] http://arxiv.org/abs/1502.01852
2) 【Occam’s Razor文献索引】 by @爱可可-爱生活
关键词:奥卡姆剃刀
[列表]很好的Occam’s Razor文献索引 [1] 跟踪《The Role of Occam's Razor in
Knowledge Discovery》找到这个页面,推荐了关于奥卡姆剃刀的Top 10 Papers、
Links和Bibliography,推荐文献有质有量,想深入研究奥卡姆剃刀的可以仔细研究下
[1] http://science.martinsewell.com/occam/
3) 【香港中文大学Deep Learning的课程】 by @金连文
关键词:深度学习, 视觉, 语音, 资源, Wang Xiaogang, 教育网站, 课程
香港中文大学Wang Xiaogang教授今年新开设了Deep Learning的课程,内容涵盖从基础
理论、模型、优化方法、大规模训练、转移学习、多任务学习、计算机视觉语音识别领
域应用等等丰富内容。 [1] ,到今天讲到第5讲。课件很赞!还有不少教辅内容及资料。
[1] https://piazza.com/cuhk.edu.hk/spring2015/eleg5040/home
4) 【Jiawei Han ”Pattern Discovery in Data Mining”今日开课】 by @课程图谱
关键词:资源, Jiawei Han, 课程
#今日开课#UIUC的Pattern Discovery in Data Mining今日开课!讲师是数据挖掘方面
的大牛Jiawei Han,感兴趣的朋友不要错过! @朱飞达_新加坡管理大学 [1]
[1] http://coursegraph.com/pattern-discovery-in-data-mining-coursera-patterndiscovery-university-of-illinois-at-urbana-champaign%EF%BC%88-%E4%BC%8A%E5%88%A9%E8%AF%BA%E4%BC%8A%E5%A4%A7%E5%AD%A6%E5%8E%84%E5%B7%B4%E7%BA%B3-%E9%A6%99%E6%A7%9F%E5%88%86%E6%A0%A1%EF%BC%89
5) 【Real World Active Learning】 by @爱可可-爱生活
关键词:资源, 视频
[视频]《Real World Active Learning - Machine Learning》 [1] 由Lukas Biewald
带来,聚焦主动学习,讲人工参与和交互在机器学习过程中的重要性及其如何降低系统
的不确定性(报告),重点讲训练数据的清洗、校正及模型优化 报告(免费): [2] 云: [
3]
[1] https://www.youtube.com/watch?v=NQrkfLbX4tQ
[2] http://info.crowdflower.com/real-world-active-learning
[3] http://pan.baidu.com/s/1eQ5um3K
--------
完整版 31条
http://ml.memect.com/archive/2015-02-09/long.html
m***r
发帖数: 359
10
机器学习日报 2015-02-10
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-10/short.html
1) 【语义分析的一些方法】 by @火光摇曳Flickering
关键词:经验总结, 自然语言处理, 博客, 行业动态
语义分析的一些方法【1/2/3】 [1] [2] [3] 语义分析,指运用各种机器学习方法,挖
掘与学习文本、图片等的深层次概念。腾讯广点通的高级工程师 vincentyao 从文本和
图片两个角度讲述了语义分析的一些方法,并介绍了在广点通的一些应用。
[1] http://www.flickering.cn/?p=1055
[2] http://www.flickering.cn/?p=1057
[3] http://www.flickering.cn/?p=1059
2) 【15 部最优秀的 Bluemix 教程】 by @IBM_developerWorks
关键词:资源, 课程
#最新文章推荐# “编辑精选:15 部最优秀的 Bluemix 教程”,借助 Bluemix,通过
与 IBM、第三方和开源服务合作,可以构建、部署、运行和管理几乎任何类型的应用程
序。我们发表了大量 Bluemix 及其服务的内容,本文是 developerWorks 编辑团队选
择的 15 部最优秀的 Bluemix 教程! [1]
[1] http://www.ibm.com/developerworks/cn/cloud/library/cl-bestoflbluemix2014/index.html
3) 【Torch vs Theano】 by @爱可可-爱生活
关键词:深度学习, Python
[文章]《Torch vs Theano》 [1] Torch和Theano相比,性能和易用性都有一定优势,
不过Theano植根Python,有天然优势,随着Lasagne和blocks一类封装工具出现,
Theano易用性方面的缺陷也一定程度上被弱化了;作为完美主义,有机会还是要试试
Torch的
[1] http://fastml.com/torch-vs-theano/
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1ep4d43y1cyj20mv1ms1kx.jpg
4) 【机器学习中的数据清洗与特征处理综述】 by @围大腹兴
关键词:数据质量, 特征工程
美团推荐团队又一力作:机器学习中的数据清洗与特征处理综述。欢迎讨论[嘻嘻] (评
论给 @美团技术团队 机器学习中的数据清洗与特征处理综述 - 美团技术团队 [1] )
[1] http://tech.meituan.com/machinelearning-data-feature-process.html
5) 【Deep ID3: Face Recognition】 by @金连文
关键词:深度学习, 视觉, 算法, Tang Xiaoou, Wang Xiaogang, 论文, 神经网络
继DeepID、DeepID2、DeepID2+之后,Tang Xiaoou、Wang Xiaogang教授团队再发新论
文“Deep ID3: Face Recognition with Very Deep Neural Networks“ [1] 。 不知
后续还会不会有Deep ID3+,Deep ID4, Deep ID5…,写论文若能像发布软件版本一样
达到如此境界,是不是令人向往 …-: )
[1] http://arxiv.org/abs/1502.00873
--------
完整版 39条
http://ml.memect.com/archive/2015-02-10/long.html
相关主题
最近有没有DS有关的会议啊?[经验帖] 我是如何当上DS的
大数据日报 2015年3月楼请推荐一个NLP的data set (转载)
[Data Science Project Case] Parsing URLSRegression中噪音项是一个AR(1),如何做MLE或者其它Fit?
进入DataSciences版参与讨论
m***r
发帖数: 359
11
机器学习日报 2015-02-11
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-11/short.html
1) 【WSDM2015 主题报告by Franklin & Joachims】 by @黄萱菁
关键词:会议活动, 资源, Jure Leskovec, Michael Franklin, Thorsten Joachims,
Tushar Chandra, WSDM, 幻灯片, 会议
#WSDM2015# 上传了Michaol Franklin和Thorsten Joachims的主题报告slides [1] 还
有Jure Leskovec和Tushar Chandra的实践与经验报告 slides [2] @WSDM2015 @李航博士
[1] http://www.wsdm-conference.org/2015/keynotes/
[2] http://www.wsdm-conference.org/2015/practice-and-experience-talks/
2) 【Jeb Bush Email 语料】 by @张奇FDU
关键词:应用, 资源, Jeb Bush, 数据, 信息检索
Jeb Bush Email 打包下载在 [1] 关闭了,只能按照日期点选的看,还有一个地址 [2]
需要抓紧下载啊:)
[1] http://jebbushemails.com/email/search
[2] http://americanbridgepac.org/jeb-bushs-gubernatorial-email-archive/
3) 【OpenCV成长之路系列】 by @伯乐在线官方微博
关键词:经验总结, 视觉, 博客
《OpenCV成长之路(3):模仿PhotoShop中魔术棒工具》本文的主题实际上是图像的颜色
空间的转换,借助一个颜色选取程序来说明OpenCV中颜色转换函数的用法以及一些注意
事项。 [1] @RonnyYoung
[1] http://blog.jobbole.com/84211/
4) 【Kaggle最新的malware分类比赛】 by @爱可可-爱生活
关键词:算法, Kaggle, 安全, 集成学习
[竞赛]《Microsoft Malware Classification Challenge (BIG 2015)》 [1] Kaggle最
新的malware分类比赛,感兴趣请关注——以及“Stupid solution” [2] ,用scikit-
learn随机森林高效处理Kaggle提供的400G数据(有trick) ,以及该作者最新一篇 [3]
推荐
[1] https://www.kaggle.com/c/malware-classification
[2] https://thierrysilbermann.wordpress.com/2015/02/08/stupid-solution-to-
malware-classification/
[3] https://thierrysilbermann.wordpress.com/2015/02/09/race-to-the-top/
5) 【提取特征脸 Eigenfaces】 by @爱可可-爱生活
关键词:应用, 自然语言处理, 代码, 机器人, 情感分析, 吴亦凡
[文章]《Automating Tinder with Eigenfaces》 [1] 有意思的Tinder机器人,提取特
征脸对偏好进行学习,自动“喜欢”或“不喜欢”新推荐的照片,基于StanfordNLP做
情感分析并自动选择预置内容聊天——难得的社交机器人实践,推荐 GitHub: [2] 论
文: [3]
[1] http://crockpotveggies.com/2015/02/09/automating-tinder-with-eigenfaces.html
[2] https://github.com/crockpotveggies/tinderbox
[3] http://pan.baidu.com/s/1mgzIuSg
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1ep4zsivqovj20k53bm4qp.jpg
--------
完整版 33条
http://ml.memect.com/archive/2015-02-11/long.html
m***r
发帖数: 359
12
机器学习日报 2015-02-12
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-12/short.html
1) 【特征工程系列文章】 by @爱可可-爱生活
关键词:经验总结, 算法, Python, 博客, 集成学习, 特征工程
[文章]《Selecting good features》特征工程系列文章:Part1.单变量选取 [1]
Part2.线性模型和正则化 [2] Part3.随机森林 [3] Part4.稳定性选择法、递归特征排
除法(RFE)及综合比较 [4] 内容很赞,还有Python代码示例,强烈推荐!
[1] http://blog.datadive.net/selecting-good-features-part-i-univariate-selection/
[2] http://blog.datadive.net/selecting-good-features-part-ii-linear-models-and-regularization/
[3] http://blog.datadive.net/selecting-good-features-part-iii-random-forests/
[4] http://blog.datadive.net/selecting-good-features-part-iv-stability-selection-rfe-and-everyting-side-by-side/
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1ep6a5lq5dqj20kq2q1npd.jpg
2) 【CRF随机场 as RNN循环神经网络】 by @Copper_PKU
关键词:深度学习, 算法, 资源, CRF, PDF, 论文, 神经网络
Conditional Random Fields as Recurrent Neural Networks link: [1] 就喜欢这种
把model串起来的工作方便理解和泛化。paper将mean-field inference每次迭代过程和
CNN对应上,整个inference过程对应为一个Recurrent NN 这是这几天arxiv中算有意思
的paper @火光摇曳Flickering
[1] http://arxiv.org/pdf/1502.03240.pdf
3) 【江辉:HOPE神经网络学习的新框架】 by @鲁东东胖
关键词:江辉, 论文
推荐一下York University 江辉老师的最新工作: [1]
[1] http://arxiv.org/abs/1502.00702
4) 【Bengio团队的新自动图像标题论文】 by @金连文
关键词:经验总结, 视觉, Yoshua Bengio, 博客, 论文
又见Automatic Image Captioning(AIC)论文,来自Yoshua Bengio教授团队(22
pages, 8页正文+n多附图) [1] ,文中报道的结果比之前Microsoft、Google的结果
更好。 此前还看到过今年一篇介绍Image Caption Generation的博文: [2] ,内容够
up-dated,还不错!
[1] http://arxiv.org/abs/1502.03044
[2] https://pdollar.wordpress.com/2015/01/21/image-captioning/
5) 【torch vs theano】 by @cswhjiang
关键词:深度学习, Python
torch vs theano [1]
[1] http://fastml.com/torch-vs-theano/
--------
完整版 31条
http://ml.memect.com/archive/2015-02-12/long.html
m***r
发帖数: 359
13
机器学习日报 2015-02-13
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-13/short.html
1) 【世纪佳缘用户推荐系统的发展历史】 by @breezedeus
关键词:算法, 应用, 推荐系统
本周终于把年终总结给写完了,技术篇( [1] )主要介绍了佳缘用户推荐系统的发展
历史,反映了我们对这个推荐问题不断思考和理解的过程。里面也写了一些我这几年做
推荐的感想。另外,世纪佳缘技术研发中心有多个职位(算法、分布式系统、php工程
师)正在招聘,欢迎大家投简历。
[1] https://breezedeus.github.io/2015/01/31/breezedeus-review-for-year-2014-
tech.html
2) 【通过数据分析解读GDP系列文章】 by @爱可可-爱生活
关键词:算法, 聚类
[文章]通过数据分析解读GDP系列文章,该系列包含三篇文章,第一篇GDP助推因素分析
[1] 和第二篇各国经济数据的蒙特卡洛k-means聚类分析 [2] 已经放出,第三篇关于
未来GDP增长趋势预测的文章还没放,基于数据分析的现代经济学典范,推荐阅读 云:
[3]
[1] http://www.stuartreid.co.za/what-drives-real-gdp-growth-part-one/
[2] http://www.stuartreid.co.za/clustering-countries-real-gdp-growth-part2/
[3] http://pan.baidu.com/s/1jGBrPIY
长微博图:http://ww1.sinaimg.cn/large/5396ee05jw1ep7sy35snsj20jb5hckjl.jpg
3) 【OpenCV进阶之路:神经网络识别车牌字符】 by @伯乐在线官方微博
关键词:经验总结, 视觉, 算法, 博客, 神经网络
《OpenCV进阶之路:神经网络识别车牌字符》车牌识别是计算机视觉在实际工程中一个
非常成功的应用,虽然现在技术相对来说已经成熟,但是围绕着车牌定位、车牌二值化
、车牌字符识别等方向,还是不时的有新的算法出现。通过学习车牌识别来提升自己在
图像识别方面的工程经验是非常好 [1]
[1] http://blog.jobbole.com/84234/
4) 【New Directions in Recommender Systems】 by @飞林沙
关键词:算法, 应用, 推荐系统
[1] 给自己打个广告,昨晚写的关于的笔
记,<商品推荐算法 & 推荐解释>,欢迎一起讨论 @好东西传送门
[1] http://www.douban.com/note/484692347/
5) 【Andrej Karpathy的反击】 by @王威廉
关键词:视觉
手工标注过ImageNet的Andrej Karpathy又调了一下自己的参数。他在Google+上面说:
“ImageNet的5.1%错误率只是我一个人每张图看5分钟的结果。” “如果我花15分钟看
每张图,错误率可以到3%左右呢。” [1] 你们也再去调一下参数继续刷ImageNet吧。[
嘻嘻]
[1] https://plus.google.com/+AndrejKarpathy/posts/dwDNcBuWTWf
--------
完整版 16条
http://ml.memect.com/archive/2015-02-13/long.html
m***r
发帖数: 359
14
机器学习日报 2015-02-14
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-14/short.html
1) 【世纪佳缘推荐系统之我见】 by @飞林沙
关键词:经验总结, 应用, 博客, 推荐系统
我写了新文章《世纪佳缘推荐系统之我见》( 分享自 @简书 ) @breezedeus @52nlp
@好东西传送门 ,希望大家多多讨论 [1]
[1] http://www.jianshu.com/p/4a65873b9ed3
2) 【机器学习在运动领域的广阔应用】 by @爱可可-爱生活
[文章]《Here’s more evidence that sports is a goldmine for machine learning
》 [1] 看机器学习在运动领域的广阔应用空间
[1] https://gigaom.com/2015/02/12/heres-more-evidence-that-sports-is-a-
goldmine-for-machine-learning/
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1ep8zsjn8o5j20ik2owb29.jpg
3) 【CUDA系列学习(五)基础的GPU算法】 by @Rachel____Zhang
关键词:经验总结, 算法, GPU, 博客
CUDA系列学习(五)来咯; 前几讲中我们主要介绍了基础GPU中的软硬件结构,内存管
理,task类型等;这一讲中我们将介绍3个基础的GPU算法:reduce,scan,histogram
,它们在并行算法中非常常用,我们在本文中分别就其功能用处,串行与并行实现进行
阐述。 [1]
[1] http://blog.csdn.net/abcjennifer/article/details/43528407
4) 【黑客们的概率编程和贝叶斯方法书】 by @cvnote计算机视觉笔记
关键词:算法, 统计
Probabilistic Programming & Bayesian Methods for Hackers | 黑客们的概率编程
和贝叶斯方法书,电子版,有代码,介绍为主,减少推导。同时详细介绍了使用PyMC进
行MCMC编程的细节。 [1]
[1] http://camdavidsonpilon.github.io/Probabilistic-Programming-and-Bayesian-Methods-for-Hackers/
5) 【回顾:推荐系统的那点事】 by @七水禾
关键词:算法, 应用, 推荐系统
推荐这篇文章,分析了推荐系统中使用算法的误区,确实规则带来的好处简单有效。
当一个做推荐系统的部门开始重视【数据清理,数据标柱,效果评测,数据统计,数据
分析】这些所谓的脏活累活,这样的推荐系统才会有救。 [1]
[1] http://www.aszxqw.com/work/2014/06/01/tuijian-xitong-de-nadianshi.html
--------
完整版 28条
http://ml.memect.com/archive/2015-02-14/long.html
m***r
发帖数: 359
15
机器学习日报 2015-02-15
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-15/short.html
1) 【孙剑讲述计算机视觉(果壳网)】 by @微软亚洲研究院
关键词:视觉, 孙剑
【计算机视觉:让冰冷的机器看懂多彩的世界】微软亚洲研究院首席研究员孙剑博士撰
文讲述他所了解的计算机视觉,以及他最近的一些研究成果。发表在果壳网,一起来看
>> [1]
[1] http://www.guokr.com/article/439945/
2) 【基于计算机辅助翻译与机器翻译的非技术文本翻译实践】 by @翻译驴
关键词:经验总结, 自然语言处理, 博客, 郭红梅, 机器翻译, 徐彬
分享自翻译及CAT研究 《基于计算机辅助翻译与机器翻译的非技术文本翻译实践》 -
徐彬 山东师范大学 郭红梅 山东建筑大学 引用本文: 国标:徐彬, 郭红梅 2015. 基
于计算机辅助翻译与机器翻... (来自 @头条博客 ) - [1]
[1] http://blog.sina.com.cn/s/blog_ba80e10b0102vcsw.html
3) 【电台谈话节目Talking Machines】 by @王威廉
关键词:公告板, 经验总结, Hanna Wallach, Ilya Sutskever, Kevin Murphy, 博客,
问题
看论文看累了?想听机器学习专家的电台脱口秀吗?最近有一档特别有意思的电台谈话
节目叫做Talking Machines,目前的前四集邀请了包括Ilya Sutskever,Kevin Murphy
, 和Hanna Wallach等大咖参与节目。边干活边听专家侃机器学习感觉真奇妙。强烈推
荐: [1]
[1] http://www.thetalkingmachines.com/blog/
4) 【剑桥大学的deep learning课】 by @老淘
关键词:深度学习, Nando De Freitas
Nando de Freitas ML class with material on NN and Torch(剑桥大学的deep
learning课) @好东西传送门 [1]
[1] https://www.cs.ox.ac.uk/people/nando.defreitas/machinelearning/
5) 【May Bayes Theorem Be with You】 by @爱可可-爱生活
关键词:经验总结, 算法, 博客, 回归, 统计
[文章]《May Bayes Theorem Be with You》 [1] “Bayesian Regression is a
Shrinkage Estimator”
[1] http://technology.stitchfix.com/blog/2015/02/12/may-bayes-theorem-be-with-you/
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1ep9kkclf7ej20rs55ze81.jpg
--------
完整版 19条
http://ml.memect.com/archive/2015-02-15/long.html
m***r
发帖数: 359
16
机器学习日报 2015-02-16
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-16/short.html
1) 【机器学习在量化金融里哪些方面有应用?】 by @晓风_机器学习
关键词:应用, 金融
【机器学习(非传统统计方法如回归)到底在量化金融里哪些方面有应用?】 @聪老师
ZJU永远马屁精 : 尝试回答一下这个问题,也算是对自己阅读的一些论文的总结,顺带
谈下一点自己的思考。前一阵子被吐槽说中英夹杂,也不是为了装逼,因为其实翻译过
来,意思反而… [1] (分享自 @知乎 )
[1] http://www.zhihu.com/question/27420308/answer/38632429
2) 【怎样评价「微软亚洲研究院4人团队完成视觉识别里程碑式突破」?】 by @
winsty
关键词:视觉, 马毅
我在 @知乎 回答了问题: 怎样评价「微软亚洲研究院4人团队完成视觉识别里程碑式突
破」? 我觉得我还是比较有资格回答这个问题的。恰巧马毅老师在微博上也提出来相
同的质疑。以下是我个人的一些想法欢迎讨论。手机码字,长话短说了。 1. 任何
benchmark在… [1] 来看看!
[1] http://www.zhihu.com/question/28209381/answer/39925368
3) 【机器学习分类器示例图集】 by @爱可可-爱生活
关键词:算法, 分类, 可视化
[文章]《Machine Learning classifier gallery》 [1] 机器学习分类器示例图集,对
几种典型分类器的决策区域进行横向和纵向可视化比较,很赞
[1] http://home.comcast.net/~tom.fawcett/public_html/ML-gallery/pages/
长微博图:http://ww1.sinaimg.cn/large/5396ee05jw1epba5iu3huj21393sekjm.jpg
4) 【跑机器学习程序等结果的同时做什么比较好?】 by @王威廉
关键词:经验总结, 博客
跑机器学习程序等结果的同时做什么比较好?刷微信?逛微博?ML Mastery就此问题写
了一篇博文,建议1) 少跑、别跑没有必要的实验 2) 一开始先用小数据跑快速实验 3)
不要手动调参,要用实验调参 4) 休息的时候跑实验 5) 用AWS之类的集群 6) 跑实验
的时候做好其他实验计划 [1] 你们呢?
[1] http://machinelearningmastery.com/machine-learning-model-running/
5) 【介绍高频交易(HFT)中的在线学习算法】 by @爱可可-爱生活
关键词:算法, 应用, 金融
[文章]《Online Algorithms in High-frequency Trading - The challenges faced
by competing HFT algorithms》(2013) [1] 介绍高频交易(HFT)中的在线学习算法,
重点解决流动性估计、波动性估计和线性回归问题,HFT算法简单了解可参考知乎主题:
[2]
[1] http://queue.acm.org/detail.cfm?id=2534976
[2] http://www.zhihu.com/question/23667442
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1epas4u7k5ij20itb0mu10.jpg
--------
完整版 30条
http://ml.memect.com/archive/2015-02-16/long.html
m***r
发帖数: 359
17
机器学习日报 2015-02-17
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-17/short.html
1) 【为什么Ray Kurzweil的垃圾科学理论能够骗人?】 by @王威廉
关键词:Ray Kurzweil
什么是垃圾科学?为什么Ray Kurzweil的垃圾科学理论能够骗人? 文/ @王威廉 [1]
[1] http://weibo.com/p/1001603811157545745463
2) 【羊年应该翻译成...Year of the ovicaprid(Victor Mair)】 by @继东微博
关键词:经验总结, 资源, Victor Mair, 博客, 教育网站, 梅维恒, 数据
俺在宾大的导师梅维恒(Victor Mair)对羊年的译法可能最为特别:Year of the
ovicaprid。他主张“羊”是在青铜时代从草原地带传入东亚,并成为汉语词库里很多
吉祥词汇的语义词根,包括義、善、祥、養、美、羞、羑、羡、鲜、群等等。为此他还
写过专文论述。详情可参他的博客: [1]
[1] http://languagelog.ldc.upenn.edu/nll/?p=17761
3) 【Kayak —— Harvard的Python深度神经网络快速原型库】 by @爱可可-爱生活
关键词:深度学习, 算法, Python, 代码, 神经网络
[开源] Kayak —— Harvard的Python深度神经网络快速原型库,其特色在于足够简单
和可扩展,可实现原型架构的快速开发与思路验证 GitHub: [1]
[1] https://github.com/HIPS/Kayak
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1epc6emhcfrj20l41tve6m.jpg
4) 【帝国理工学院机器学习教学】 by @王威廉
关键词:资源, Frank Wood, Zoubin Ghahramani, 幻灯片, 课程
英国帝国理工学院一直在更新的机器学习教学讲座幻灯片与视频集: [1] 资料从2014
春季开始,包括Zoubin Ghahramani,Frank Wood等人讲座。
[1] http://wp.doc.ic.ac.uk/sml/teaching/ml-tutorials/
5) 【LibRec ——JAVA下的先进推荐算法库】 by @爱可可-爱生活
关键词:算法, 应用, Java, 代码, 矩阵, 推荐系统
[开源] LibRec ——JAVA下的先进推荐算法库,刚刚推出1.2新版本,目前支持的推荐
算法包括UserKNN, ItemKNN, RegSVD, PMF, SVD++, BiasedMF, BPMF, SocialMF,
TrustMF, SoRec, SoReg, RSTE, TrustSVD等 [1] GitHub: [2]
[1] http://www.librec.net/
[2] https://github.com/guoguibing/librec
--------
完整版 26条
http://ml.memect.com/archive/2015-02-17/long.html
m***r
发帖数: 359
18
机器学习日报 2015-02-22
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-22/short.html
1) 【Graham Neubig总结的常用自然语言处理工具列表】 by @王威廉
关键词:自然语言处理, Graham Neubig
奈良先端科学技術大学助理教授Graham Neubig总结的常用自然语言处理工具列表及下
载链接: [1] 可以与之前介绍的NLP选择流程图结合参考使用:http://weibo.com/1657470871/C5eTcuu57
[1] http://www.phontron.com/nlptools.php
2) 【人工智能初创公司2014年获投资额同比激增3倍】 by @ChinaVenture投中集团
关键词:深度学习, 行业动态
【人工智能初创公司2014年获投资额同比激增3倍】自 2014 年初,DeepMind
Technologies 被谷歌 6.5 亿美金收购,VC已经意识到人工智能领域(AI)的投资前景。
据 CB insights 数据,2014 年在人工智能领域共完成 40 笔投资交易,获投资额比
2013 年增加了 302%..... [1]
[1] http://capital.chinaventure.com.cn/11/172/14245717162.shtml
3) 【Next.ML 2015上用Theano和LSTM做情感分析】 by @爱可可-爱生活
关键词:深度学习, 自然语言处理, Python, 代码, 情感分析
[幻灯] 《Theano and LSTM for Sentiment Analysis》 [1] Next.ML 2015上用Theano
和LSTM做情感分析的报告幻灯和练习 GitHub: [2] 云: [3]
[1] https://drive.google.com/file/d/0B6VRjP1VYAtTSWdaZ1BLTmQ0Qm8/view
[2] https://github.com/gwulfs/Bastien-Theano-Workshop
[3] http://pan.baidu.com/s/1nt0w5zr
4) 【Ask a Data Scientist系列之Ensemble Methods】 by @爱可可-爱生活
关键词:算法, 集成学习
[文章]《Ask a Data Scientist: Ensemble Methods》 [1] “Ask a Data Scientist.
”系列文章之Ensemble Methods,通俗程度可以和昨天介绍的Quora随机森林解释相媲
美,但更为详尽,对常用Ensemble框架及其特点也进行了介绍,很好
[1] http://insidebigdata.com/2014/12/18/ask-data-scientist-ensemble-methods/
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1ephqmyazkdj20dl24r1kx.jpg
5) 【Jürgen Schmidhuber关于深度学习的访谈】 by @金连文
关键词:深度学习, 算法, 神经网络
50 Years of Deep Learning and Beyond: an Interview with Jürgen Schmidhuber
[1] (还记得他写的回顾888篇论文的88页神经网络概述论文吧~)。Schmidhuber教授
认为,这一次的神经网络复兴应该是最后一次,因为神经网络将不可能再次退入低潮。
另外,他还认为强化学习值得关注。
[1] https://innsbigdata.wordpress.com/2015/02/09/interview-with-juergen-
schmidhuber/
--------
完整版 34条
http://ml.memect.com/archive/2015-02-22/long.html
m***r
发帖数: 359
19
机器学习日报 2015-02-23
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-23/short.html
1) 【国外哪些大学的语言学专业比较强?】 by @刘知远THU
关键词:语言学
【语言学是个什么样的专业?国外哪些大学的语言学专业比较强?】 @Dr小蝶 :语言
学(linguistics)是研究语言的科学,语言学不是学语言。 [1] (分享自 @知乎 )
[1] http://zhi.hu/5G0M
2) 【计算机视觉的边缘检测】 by @网路冷眼
关键词:视觉, 算法
【计算机视觉的边缘检测】 [1] 边缘检测是计算机视觉最重要的概念之一,它是很直
观的想法,在图像上运行边缘检测应当只输出像素描相似的边缘。本文举例说明了边缘
检测的几种算法和效果。建议搞计算机视觉的看看!
[1] http://austingwalters.com/edge-detection-in-computer-vision/
3) 【Panns -- Nearest Neighbors Search】 by @路遥_机器学习
关键词:经验总结, 应用, Python, 博客, 代码, 推荐系统, 信息检索
一个基于Python的Nearest Neighbors Search库 [1] 。博文介绍 [2] 。另外基于这个
库的一个推荐系统 [3] ,将作为一个demo presentation在WWW上出现。作者是剑桥的
博士后 @唧唧歪歪de计算机博士
[1] https://github.com/ryanrhymes/panns
[2] http://ryanrhymes.blogspot.fi/2015/02/about-panns-naive-tool-for-approximate.html
[3] http://www.cs.helsinki.fi/u/lxwang/kvasir/
4) 【R2PMML 将R模型转换成 Predictive Model Markup Language (PMML)】 by @爱可
可-爱生活
关键词:算法, R语言, 集成学习
[开源] R2PMML —— 将R模型转换成PMML的R包,可以将Rstats随机森林和GBM等的模型
转成PMML方便用更高效的软件进行处理。关于PMML可参考《What is PMML?》 [1]
[1] https://www.ibm.com/developerworks/library/ba-ind-PMML1/
长微博图:http://ww3.sinaimg.cn/large/5396ee05jw1epj1om1e7nj20ku1nygte.jpg
5) 【Facebook讨论自动问答系统的评价方法的文章】 by @爱可可-爱生活
关键词:深度学习, 论文, 问答系统
[论文]《Towards AI-Complete Question Answering: A Set of Prerequisite Toy
Tasks》 [1] 讨论自动问答系统的评价方法,并提出改进的Memory Networks模型,用
深度学习做自动QA
[1] http://arxiv.org/abs/1502.05698v1
长微博图:http://ww2.sinaimg.cn/large/5396ee05jw1epj0owidh3j20y5c4h1l1.jpg
--------
完整版 30条
http://ml.memect.com/archive/2015-02-23/long.html
m***r
发帖数: 359
20
机器学习日报 2015-02-24
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-24/short.html
1) 【15年旧金山深度学习峰会视频】 by @爱可可-爱生活
关键词:会议活动, 深度学习, 视觉, 资源, Andrew Ng, 会议, 视频
[视频]《Deep Learning Summit, San Francisco, 2015》15年旧金山深度学习峰会视
频集萃 [1] 云: [2]
[1] https://www.youtube.com/playlist?list=PLnDbcXCpYZ8lCKExMs8k4PtIbani9ESX3
[2] http://pan.baidu.com/s/1kT7mpqZ
2) 【RoboCup'15将在合肥举办】 by @cvnote计算机视觉笔记
关键词:深度学习, 应用, 机器人
RoboCup'15将在合肥举办。 [1] 回想当年也接触过,当时平台组用的还是AIBO狗,现
在都换成NAO了。做机器人搭系统工作很杂,精力限制,和专门的学术研究相比难免还
是浅了一些。不过就算现在DL等领域取得了各种进展,真正让机器人自由踢球依然不容
易,搭一个成功的系统也不容易
[1] http://www.robocup2015.org/
3) 【用 NLP测量民主】 by @Copper_PKU
关键词:资源, 自然语言处理, PDF, 论文
[arxiv paper sharing] [1] Using NLP to measure democracy. model上没啥有意思
的 主要是选题和整理的corpus, 几日放纵 arxiv上贡献了不少有意思的paper
[1] http://arxiv.org/pdf/1502.06161.pdf
4) 【Science:利用网络技分析术探索疾病关系】 by @刘知远THU
关键词:应用, 医疗
Albert-László Barabási大神在Science上发表新作,利用网络技分析术探索疾病关
系:Uncovering disease-disease relationships through the incomplete
interactome [1]
[1] http://www.sciencemag.org/content/347/6224/1257601.short
5) 【Yoshua Bengio尝试在Deep Learning与生物学观察之间建立联系】 by @刘知远
THU
关键词:深度学习, Yoshua Bengio, 论文
Yoshua Bengio团队(Bengio一作)新作:Towards Biologically Plausible Deep
Learning,尝试在Deep Learning与生物学观察(Spike-Timing- Dependent
Plasticity)之间建立联系。寻找或探索机器学习的生物学解释,感觉很有意义。 [1]
[1] http://arxiv.org/abs/1502.04156
--------
完整版 26条
http://ml.memect.com/archive/2015-02-24/long.html
相关主题
机器学习日报求问一道关于NLP的面试题
讨论一下:几种clustering方法的特点,区别,长处各是什么?如何evaluate an unsupervised learning method?
机器学习日报 2015-01-29 LDA入门与Java实现聚类问题请教
进入DataSciences版参与讨论
m***r
发帖数: 359
21
机器学习日报 2015-02-25
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-25/short.html
1) 【用神经网络实现快速准确的依存关系解析器】 by @爱可可-爱生活
关键词:会议活动, 算法, 资源, 自然语言处理, Christopher Manning, EMNLP, PDF,
会议, 教育网站, 神经网络
[论文]《A fast and accurate dependency parser using neural networks》(2014)
D Chen, CD Manning [1] 来自Stanford,用神经网络实现快速准确的依存关系解析器
[1] http://cs.stanford.edu/~danqi/papers/emnlp2014.pdf
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1epl78hxoxkj20y5ejf7wl.jpg
2) 【智能界面新公司:Viv实验室】 by @格灵深瞳
关键词:行业动态, 问答系统
【【硅谷新公司】Viv:比Siri更聪明的人工智能大脑】近日,不差钱的Viv实验室融到
了1250万美金的B轮融资,主要用于加速产品开发——Viv不仅要完成Siri未实现的目标
,还要在很多方面超越Siri。 [1]
[1] http://www.tmtpost.com/197636.html
3) 【做深度学习选择和使用GPU的一些建议】 by @爱可可-爱生活
关键词:深度学习, GPU
《Which GPU(s) to Get for Deep Learning: My Experience and Advice for Using
GPUs in Deep Learning》 [1] 做深度学习选择和使用GPU的一些建议
[1] https://timdettmers.wordpress.com/2014/08/14/which-gpu-for-deep-learning/
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1eplecg3bw7j20kt6i6b2a.jpg
4) 【The Believers 深度学习历史】 by @韧在百度
关键词:深度学习, Geoffrey Hinton
对深度学习历史好奇的朋友, 推荐 "The Believers - The hidden story behind the
code that runs our lives" [1] "Retrospectively, it was a just a question of
the amount of data and the amount of computations," Hinton says. [2]
[1] http://chronicle.com/article/The-Believers/190147/
[2] http://weibo.com/p/1001603814055260359965
5) 【CaffeGraph – Haskell的Caffe/Torch深度神经网络生成】 by @haskell-china
关键词:深度学习
[Hackage] caffegraph 0.1.0.2 [1]
[1] http://hackage.haskell.org/package/caffegraph-0.1.0.2
--------
完整版 30条
http://ml.memect.com/archive/2015-02-25/long.html
m***r
发帖数: 359
22
机器学习日报 2015-02-26
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-26/short.html
1) 【Google开发的人工智能自学玩游戏】 by @PingWest品玩
关键词:深度学习, 资源, 视频
Google最近把深度学习的研究实验放在了游戏上面,完全不需要人的控制,人工智能会
自动学习游戏里的技巧,从稚嫩走向熟练操作,甚至还能发现隐藏技能点: [1] 这些
技术都是由Google去年购买的人工智能技术研发团队开发实现,看一下这个强大的团队
介绍 →→ [2]
[1] http://v.youku.com/v_show/id_XODk5ODUzODg4.html
[2] http://www.pingwest.com/google-ai-games/
2) 【《Elements of Statistical Learning》英文版国内出版】 by @敲代码的张洋
关键词:资源, 书籍, 统计
《Elements of Statistical Learning》英文版国内终于出版了,之前想海淘原版,但
是加上邮费要1000+大洋,没舍得,这次终于可以买本回来撸了。不过不足之处是国内
这个版本没有更新最新勘误,需要自己去对照勘误表。为了避免广告嫌疑链接不发了,
各大电商网站均有售
3) 【深度对话 Facebook 人工智能负责人】 by @陈利人
关键词:Yann Lecun
深度对话 Facebook 人工智能负责人 [1]
[1] http://app.myzaker.com/news/article.php?pk=54ed91649490cbc13b0000f5&from=groupmessage&isappinstalled=0
4) 【Kaggle“Helping Santa's Helpers” 优化挑战优胜者访谈】 by @爱可可-爱生活
关键词:经验总结, 应用, Kaggle, 博客, 信息检索
[文章]《Defending Champions Winners' Story: "Helping Santa's Helpers"》 [1]
Kaggle“Helping Santa's Helpers” 优化挑战优胜者访谈,Linear Programs(ILP)+
local search/simulated annealing
[1] http://blog.kaggle.com/2015/02/24/defending-champions-winners-story-helping-santas-helpers/
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1epmgc9e1gkj20zs4lkkjl.jpg
5) 【很好的条件随机场(CRF)介绍】 by @爱可可-爱生活
关键词:经验总结, 算法, CRF, 笔记, 博客
[文章]《Introduction to Conditional Random Fields》(2012) [1] 很好的条件随机
场(CRF)介绍文章(学习笔记)
[1] http://blog.echen.me/2012/01/03/introduction-to-conditional-random-fields/
长微博图:http://ww1.sinaimg.cn/large/5396ee05jw1epmfw2y0pgj20od3kd1kx.jpg
--------
完整版 18条
http://ml.memect.com/archive/2015-02-26/long.html
m***r
发帖数: 359
23
机器学习日报 2015-02-27
@好东西传送门 出品, 过刊见
http://ml.memect.com
订阅:给 [email protected]
/* */ 发封空信, 标题: 订阅机器学习日报
更好看的HTML版
http://ml.memect.com/archive/2015-02-27/short.html
1) 【数据挖掘比赛入门,以去年阿里天猫推荐比赛为例】 by @小斯never
关键词:应用, 资源, 行业动态, 推荐系统
针对去年的比赛重新做了个梳理,希望更适合纯新手。写的不好的地方请留言哈,还在
修改的。 通过 @微盘 分享了一个文件: 数据挖掘比赛入门_以去年阿里天猫推荐比赛
为例.docx, 欢迎大家下载分享! [1]
[1] http://vdisk.weibo.com/s/duAzytstNk6eB
2) 【从用户,时间,位置和文本四个方面对tweets建模】 by @AixinSG
关键词:应用, 自然语言处理, 统计, 推荐系统, 信息检索, 袁泉
袁泉的文章 “Who, Where, When and What: a Non-parametric Bayesian Approach
to Context-aware Recommendation and Search for Twitter Users” 刚刚在TOIS发
表。文章提出了一个贝叶斯非参模型,能够同时从用户,时间,位置和文本四个方面对
tweets建模。 [1] @勤奋的无忌 ,
[1] http://dl.acm.org/citation.cfm?id=2699667
3) 【《白云书园》之数字时代】 by @rickjin
关键词:经验总结, 资源, 博客, 书籍, 统计
《白云书园》之数字时代(1、2、3) [1] [2] [3] 大神闲云以多年统计学闭关修炼之
功,撰写数字时代系列故事,在大数据盛行、机器学习满大街飞的时代,以诙谐幽默的
方式来调侃八卦统计采样、大数据、模型检验。幽默调侃之后暗藏冷思考。
[1] http://www.flickering.cn/?p=1221
[2] http://www.flickering.cn/?p=1224
[3] http://www.flickering.cn/?p=1226
4) 【集体过滤的分布式表示模型】 by @张俊林say
关键词:深度学习, 应用, 论文, 推荐系统
我们使用深度学习在推荐系统做了些应用,虽然方法比较简单,但是实验结果表明可以
达到相当不错的效果,这个方向值得深入研究,具体方法可以参考如下论文 [1] 。
[1] http://arxiv.org/abs/1502.04163
5) 【Data Science At Zillow】 by @爱可可-爱生活
关键词:资源, Python, 幻灯片, 数据科学
[幻灯]《Data Science At Zillow》 [1] Python Data Science Meetup [2] 上的报告
,Zillow团队分享大规模数据处理和机器学习方面经验,另有note一篇: [3] 合成版
PDF: [4] via: @phunter_lau http://weibo.com/1770891687/C6bOU2Ffx
[1] http://www.slideshare.net/NicholasMcClure1/python-datascienceatzillow/1
[2] http://www.meetup.com/seattle-python-data-science/events/219015985/
[3] http://workinganalytics.com/zillow-opens-the-kimono-reveals-r-python-and-graphlab-create-underneath/
[4] http://pan.baidu.com/s/1bn6MHyv
长微博图:http://ww4.sinaimg.cn/large/5396ee05jw1epnlhln3lvj20so3cg7wh.jpg
--------
完整版 34条
http://ml.memect.com/archive/2015-02-27/long.html
T*****u
发帖数: 7103
24
我现在有个问题,汉语名词看不太懂,有什么推荐的可以catch up一下
1 (共1页)
进入DataSciences版参与讨论
相关主题
如何evaluate an unsupervised learning method?机器学习周报 2015-02-08
聚类问题请教最近有没有DS有关的会议啊?
[求建议] growth组值得去不, 做sde还是ds (转载)大数据日报 2015年3月楼
[Kaggle Contest] Predict the 2014 NCAA Basketball Tournament[Data Science Project Case] Parsing URLS
机器学习日报 2015年3月楼[经验帖] 我是如何当上DS的
大数据日报 2015年2月楼请推荐一个NLP的data set (转载)
恭喜开版,发个刚看到的好玩的machine learning的图Regression中噪音项是一个AR(1),如何做MLE或者其它Fit?
机器学习周报 2015-02-08机器学习日报
相关话题的讨论汇总
话题: 关键词话题: 学习话题: 机器话题: 订阅话题: 日报