业余时间想做一个project - Programming版 - 未名存档

本页内容为未名空间相应帖子的节选和存档，一周内的贴子最多显示50字，超过一周显示500字访问原贴

Programming版 - 业余时间想做一个project

相关主题
● 问几个神经网络的问题	● groovy 不错啊
● 我来科普下深度学习的应用范围吧	● Facebook的用CNN作翻译怎么性能超过RNN的
● 计算和学习根本就是两回事	● [bssd] Neural network as a programming language
● LSTM 是不是坨屎？	● 深度学习对时间序列数据有什么好办法吗？
● 想上手deep learning的看过来	● ｃｎｎ大牛们，这种特征如何提取呢？
● 对于现在machine learning有个问题，请指教	● 胡扯几句什么叫Deep Learning入门
● CNN做NLP工程多吗？	● [请教]树模型，该如何向客户解释？
● 为什么grid search伤人品	● Keras 现在支持mxnet了

相关话题的讨论汇总
话题: 8226话题: 雄鸡话题: 业余时间话题: project话题: 一唱

进入Programming版参与讨论

1

(共1页)

a*f 发帖数: 1790	1 查查太祖的抄袭作品诗词好收集请教大牛下面这样的相关性分析电脑怎么做比较有效率？天若有情天亦老 ——唐•李贺•《金铜仙人辞汉歌》天若有情天亦老 ——毛泽东《七律•解放军占领南京》1949年4月雄鸡一声天下白 ——唐•李贺《致酒行》一唱雄鸡天下白 ——毛泽东《浣溪沙•和柳亚子先生》1950年10月宁饮建业水，不食武昌鱼 ——《三国志》：《吴孙皓初童谣》才饮长沙水，又食武昌鱼 ——毛泽东《水调歌头•游泳》1956年6月极目楚天空 ——宋代，幼卿《浪淘沙》极目楚天舒 ——毛泽东《水调歌头•游泳》1956年6月
f******2 发帖数: 2455	2 关注！【在 a*f 的大作中提到】 : 查查太祖的抄袭作品 : 诗词好收集 : 请教大牛下面这样的相关性分析电脑怎么做比较有效率？ : 天若有情天亦老 : ——唐•李贺•《金铜仙人辞汉歌》 : 天若有情天亦老 : ——毛泽东《七律•解放军占领南京》1949年4月 : 雄鸡一声天下白 : ——唐•李贺《致酒行》 : 一唱雄鸡天下白
w***g 发帖数: 5958	3 1. 把句子变成word vector，然后算cosine similarity。可以用IDF对word加权。 2. 两个句子算edit distance。如果要做得fancy点，每一步edit可以根据IDF加权。 IDF也可以变成别的权重。这个得试。 3. 自己想新算法。比如　雄鸡一唱　-->　一唱雄鸡, 如果用edit distance算，需要先删去两个再加上两个，所以是４。但显然“一唱雄鸡”比“一唱雄鸭”更接近，不应该两个都是４。可以考虑把删掉的东西存到一个buffer里，如果后面加的东西在buffer里能找到，那么添加的distance就打点折扣。不过这个动态规划可能就没法写了。【在 a*f 的大作中提到】 : 查查太祖的抄袭作品 : 诗词好收集 : 请教大牛下面这样的相关性分析电脑怎么做比较有效率？ : 天若有情天亦老 : ——唐•李贺•《金铜仙人辞汉歌》 : 天若有情天亦老 : ——毛泽东《七律•解放军占领南京》1949年4月 : 雄鸡一声天下白 : ——唐•李贺《致酒行》 : 一唱雄鸡天下白
w***g 发帖数: 5958	4 要不你多收集些语料库，比如把全唐诗全宋词都找好，然后我们搞个RNN训练自动写诗。这个国内有人做得很不错了，但是自己搞一个肯定还是很有意思的。【在 a*f 的大作中提到】 : 查查太祖的抄袭作品 : 诗词好收集 : 请教大牛下面这样的相关性分析电脑怎么做比较有效率？ : 天若有情天亦老 : ——唐•李贺•《金铜仙人辞汉歌》 : 天若有情天亦老 : ——毛泽东《七律•解放军占领南京》1949年4月 : 雄鸡一声天下白 : ——唐•李贺《致酒行》 : 一唱雄鸡天下白
a9 发帖数: 21638	5 你这是想把亲戚搞失踪的节奏啊【在 a*f 的大作中提到】 : 查查太祖的抄袭作品 : 诗词好收集 : 请教大牛下面这样的相关性分析电脑怎么做比较有效率？ : 天若有情天亦老 : ——唐•李贺•《金铜仙人辞汉歌》 : 天若有情天亦老 : ——毛泽东《七律•解放军占领南京》1949年4月 : 雄鸡一声天下白 : ——唐•李贺《致酒行》 : 一唱雄鸡天下白
a*f 发帖数: 1790	6 没事我署阿九的名字，或者取个方肘子笔名【在 a9 的大作中提到】 : 你这是想把亲戚搞失踪的节奏啊
h**********c 发帖数: 4120	7 你无法表达感情或者是我不知道正确的术语来表达以下表现手法比如尼丝达春绿泥鸽墨闻花既不含蓄也不直白，智力因子也不很高。但却很煽动，适于集体农庄茶余饭后。却能 viral
c*********e 发帖数: 16335	8 -----找“雄鸡”就可以了。找名词更容易一些。找到了名词，再在名词的周围找动词。【在 w***g 的大作中提到】 : 1. 把句子变成word vector，然后算cosine similarity。可以用IDF对word加权。 : 2. 两个句子算edit distance。如果要做得fancy点，每一步edit可以根据IDF加权。 : IDF也可以变成别的权重。这个得试。 : 3. 自己想新算法。比如　雄鸡一唱　-->　一唱雄鸡, : 如果用edit distance算，需要先删去两个再加上两个，所以是４。 : 但显然“一唱雄鸡”比“一唱雄鸭”更接近，不应该两个都是４。 : 可以考虑把删掉的东西存到一个buffer里，如果后面加的东西 : 在buffer里能找到，那么添加的distance就打点折扣。不过这个 : 动态规划可能就没法写了。
M**********n 发帖数: 432	9 可以用 Ngram 来做 feature lists
k*****u 发帖数: 1688	10 python里面：结巴分词，算词频，然后tf-idf，然后算相对距离，比如cos或者欧式距离，然后比较 sklearn直接copy paste code应该就可以了啊

1

(共1页)

进入Programming版参与讨论

相关主题
● Keras 现在支持mxnet了	● 想上手deep learning的看过来
● 有没有做sentiment analysis的，求思路	● 对于现在machine learning有个问题，请指教
● 数值计算	● CNN做NLP工程多吗？
● volta一出，业余玩家都要玩完啦	● 为什么grid search伤人品
● 问几个神经网络的问题	● groovy 不错啊
● 我来科普下深度学习的应用范围吧	● Facebook的用CNN作翻译怎么性能超过RNN的
● 计算和学习根本就是两回事	● [bssd] Neural network as a programming language
● LSTM 是不是坨屎？	● 深度学习对时间序列数据有什么好办法吗？

相关话题的讨论汇总
话题: 8226话题: 雄鸡话题: 业余时间话题: project话题: 一唱

未名新帖统计// 7月16日

#	版面	帖数(主题数)
-	全站	4871 (796)
1	Military	3777 (569)
2	Stock	341 (51)
3	Joke	117 (17)
4	History	116 (3)
5	Automobile	100 (9)
6	USANews	55 (9)
7	Midlife	45 (1)
8	Headline	41 (41)
9	Dreamer	33 (13)
10	FleaMarket	32 (20)
11	Living	30 (7)

* 这里只显示发帖超过25的版面，努力灌水吧:-)