n******7 发帖数: 12463 | 1 平时主要用R或者python+numpy+scipy+pandas+sk-learn
处理一些老鼠data,做些统计分析,ML
前段时间用java做了一个project,感觉静态语言写东西还是挺爽的
debug容易,row speed也不错
而且生成个jar文件就可以到处用了
但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc)
觉得还是C++/Scala更合适
用C++的话,可能是先用python这一套东西测试方法
等差不多了全改成C++
或者一开始就用C++来搞
用Scala的话,感觉可以只用一种语言全部搞定
这两个语言大家都说坑多
问题是,如果只用基本的一些feature,比如把C++当作更方便一点C (string, etc),
是不是基本就无所谓了?
我感觉我们这一行的代码一般都没那么nb
看过一些source code,代码重用经常就是靠复制黏贴解决
反正都是一些小工具 |
e*******o 发帖数: 4654 | 2 if you projects are small and independent, language does not matter.
but if someone may take over if in the future, stick with python and c/c++. |
n******7 发帖数: 12463 | 3 基本不会有人接手了
最多跑跑我的code 产生点结果
但是我也不想把自己坑了,老看抱怨c++和scala的
另一方面也是想把手头的东西做的好用,让做实验的在windows电脑上双击就能用
这点好像用python+numpy等一堆东西写的部署很麻烦
【在 e*******o 的大作中提到】 : if you projects are small and independent, language does not matter. : but if someone may take over if in the future, stick with python and c/c++.
|
e*******o 发帖数: 4654 | 4 你应该集中力量搞新方法,而不是在语言上纠缠。
双击能用,用golang,比java 还省事,写起来也比c++简单。
【在 n******7 的大作中提到】 : 基本不会有人接手了 : 最多跑跑我的code 产生点结果 : 但是我也不想把自己坑了,老看抱怨c++和scala的 : 另一方面也是想把手头的东西做的好用,让做实验的在windows电脑上双击就能用 : 这点好像用python+numpy等一堆东西写的部署很麻烦
|
s***o 发帖数: 2191 | 5 windows上当然要先考虑C#
【在 n******7 的大作中提到】 : 基本不会有人接手了 : 最多跑跑我的code 产生点结果 : 但是我也不想把自己坑了,老看抱怨c++和scala的 : 另一方面也是想把手头的东西做的好用,让做实验的在windows电脑上双击就能用 : 这点好像用python+numpy等一堆东西写的部署很麻烦
|
l*******m 发帖数: 1096 | 6 试试在spark上用scala
etc)
【在 n******7 的大作中提到】 : 平时主要用R或者python+numpy+scipy+pandas+sk-learn : 处理一些老鼠data,做些统计分析,ML : 前段时间用java做了一个project,感觉静态语言写东西还是挺爽的 : debug容易,row speed也不错 : 而且生成个jar文件就可以到处用了 : 但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc) : 觉得还是C++/Scala更合适 : 用C++的话,可能是先用python这一套东西测试方法 : 等差不多了全改成C++ : 或者一开始就用C++来搞
|
l*******m 发帖数: 1096 | 7 试试在spark上用scala
etc)
【在 n******7 的大作中提到】 : 平时主要用R或者python+numpy+scipy+pandas+sk-learn : 处理一些老鼠data,做些统计分析,ML : 前段时间用java做了一个project,感觉静态语言写东西还是挺爽的 : debug容易,row speed也不错 : 而且生成个jar文件就可以到处用了 : 但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc) : 觉得还是C++/Scala更合适 : 用C++的话,可能是先用python这一套东西测试方法 : 等差不多了全改成C++ : 或者一开始就用C++来搞
|
l*******m 发帖数: 1096 | 8 试试在spark上用scala
etc)
【在 n******7 的大作中提到】 : 平时主要用R或者python+numpy+scipy+pandas+sk-learn : 处理一些老鼠data,做些统计分析,ML : 前段时间用java做了一个project,感觉静态语言写东西还是挺爽的 : debug容易,row speed也不错 : 而且生成个jar文件就可以到处用了 : 但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc) : 觉得还是C++/Scala更合适 : 用C++的话,可能是先用python这一套东西测试方法 : 等差不多了全改成C++ : 或者一开始就用C++来搞
|
l*******m 发帖数: 1096 | 9 试试在spark上用scala
etc)
【在 n******7 的大作中提到】 : 平时主要用R或者python+numpy+scipy+pandas+sk-learn : 处理一些老鼠data,做些统计分析,ML : 前段时间用java做了一个project,感觉静态语言写东西还是挺爽的 : debug容易,row speed也不错 : 而且生成个jar文件就可以到处用了 : 但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc) : 觉得还是C++/Scala更合适 : 用C++的话,可能是先用python这一套东西测试方法 : 等差不多了全改成C++ : 或者一开始就用C++来搞
|
l**********n 发帖数: 8443 | 10 scala好在异步
etc)
【在 n******7 的大作中提到】 : 平时主要用R或者python+numpy+scipy+pandas+sk-learn : 处理一些老鼠data,做些统计分析,ML : 前段时间用java做了一个project,感觉静态语言写东西还是挺爽的 : debug容易,row speed也不错 : 而且生成个jar文件就可以到处用了 : 但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc) : 觉得还是C++/Scala更合适 : 用C++的话,可能是先用python这一套东西测试方法 : 等差不多了全改成C++ : 或者一开始就用C++来搞
|
|
|
z****e 发帖数: 54598 | 11 你这是要gui的东西
没有特别省事的solution |
n******7 发帖数: 12463 | 12 哦,也不一定要双击用
估计还是CLI的东西,就是不用安装一堆东西才能用
我希望能用户友好
有的东西光设置好必要的环境就搞死人,明显只是为了发paper用的
【在 z****e 的大作中提到】 : 你这是要gui的东西 : 没有特别省事的solution
|
n******7 发帖数: 12463 | 13 能不能在通俗一点
异步有什么好?不做web service
【在 l**********n 的大作中提到】 : scala好在异步 : : etc)
|
n******7 发帖数: 12463 | 14 我们这里的cluster没有spark
一般老鼠工厂也不用上这玩意吧
【在 l*******m 的大作中提到】 : 试试在spark上用scala : : etc)
|
n******7 发帖数: 12463 | 15 windows是个例子
还是跨平台的,win mac lin都能用最好
【在 s***o 的大作中提到】 : windows上当然要先考虑C#
|
n******7 发帖数: 12463 | 16 我们杀老鼠的能有啥新方法
无非就两种搞法
1. 搞一批别人没有的老鼠数据,然后随便挖挖,凑个论点,发了。这种事情是头猪都
可以搞,就看老板捧你来搞不
2. 拿一批别人公开的数据,然后翻翻这几年的CS论文,看看有啥时髦的玩意可以用上
不,然后随便折腾出100个结果,找出其中5个看着不错的,凑个方法,发了
作为喜欢纸上谈兵的,我已经纸面上研究过golang了,觉得不合适,具体观点跟这个
blog差不多:
http://yosefk.com/blog/things-from-python-id-miss-in-go.html
【在 e*******o 的大作中提到】 : 你应该集中力量搞新方法,而不是在语言上纠缠。 : 双击能用,用golang,比java 还省事,写起来也比c++简单。
|
z****e 发帖数: 54598 | 17 你这里面,要能够跨平台
要能够画图,要能够写各种ml简单
这三个要求,基本上就已经没有什么比较好的solution了
不管是java系还是python系
都比较折腾,答案是没有,真没有这么傻瓜的东西 |
n******7 发帖数: 12463 | 18 画图可以不要
我画图主要是自己看,或者show performance之类的
跟要做的东西本身无关
跨平台不方便的话,只要linux/unix 平台就好
杀老鼠的一般也有mac可以用
写的简洁,debug省事,运行能有java的速度,deployment容易就ok了
【在 z****e 的大作中提到】 : 你这里面,要能够跨平台 : 要能够画图,要能够写各种ml简单 : 这三个要求,基本上就已经没有什么比较好的solution了 : 不管是java系还是python系 : 都比较折腾,答案是没有,真没有这么傻瓜的东西
|
p***o 发帖数: 1252 | 19 你弄点funding让wdong给你做一个就好了。
【在 n******7 的大作中提到】 : 画图可以不要 : 我画图主要是自己看,或者show performance之类的 : 跟要做的东西本身无关 : 跨平台不方便的话,只要linux/unix 平台就好 : 杀老鼠的一般也有mac可以用 : 写的简洁,debug省事,运行能有java的速度,deployment容易就ok了
|
n******7 发帖数: 12463 | 20 我是想练习一下炒菜
你让我点菜让wdong做...
【在 p***o 的大作中提到】 : 你弄点funding让wdong给你做一个就好了。
|
|
|
q*c 发帖数: 9453 | 21 抱怨的是要看牛逼人的程序。
自己的程序没人抱怨。
【在 n******7 的大作中提到】 : 基本不会有人接手了 : 最多跑跑我的code 产生点结果 : 但是我也不想把自己坑了,老看抱怨c++和scala的 : 另一方面也是想把手头的东西做的好用,让做实验的在windows电脑上双击就能用 : 这点好像用python+numpy等一堆东西写的部署很麻烦
|
d******e 发帖数: 2265 | 22 没必要折腾。人生有很多有意义的事情可以做。
etc)
【在 n******7 的大作中提到】 : 平时主要用R或者python+numpy+scipy+pandas+sk-learn : 处理一些老鼠data,做些统计分析,ML : 前段时间用java做了一个project,感觉静态语言写东西还是挺爽的 : debug容易,row speed也不错 : 而且生成个jar文件就可以到处用了 : 但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc) : 觉得还是C++/Scala更合适 : 用C++的话,可能是先用python这一套东西测试方法 : 等差不多了全改成C++ : 或者一开始就用C++来搞
|
n******7 发帖数: 12463 | 23 感觉只会脚本语言人生不完整,找个工作都被bs
【在 d******e 的大作中提到】 : 没必要折腾。人生有很多有意义的事情可以做。 : : etc)
|
l***y 发帖数: 4671 | 24 老实用R,用透。现在云上跑R都很常见了。想效率,先优化算法,再优化代码,再上
cluster上云,实在不行了,底层上C/C++用R来调用。
etc)
【在 n******7 的大作中提到】 : 平时主要用R或者python+numpy+scipy+pandas+sk-learn : 处理一些老鼠data,做些统计分析,ML : 前段时间用java做了一个project,感觉静态语言写东西还是挺爽的 : debug容易,row speed也不错 : 而且生成个jar文件就可以到处用了 : 但是java做这些事情感觉不是很擅长 (没有operator overload,没有REPL,啰嗦, etc) : 觉得还是C++/Scala更合适 : 用C++的话,可能是先用python这一套东西测试方法 : 等差不多了全改成C++ : 或者一开始就用C++来搞
|
n******7 发帖数: 12463 | 25 R用的一般,比周围CS背景的人用的好点,统计背景的不如
我就是做个方法,所以基本就是这个算法了
研究过一下R的性能优化,基本结论是先天不足
官方的R实现是稳定优先,性能是次要考虑
也不是面向一般programmer的语言,所以很多考虑都是为了写代码容易,比如pass by
value
优化的低级技巧无非是矢量化,有时候无法避免loop,有时候还是然并卵
高级技巧就是直接用各种低级函数,但是这样高级feature也没有了
还要上C/C++的话,就更费时间了
最后花了几天时间改成java 多线程,爽多了,算是随便学了java
现在全面转向python,通用编程语言比DSL爽多了,基本要啥有啥,raw speed 比R快一
个数量级,再也不用担心一个for loop 搞垮整个code了
所以如果你不是搞统计的,什么data scientist之类,R真没啥意思
画图倒是特nb,我画图都用R来搞
【在 l***y 的大作中提到】 : 老实用R,用透。现在云上跑R都很常见了。想效率,先优化算法,再优化代码,再上 : cluster上云,实在不行了,底层上C/C++用R来调用。 : : etc)
|