由买买提看人间百态

boards

本页内容为未名空间相应帖子的节选和存档,一周内的贴子最多显示50字,超过一周显示500字 访问原贴
DataSciences版 - 通过日志分析yarn app实际内存用量
相关主题
Hadoop Spark 学习小结[2014版] (转载)做个调查了解一下,有公司用HP Vertica 和 Hana 这些 data base的么?
Hadoop Spark 学习小结[2014版] (转载)大数据日报 2015年2月楼
如何提高Spark在Yarn上的内存使用率有没有谁自己买服务器组建几个clusters跑hadoop大数据的?
big data software engineer或者data scientist 工作机会推荐 (转载)[内推] NetBrain tech (software engineer等)职位内部推荐机会
诚心请教Spark EMR配置我觉得data science其实挺难的
datascientist几个基本问题转:Coursera 推荐工作
Career talk --你问我答-Next Tuesday 8PM CDT(May 26) (转载)狗狗内推(请BZ置顶)
Free Session: Big Data Real User Case in Financing推荐一下Shiny Dashboard
相关话题的讨论汇总
话题: gb话题: container话题: 0001话题: yarn
进入DataSciences版参与讨论
1 (共1页)
w***g
发帖数: 5958
1
【 以下文字转载自 Programming 讨论区 】
发信人: wdong (cybra), 信区: Programming
标 题: 通过日志分析yarn app实际内存用量
发信站: BBS 未名空间站 (Tue Jan 13 15:05:17 2015, 美东)
上次介绍过yarn/spark怎么调参数。但是yarn/spark并没有给出一种方法可以确定一个
app的实际内存用量。这就导致调参数很大程度上只能是guesstimate。
我起了一个github project可以指定一个app ID,然后通过日志分析给出这个app的每
个yarn container实际最高内存使用量。这样开发的时候用这个脚本确定内存用量后,
提交任务的时候就可以设置更加准确的值,避免出现占着毛坑不拉屎的情况。
https://github.com/aaalgo/yarn-memory-tracker
比如
$ yarn-memory-tracker.sh application_1421176927536_0002
184 containers found for app application_1421176927536_0002
container_1421176927536_0001_01_000001: 0.254785 of 16.4 GB
container_1421176927536_0001_01_000002: 16.2 of 51.4 GB
container_1421176927536_0001_01_000003: 0.00107422 of 51.4 GB
container_1421176927536_0001_01_000004: 0.00107422 of 51.4 GB
container_1421176927536_0001_01_000005: 12.5 of 51.4 GB
......
w***g
发帖数: 5958
2
我发现不同系统似乎移植性并不太好。版上要是有同学能提供yarn日志共测试的话欢迎
和我联系。过两天我有空了会加一个图形界面。

【在 w***g 的大作中提到】
: 【 以下文字转载自 Programming 讨论区 】
: 发信人: wdong (cybra), 信区: Programming
: 标 题: 通过日志分析yarn app实际内存用量
: 发信站: BBS 未名空间站 (Tue Jan 13 15:05:17 2015, 美东)
: 上次介绍过yarn/spark怎么调参数。但是yarn/spark并没有给出一种方法可以确定一个
: app的实际内存用量。这就导致调参数很大程度上只能是guesstimate。
: 我起了一个github project可以指定一个app ID,然后通过日志分析给出这个app的每
: 个yarn container实际最高内存使用量。这样开发的时候用这个脚本确定内存用量后,
: 提交任务的时候就可以设置更加准确的值,避免出现占着毛坑不拉屎的情况。
: https://github.com/aaalgo/yarn-memory-tracker

1 (共1页)
进入DataSciences版参与讨论
相关主题
推荐一下Shiny Dashboard诚心请教Spark EMR配置
有没有比较好的piglatin development tools 啊?datascientist几个基本问题
coursera data science certificate 管用吗?Career talk --你问我答-Next Tuesday 8PM CDT(May 26) (转载)
求问data science的发展前景。。Free Session: Big Data Real User Case in Financing
Hadoop Spark 学习小结[2014版] (转载)做个调查了解一下,有公司用HP Vertica 和 Hana 这些 data base的么?
Hadoop Spark 学习小结[2014版] (转载)大数据日报 2015年2月楼
如何提高Spark在Yarn上的内存使用率有没有谁自己买服务器组建几个clusters跑hadoop大数据的?
big data software engineer或者data scientist 工作机会推荐 (转载)[内推] NetBrain tech (software engineer等)职位内部推荐机会
相关话题的讨论汇总
话题: gb话题: container话题: 0001话题: yarn