w397090770的文章

JMX监控权限认证配置

　　JMX（Java Management Extensions，即Java管理扩展）是一个为应用程序、设备、系统等植入管理功能的框架。JMX可以跨越一系列异构操作系统平台、系统体系结构和网络传输协议，灵活的开发无缝集成的系统、网络和服务管理应用。启动JMX监控，在启动java程序的时候最少需要在环境变量里面配置以下的选项：[code lang="bash"]-Dcom.sun.m

9年前 (2016-03-25) 6306℃ 0评论10喜欢

Kafka

Kafka集群Leader均衡(Balancing leadership)

　　当一个broker停止或者crashes时，所有本来将它作为leader的分区将会把leader转移到其它broker上去。这意味着当这个broker重启时，它将不再担任何分区的leader，kafka的client也不会从这个broker来读取消息，从而导致资源的浪费。比如下面的broker 7是挂掉重启的，我们可以发现Partition 1虽然在broker 7上有数据，但是由于它挂了，所以Kafka重新

9年前 (2016-03-24) 8410℃ 0评论5喜欢

Kafka

Kafka集群扩展以及重新分布分区

hljs.initHighlightingOnLoad();　　我们往已经部署好的Kafka集群里面添加机器是最正常不过的需求，而且添加起来非常地方便，我们需要做的事是从已经部署好的Kafka节点中复制相应的配置文件，然后把里面的broker id修改成全局唯一的，最后启动这个节点即可将它加入到现有Kafka集群中。　　但是问题来了，新添加的Kafka节点并不会

9年前 (2016-03-24) 12849℃ 2评论23喜欢

资料分享

机器学习基准训练数据集收集列表

商业敏感数据虽然难以获取，但好在仍有相当多有用数据可公开访问。它们中的不少常用来作为特定机器学习问题的基准测试数据。常见的有以下几个：UCL机器学习知识库包括近300个不同大小和类型的数据集，可用于分类、回归、聚类和推荐系统任务。数据集列表位于：http://archive.ics.uci.edu/ml/Amazon AWS公开数据集包含的

9年前 (2016-03-22) 8471℃ 0评论9喜欢

Hadoop

在shell中如何判断HDFS中的文件目录是否存在

　　在Linux文件系统中，我们可以使用下面的Shell脚本判断某个文件是否存在：[code lang="bash"]# 这里的-f参数判断$file是否存在 if [ ! -f "$file" ]; then 　　echo "文件不存在!"fi [/code]但是我们想判断HDFS上某个文件是否存在咋办呢？别急，Hadoop内置提供了判断某个文件是否存在的命令：[code lang="bash"][iteblog@www.it

9年前 (2016-03-21) 10825℃ 0评论19喜欢

Hadoop

设置Hadoop用户以便访问任何HDFS文件

　　Hadoop分布式文件系统实现了一个和POSIX系统类似的文件和目录的权限模型。每个文件和目录有一个所有者（owner）和一个组（group）。文件或目录对其所有者、同组的其他用户以及所有其他用户分别有着不同的权限。对文件而言，当读取这个文件时需要有r权限，当写入或者追加到文件时需要有w权限。对目录而言，当列出目录内容

9年前 (2016-03-21) 8001℃ 9喜欢

Kafka

Kafka管理工具介绍

　　Kafka内部提供了许多管理脚本，这些脚本都放在$KAFKA_HOME/bin目录下，而这些类的实现都是放在源码的kafka/core/src/main/scala/kafka/tools/路径下。Consumer Offset Checker　　Consumer Offset Checker主要是运行kafka.tools.ConsumerOffsetChecker类，对应的脚本是kafka-consumer-offset-checker.sh，会显示出Consumer的Group、Topic、分区ID、分区对应已经消费的Offset、

9年前 (2016-03-18) 16195℃ 0评论13喜欢

ScalikeJDBC

ScalikeJDBC操作API

　　《ScalikeJDBC：基于SQL的简洁DB访问类库》文章中已经介绍了ScalikeJDBC到底是个什么东西。本文将介绍ScalikeJDBC的常用操作（Operations）API。查询API　　ScalikeJDBC中有多种查询API，包括single, first, list 和foreach，他们内部都是调用java.sql.PreparedStatement#executeQuery()实现的。下面将分别介绍如何使用这个API。single查询　　single

9年前 (2016-03-16) 4487℃ 0评论8喜欢

前端框架

Balloon.css：用纯CSS写的tooltips

Balloon.css文件允许用户给元素添加提示，而这些在Balloon.css中完全是由CSS来实现，不需要使用JavaScript。 button { display: inline-block; min-width: 160px; text-align: center; color: #fff; background: #ff3d2e; padding: 0.8rem 2rem; font-size: 1.2rem; margin-top: 1rem; border: none; border-radius: 5px; transition: background 0.1s linear;}.butt

9年前 (2016-03-15) 2560℃ 3评论10喜欢

Spark

Spark北京Meetup第十次活动－－Spark实践主题

　　Spark北京Meetup第十次活动将于北京时间2016年03月27日在北京市海淀区丹棱街5号微软亚太研发集团总部大厦1号楼进行。会议主题1. Spark in TalkingData 阎志涛 TalkingData研发副总裁2. Spark in GrowingIO 田毅 GrowingIO数据平台工程师主要分享GrowingIO使用Spark进行数据处理过程中的各种小技巧

9年前 (2016-03-14) 2433℃ 0评论6喜欢

上一页
1
···
74
75
76
77
78
79
80
81
82
83
84
...
134
下一页
共 134 页

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

w397090770的文章

JMX监控权限认证配置

Kafka集群Leader均衡(Balancing leadership)

Kafka集群扩展以及重新分布分区

机器学习基准训练数据集收集列表

在shell中如何判断HDFS中的文件目录是否存在

设置Hadoop用户以便访问任何HDFS文件

Kafka管理工具介绍

ScalikeJDBC操作API

Balloon.css：用纯CSS写的tooltips

Spark北京Meetup第十次活动－－Spark实践主题