w397090770的文章

Base122介绍及其使用

在数据URI方面其是一个特别高效的UTF-8 binary-to-text编码解决方案，可以用来替换base-64解决。对同一份数据进行编码，Base-122比Base-64小14%。Base-122当前是一个实验编码，后面可能会发生变化。基本使用Base-122编码产生UTF-8字符，但每字节比base-64编码更多的位。[code lang="javascript"]let base122 = require('./base122');let inputData = require('fs').

8年前 (2017-02-15) 1027℃ 4喜欢

Distributed System

大数据和分布式经典论文汇总

下面论文均为大数据和分布式比较经典的论文，包括：CAP、BASE、2PC、一致性协议、一致性哈希、逻辑时钟、Leases 等。如果大家还有比较好的论文，欢迎在下面评论。分布式理论 Time, Clocks, and the Ordering of Events in a Distributed System Reaching Agreement in the Presence of Faults The Byzantine General Problem (CAP) Brewer's Conjecture and the Feasibility of

8年前 (2017-02-15) 3809℃ 0评论10喜欢

Spark

Spark Summit East 2017高清视频和PPT下载

　　Spark Summit East 2017会议于2017年2月07日到09日在波士顿进行，本次会议有来自工业界的上百位Speaker；官方日程：https://spark-summit.org/east-2017/schedule/。　　目前本站昨晚已经把里面的85（今天早上发现又上传了25个视频，晚上我补全）个视频全部从Youtube下载下来，已经上传到百度网盘（访问https://github.com/397090770/spark-summit-east-2017获

8年前 (2017-02-15) 2847℃ 0评论15喜欢

Spark

精心收集的Spark学习资料(持续更新)

如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop《Learning Spark》O'Reilly，2015-01 电子书下载：进入下载《Advanced Analytics with Spark》 O'Reilly，2015-04 电子书下载：进入下载如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关注微信公共帐号：iteblog_hadoop《High Performance Spark》O'Reilly 2016-03 出

8年前 (2017-02-12) 6769℃ 0评论18喜欢

Spark

[电子书]Spark GraphX in Action PDF下载

　　Spark GraphX in Action开头介绍了GraphX库可以干什么，并通过例子介绍了如何以交互的方式使用GraphX 。阅读完本书，您将学习到很多实用的技术，用于增强应用程序和将机器学习算法应用于图形数据中。　　本书包括了以下几个知识点：　　（1）、Understanding graph technology　　（2）、Using the GraphX API　　（3）、Developing algorithms

8年前 (2017-02-12) 4754℃ 0评论5喜欢

Spark

[电子书]Apache Spark Graph Processing PDF下载

　　Apache Spark Graph Processing图书由Rindra Ramamonjison所著，全书共148页；Packt Publishing出版社于2015年09月出版。　　通过本书你将学习到以下内容　　（1）、Write, build and deploy Spark applications with the Scala Build Tool.　　（2）、Build and analyze large-scale network datasets　　（3）、Analyze and transform graphs using RDD and graph-specific operations　　（4）

8年前 (2017-02-12) 1915℃ 0评论1喜欢

Spark

[电子书]Machine Learning with Spark PDF下载

　　本书介绍了用作各种机器学习模型输入的数据集加载和处理的Spark API的基础知识。书中有详细的示例和现实世界的用例，并探索常见的机器学习模型，包括推荐系统，分类，回归，聚类和降维。最后涵盖了一些高级主题，如使用大规模文本数据以及使用Spark Streaming进行在线机器学习和模型评估的方法。通过本书将学习到以下

8年前 (2017-02-12) 2701℃ 0评论4喜欢

Spark

[电子书]Spark Cookbook PDF下载

　　本书重点介绍如何分析大量而且复杂的数据集。本书开头介绍了如何在各种集群管理上安装和配置Apache Spark，其中也会涵盖开发环境的设置。然后介绍了如何通过Spark SQL和实时流对各种数据源进行交互式查询，其中的实时流包括了Twitter Stream 和 Apache Kafka。然后，本书将专注于机器学习，包括监督学习，无监督学习和推荐引擎算

8年前 (2017-02-12) 3234℃ 0评论3喜欢

Spark

[电子书]Learning Real-time Processing with Spark Streaming PDF下载

　　通过使用易于理解的实例，本书将教你如何使用Spark Streaming构建实时应用程序。从安装和设置所需的环境开始，您将编写并执行第一个程序Spark Streaming。接下来将探讨Spark Streaming的架构和组件以及概述Spark公开的库/函数的。接下来，您将通过处理分布式日志文件的用例来了解有关Spark中的各种客户端API编码。然后，您将学习到各

8年前 (2017-02-12) 3126℃ 0评论6喜欢

ElasticSearch

Elasticsearch配置参数介绍

　　Elasticsearch的config文件夹里面有两个配置文件：elasticsearch.yml和logging.yml。第一个是es的基本配置文件，第二个是日志配置文件，es也是使用log4j来记录日志的，所以logging.yml里的设置按普通log4j配置文件来设置就行了。下面主要讲解下elasticsearch.yml这个文件中可配置的东西。如果想及时了解Spark、Hadoop或者Hbase相关的文章，欢迎关

8年前 (2017-02-11) 1916℃ 0评论4喜欢

上一页
1
···
54
55
56
57
58
59
60
61
62
63
64
...
134
下一页
共 134 页

过往记忆

专注于大数据技术构架及应用，微信公众号:过往记忆大数据

w397090770的文章

Base122介绍及其使用

大数据和分布式经典论文汇总

Spark Summit East 2017高清视频和PPT下载

精心收集的Spark学习资料(持续更新)

[电子书]Spark GraphX in Action PDF下载

[电子书]Apache Spark Graph Processing PDF下载

[电子书]Machine Learning with Spark PDF下载

[电子书]Spark Cookbook PDF下载

[电子书]Learning Real-time Processing with Spark Streaming PDF下载

Elasticsearch配置参数介绍