欢迎关注大数据技术架构与案例微信公众号:过往记忆大数据
过往记忆博客公众号iteblog_hadoop
欢迎关注微信公众号:
过往记忆大数据
  • Trino Summit 2021 会议视频和 PPT 下载
  • 盘点2021年晋升为Apache TLP的大数据相关项目
  • 精选30个炫酷的数据可视化大屏(含源码),拿走就用!
  • PrestoCon Day 2021 会议 PPT 下载
  • Data + AI Summit 2021 全部超清 PPT 下载
  • Learning Spark, 2nd Edition 可以免费下载了
Trino Summit 2021 会议视频和 PPT 下载盘点2021年晋升为Apache TLP的大数据相关项目精选30个炫酷的数据可视化大屏(含源码),拿走就用!PrestoCon Day 2021 会议 PPT 下载Data + AI Summit 2021 全部超清 PPT 下载Learning Spark, 2nd Edition 可以免费下载了
深入理解 JNI

《深入理解 JNI》:JNI 数据类型与类型转换 24小时内最新

《深入理解 JNI》:JNI 数据类型与类型转换
基本数据类型映射在JNI中,Java的基本数据类型和C/C++的基本数据类型之间有一一对应的关系。这种映射关系是JNI能够实现Java与本地代码之间数据交换的基础。以下是Java基本数据类型与C/C++基本数据类型之间的映射:整数类型byte:在Java中,`byte`是有符号的8位整数。在C/C++中,它映射为`jbyte`,实际上就是一个`signed char`。shor

w397090770   7分钟前 4℃ 0评论0喜欢

深入理解 JNI

《深入理解 JNI》:JNI 基础 24小时内最新

《深入理解 JNI》:JNI 基础
JNI 简介Java Native Interface(JNI)是Java平台的一个标准接口,它允许Java代码与其他语言编写的代码进行交互。这种交互能力极大地扩展了Java的应用范围,使得Java程序可以调用系统级的库或者执行高性能计算,这些往往是纯Java代码难以高效完成的。从Java 1.1版本开始,JNI标准就成为Java平台的一部分。JNI最初的设计目的是为了本地

w397090770   14分钟前 4℃ 0评论0喜欢

Docker

Docker 时区调整方案 24小时内最新

Docker 时区调整方案
在现代软件开发和部署中,Docker 容器已经成为一种流行的技术,它提供了轻量级的虚拟化环境,使得应用程序能够在隔离的环境中运行。然而,随着全球化的发展,时区问题成为了容器化应用中不可忽视的一个环节。本文将深入探讨 Docker 容器中的时区调整方案,包括其重要性、常见问题、解决方案以及最佳实践。 时区调整的重

w397090770   25分钟前 2℃ 0评论0喜欢

Prestissimo

深入了解 Presto 原生 C++ 查询引擎-Presto 2.0

深入了解 Presto 原生 C++ 查询引擎-Presto 2.0
在过去三年中,来自Meta、Ahana(现为IBM)、Intel和字节跳动的工程师团队联手打造了一款名为Velox的先进执行引擎,它的设计目标是可以在各种计算引擎之间灵活组合使用。在这个过程中,他们开发出了基于C++的Presto worker,这是一个全新的查询执行引擎,它基于Velox构建,此前被称为Project Prestissimo,现在则被命名为Presto 2.0。我们

w397090770   6个月前 (06-27) 416℃ 0评论2喜欢

Linux

生成火焰图:Linux 和 Mac 平台的详细指南

生成火焰图:Linux 和 Mac 平台的详细指南
火焰图(Flame Graphs)是一种可视化技术,用于展示软件程序的运行时性能。它们可以帮助开发者快速识别程序中的热点(即执行时间最长的部分)。本文将指导您如何在 Linux 和 Mac 平台上生成火焰图。火焰图简介火焰图是由 Brendan Gregg 创建的性能分析工具,它以一种直观的方式展示了程序的调用栈信息。火焰图的每一层代表函

w397090770   9个月前 (04-10) 608℃ 0评论1喜欢

Presto

Presto 超大内存泄漏问题排查

Presto 超大内存泄漏问题排查
最近有一个线上 Presto 集群的 Coordinator 节点内存一直处于90%以上,如下图所示:如果想及时了解Spark、Hadoop或者HBase相关的文章,欢迎关注微信公众号:过往记忆大数据日志里面可以看到几乎每分钟都在 Full GC,但是内存仍然占用很高,所以第一个想法就是存在内存泄漏。但是线上的集群内存是180GB,所以分析这些内存就不能用

w397090770   11个月前 (01-31) 354℃ 0评论2喜欢

Prestissimo

使用 Presto + Velox 读取 HDFS 上的数据

使用 Presto + Velox 读取 HDFS 上的数据
当前 velox 支持了 HDFS、S3 以及本地文件系统,其中 HDFS 和 S3 模块是需要在编译的时候显示指定的,比如我们要测试 HDFS 功能,编译 prestissimo 的时候需要显示指定 PRESTO_ENABLE_HDFS=ON,如下:[code lang="bash"]PRESTO_ENABLE_HDFS=ON make release[/code]Velox 解析 HDFS NN endpoint 逻辑核心代码如下:[code lang="CPP"]HdfsServiceEndpoint HdfsFileSystem::getServic

w397090770   2年前 (2023-06-29) 739℃ 0评论3喜欢

Prestissimo

如何构建 Presto、Prestissimo\Velox 镜像

如何构建 Presto、Prestissimo\Velox 镜像
为了方便集群的部署,一般我们都会构建出一个 dokcer 镜像,然后部署到 k8s 里面。Presto、Prestissimo 以及 Velox 也不例外,本文将介绍如果构建 presto 以及 Prestissimo 的镜像。构建 Presto 镜像Presto 官方代码里面其实已经包含了构建 Presto 镜像的相关文件,具体参见 $PRESTO_HOME/docker 目录:[code lang="bash"]➜ target git:(velox_docker) ✗ ll ~/

w397090770   2年前 (2023-06-21) 511℃ 0评论8喜欢

Alluxio

Alluxio Local Cache 加速 Presto 查询在 Uber 的应用

Alluxio Local Cache 加速 Presto 查询在 Uber 的应用
背景如果想及时了解Spark、Hadoop或者HBase相关的文章,欢迎关注微信公众号:过往记忆大数据在 Uber,数据影响着每一个决定。Presto 是推动 Uber 各种数据分析的核心引擎之一。例如,运营团队在仪表盘等服务中大量使用 Presto;Uber Eats 和营销团队依靠这些查询的结果来决定价格。此外, Presto 还被用于 Uber 的合规部门、增长营销部

w397090770   2年前 (2022-11-14) 854℃ 0评论3喜欢

Presto

图文介绍 Presto + Velox 整合

图文介绍 Presto + Velox 整合
过去十年,存储的速度从 50MB/s(HDD)提升到 16GB/s(NvMe);网络的速度从 1Gbps 提升到 100Gbps;但是 CPU 的主频从 2010 年的 3GHz 到现在基本不变,CPU 主频是目前数据分析的重要瓶颈。为了解决这个问题,越来越多的向量化执行引擎被开发出来。比如数砖的 Photon 、ClickHouse、Apache Doris、Intel 的 Gazelle 以及 Facebook 的 Velox(参见 《Velox 介绍

w397090770   2年前 (2022-09-29) 2119℃ 0评论3喜欢