目录 一、概述 1.1 为什么要有Kafka 编辑 1.2 定义 1.3 消息队列 1)消息队列的应用场景 2)消息队列的两种模式 1.4 基础架构 二、Producer生...
目录 物理设备的命名规则 Linux中硬盘分区部分 Linux在分区上建立文件系统 挂载 Linux硬盘管理工具 三级目录 LVM整体创建流程 物理设备的命名规...
报此问题应该是swap不足导致的,原因是用的虚拟机,改为16G内存问题排除 具体解决如下: 1.free -h 查看当前分区大小和使用情况 2.扩展...
1 hive的优缺点 优点 SQL 减少MR的开发难度 使用于实时性不高的数据分析场合 优势处理大数据 自定义函数 缺点 Hql表达能力优先:迭代式算法...
RDD 文章目录 RDD RDD是什么? 为什么需要RDD? RDD的五大属性 WordCount中的RDD的五大属性 如何创建RDD? RDD的操作 两种 基本算...
HIVE SQL 实现Join和group by 具体原理 1、JOIN 在map的输出value中为不同表的数据打上tag标记,在reduce阶段根据tag判断数据来源。MapReduce的过程如...
扩容qcow2虚拟盘 关闭虚拟机 virsh destroy redflag1 qemu-img resize从20G扩容至40G qemu-img resize redflag.qcow2 40G 启动 virsh start redflag1 查看状...
spark的并行度对spark的性能是又很大的影响的,spark任务能快速计算主要就是因为内存计算和并行计算。 对于并行计算,我们就要涉及到并行度的问...
说明:挂载大于2T容量的磁盘时,需要要用parted分区,小于2T可以用fdisk /dev/vdc; 数据库备份服务器挂载3T磁盘; 故我用fdisk 分...