spark web ui getting started : https://mapr.com/blog/getting-started-spark-web-ui/ 当一个Spark Appl...
首先我们从宏观的视角来窥视下大数据技术框架: 图1 大数据技术框架 从图1可以看出,数据源-数据收集-数据存储-资源管理,这是我们进行数据分析和处理的基本;图中的计算框架包括批处理、交互...
HDFS (Hadoop Distributed File System) 数据块 HDFS将文件分成一个个块,除了最后一个块的大小不一样,其余所有的块的大小都是一样的(128MB)。 数...
大数据概述 Hadoop大数据处理平台,Spark大数据通用计算平台,用于图像和视频识别的深度学习。 大数据发展时间线索 2003年:业内学者开始围绕着半结构化数据或非结构化数据的处...
这个学期有一门课程为《数据挖掘》,老师要求每个同学对数据挖掘中的十大经典算法进行具体应用,老师提供数据集,分别使用这十种数据挖掘算法构建模型,这里主要对这十种数据挖掘算法进行简单介绍。 1、C...