简述大数据的分析流程
整个处理流程可以分解为:定义问题,数据理解,数据采集,数据预处理,数据分析,分析结果解析等。 提出问题:制定具体需要解决的问题 大数据理解:利用业务知识认识数据 大数据的采集:实现对结构化和非结构化数据的采集 大数据的预处理:在数据导入时做一些简单的清洗,对某些有实时计算需求的业务进行流式计算 大数据分析:主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行分析 结果的解析:对结果的理解可以通过可视化和人机交互等技术来实现。
简述大数据的分析流程
整个处理流程可以分解为:定义问题,数据理解,数据采集,数据预处理,数据分析,分析结果解析等。 提出问题:制定具体需要解决的问题 大数据理解:利用业务知识认识数据 大数据的采集:实现对结构化和非结构化数据的采集 大数据的预处理:在数据导入时做一些简单的清洗,对某些有实时计算需求的业务进行流式计算 大数据分析:主要利用分布式数据库,或者分布式计算集群来对存储于其内的海量数据进行分析 结果的解析:对结果的理解可以通过可视化和人机交互等技术来实现。