大数据分析主要包括5 个基本方面,即数据可视化、数据挖掘算法、数据预测性分析、语义引擎和数据筛选和数据处理。其中,实现数据的可视化是数据分析的基本,可视化处理使得数据的展示更加直观,让数据更加直观地展示其内在价值;
如果说数据的可视化分析是为了让数据分析人员更好地观察数据,那么数据挖掘则是为了更加深入的剖析数据本身所代表的价值,分割、集群、孤立点分析以及其他的一些算法让数据分析人员可以深入数据内部,窥探数据背后的价值。这些算法需要克服两个难题:一方面,克服大数据的规模庞杂所带来的困难;另一方面,数据处理速度的提升也是这些算法必须克服的困难。
数据挖掘可以让数据分析人员更充分地了解大数据背后的价值,而数据的预测性分析则是为了使数据分析人员根据数据的可视化和数据挖掘算法所带来的价值发现做出一些预测性的判断。
数据的非结构化及其多样性为数据分析人员带来了新的挑战,因此,需要应用一系列数据分析工具去提取、筛选和分析数据。语义引擎的设计则是为了实现能够从“文档”中更加智能、主动地提取信息。
数据筛选和数据处理作为一定情形下的最佳管理实践,通过流程的标准化和数据筛选、处理工具对数据进行预先设定好的数据结构化,从而实现一些预定义的高质量分析结果。