大数据(big data)是指无法在一定时间范围内(nèi)用常规软件工具进行捕捉、管理和处(chù)理的数(shù)据集合,是需(xū)要新处理模式才能具有更强的决策力、洞(dòng)察发现力和流程优(yōu)化(huà)能力的海量(liàng)、高增长率和多(duō)样化(huà)的信息资产。
在维克托·迈尔-舍恩伯格(gé)及肯尼斯·库克耶(yē)编写的(de)《大数据时(shí)代》中大数据指不用随机分(fèn)析法(抽样调查)这样捷径(jìng),而采用所有(yǒu)数据进行(háng)分析处理。大数据的(de)5V特点(IBM提(tí)出):Volume(大量)、Velocity(高(gāo)速)、Variety(多样)、Value(低价值密度(dù))、Veracity(真实性(xìng))。
大(dà)数据技术的战略意义不在于(yú)掌握庞大的数据信息,而在于对这些含有意义的数据进行(háng)专业化处理。换言之,如果把(bǎ)大数据比作一种产业,那么这种产业实现盈利的关键,在(zài)于提高对数据的“加工能力”,通过“加工”实现数据的“增值”。
大数(shù)据(jù)涉及到的学科:计(jì)算机,信息科学,统计学等。