当前位置: 首页 > 面试题库 >

什么是大数据的5V特征?

邹祺
2023-05-16

大数据定义

大数据(big data),或称巨量资料,指的是所涉及的资料量规模巨大到无法透过主流软件工具,在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。

在维克托·迈尔-舍恩伯格及肯尼斯·库克耶编写的《大数据时代》中大数据指不用随机分析法(抽样调查)这样捷径,而采用所有数据进行分析处理。大数据的5V特点(IBM提出):Volume(大量)、Velocity(高速)、Variety(多样)、Value(低价值密度)、Veracity(真实性)。

“大数据”一词列出了商务印书馆推出的《汉语新词语词典(2000—2020)》中国这20年生命活力指数最高的十大“时代新词”。

大数据(big data)一般无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合;是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据5V特征

大数据5V特征指的是5个V开头的单词,从5个方面准确、生动、形象的介绍了大数据特征。

Volume--数据体量大:采集数据量大,存储数据量大,计算数据量大一般是TB、PB级别起步的数据。

Variety--种类和来源多样化:结构化、半结构化、非结构化,比如日志文本、图片、音频、视频等等的来源。

Value--低价值密度:信息海量但是价值密度低,深度复杂的挖掘分析,需要机器学习参与。

Velocity--速度快:数据增长速度快、获取数据速度快、数据处理速度快。

Veracity--数据的质量: 指的是数据的准确性和数据的可信赖度。

大数据的5V特征

大数据的应用场景和领域

医疗大数据

医疗行业通过临床数据对比、实时统计分析、远程病人数据分析、就诊行为分析等,辅助医生进行临床决策,规范诊疗路径,提高医生的工作效率例如智慧医疗、疾病预防、病源追踪等。

政府大数据

在智慧政府模式下,通过大数据技术,政府得以“感知”社会的发展变化需求,行政决策更加科学化、公共服务更加精准化、资源配置更加合理化。

电商大数据

电子商务企业获得精准的数据分析,可以更好地了解用户的需求,制定合理的营销策略,从而给用户推广更感兴趣的产品,提高营销成功率,提供个性化推荐,针对人群的精准广告位,我们常说的大数据杀熟就是在行为数据和消费者身份信息分析基础上推出的个性化展示和消费能力预测。

传媒大数据

云集各式各样的信息,实现分类筛选、摘编和深度加工,实现对读者和受众个性化需求的准确定位和把握,并追踪用户的浏览习惯,不断进行信息优化,例如精准营销、次啊你喜欢交互推荐等。

安防大数据

安防行业可实现视频图像模糊查询、快速检索、精准定位,并能够进一步挖掘海量视频监控数据背后的价值信息,反馈内涵知识辅助决策判断,进行犯罪预防和天网监控。

电信大数据

电信行业拥有庞大的数据,大数据技术可以应用于网络管理、客户关系管理、企业运营管理等,并且使数据对外商业化,实现单独盈利, 舆情监控、客户用户画像等的预测。

教育大数据

通过大数据进行学习分析,能够为每位学生创设一个量身定做的个性化课程,为学生的多年学习提供一个富有挑战性而非逐渐厌倦的学习计划。

交通大数据

大数据技术可以预测未来交通情况,为改善交通状况提供优化方案,有助于交通部门提高对道路交通的把控能力,防止和缓解交通拥堵,提供更加人性化的服务,进行 拥堵预测、智能红绿灯、导航最优规划。

金融大数据

在用户画像的基础上,银行可以根据用户的年龄、资产规模、理财偏好等,对用户群进行精准定位,分析出潜在的金融服务需求。例如理财投资,通过对个人的信用评估,风险承担能力评估,集合众多理财产品、推荐响应的投资理财产品。

以上我们介绍了,大数据能应用的领域。

 类似资料:
  • 本文向大家介绍Consul的四大核心特性是什么?相关面试题,主要包含被问及Consul的四大核心特性是什么?时的应答技巧和注意事项,需要的朋友参考一下 1.服务发现:可以方便的实现服务注册,通过DNS或者HTTP应用程序可以很容易的找到他所依赖的服务. 2.Key/Value存储:使用Key/Value进行数据存储。 3.多数据中心:Consul支持开箱即用的多数据中心。这意味着用户不需要担心建立

  • 本文向大家介绍什么是事务的四大特性(ACID)?相关面试题,主要包含被问及什么是事务的四大特性(ACID)?时的应答技巧和注意事项,需要的朋友参考一下 原子性(Atomicity): 事务是最小的执行单位,不允许分割。事务的原子性确保动作要么全部完成,要么完全不起作用; 一致性(Consistency): 执行事务前后,数据保持一致,多个事务对同一个数据读取的结果是相同的; 隔离性(Isolati

  • 本文向大家介绍请说说css的三大特性是什么?相关面试题,主要包含被问及请说说css的三大特性是什么?时的应答技巧和注意事项,需要的朋友参考一下 层叠性 继承性 优先级

  • 主要内容:关系型数据库,非关系型数据库在学习数据库之前,应该先理解什么是数据。本节先介绍数据以及数据库的概念,再对关系型数据库和非关系型数据库的优缺点进行分析。 描述事物的符号称为 数据。数据有多种表现形式,可以是数字,也可以是文字、图形、图像、声音、语言等。在数据库中数据表示记录,例如,在学生管理数据库中,记录学生的信息包括学号、姓名、性别、年龄、籍贯和联系电话等,这些信息就是数据。 信息是指对数据进行加工处理后提取的对人类社会实践

  • 本文向大家介绍react是什么?它的主要特点是什么?相关面试题,主要包含被问及react是什么?它的主要特点是什么?时的应答技巧和注意事项,需要的朋友参考一下 react 是一个用于构建用户UI界面的js库,通过虚拟dom和diff算法 最大减少dom操作,提升性能

  • 问题内容: 我只是想知道数据库连接池的概念以及如何实现。 问题答案: 数据库 连接 池是一种用于保持数据库连接打开以便其他人可以重用的方法。 通常,打开数据库连接是一项昂贵的操作,尤其是在数据库是远程的情况下。您必须打开网络会话,进行身份验证,检查授权等。池化使连接保持活动状态,以便在以后请求连接时,优先使用活动的连接之一,而不必创建另一个连接。 请参阅下图,了解以下几段: 以最简单的形式,它只是

  • 当你决定看这篇文章,就意味着系统学习 数据结构的开始。本节,我们先来讲什么是 数据结构。   数据结构,直白地理解,就是研究数据的存储方式。 我们知道,数据存储只有一个目的,即为了方便后期对数据的再利用,就如同我们使用数组存储 是为了后期取得它们的加和值,无缘由的数据存储行为是对存储空间的不负责任。 因此,数据在计算机存储空间的存放,决不是胡乱的,这就要求我们选择一种好的方式来存储数据,而这也是数

  • 主要内容:Oracle数据库的版本,甲骨文公司,Oracle的历史Oracle数据库是一个关系数据库管理系统。 它也叫OracleDB或简称Oracle。 Oracle数据库由Oracle公司生产和销售。 Oracle数据库是第一个专为企业网格计算而设计的数据库。 企业网格计算提供了最灵活,最经济的方式来管理信息和应用程序。 Oracle数据库的版本 Oracle数据库主要有四个版本,如下所示 - - 企业版: 它是最强大和最安全的版本。 它提供所有功能,包括卓