励普教育励普教育合作机构>郑州培训学校>郑州中原区达内IT培训机构
郑州中原区达内IT培训机构
全国统一学习专线 8:30-21:00
位置:励普教育 > 计算机设计类>大数据> 大数据的概念与特征  正文

大数据的概念与特征

发布时间:2022-02-22 14:54:59来源:励普教育综合

大数据的概念与特征你知道吗?随着互联网的飞速发展,特别是近年来随着社交网络、物联网、云计算以及多种传感器的广泛应用,以数量庞大,种类众多,时效性强为特征的非结构化数据不断涌现,数据的重要性愈发凸显,传统的数据存储、分析技术难以实时处理大量的非结构化信息,大数据的概念应运而生。

大数据的概念与特点:

大数据是一个较为抽象的概念,正如信息学领域大多数新兴概念,大数据至今尚无确切、统一的定义。在维基百科中关于大数据的定义为:大数据是指利用常用软件工具来获取、管理和处理数据所耗时间超过可容忍时间的数据集。

IDC在对大数据作出的定义为:

大数据一般会涉及2种或2种以上数据形式。它要收集超过100TB的数据,并且是高速、实时数据流;或者是从小数据开始,但数据每年会增长60%以上。这个定义给出了量化标准,但只强调数据量大,种类多,增长快等数据本身的特征。研究机构Gartner给出了这样的定义:大数据是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。这也是一个描述性的定义,在对数据描述的基础上加入了处理此类数据的一些特征,用这些特征来描述大数据。

大数据有四个基本特征:

数据规模大( Volume) ,数据种类多( Variety) ,数据要求处理速度快( Velocity) ,数据价值密度低( Value),即所谓的四V特性。

这些特性使得大数据区别于传统的数据概念。大数据的概念与“海量数据”不同,后者只强调数据的量,而大数据不仅用来描述大量的数据,还更进一步指出数据的复杂形式、数据的时间特性以及对数据的分析、处理等专业化处理,较终获得有价值信息的能力。

(一)数据量大

大数据聚合在一起的数据量是非常大的,根据IDC的定义至少要有超过100TB的可供分析的数据,数据量大是大数据的基本属性。导致数据规模激增的原因有很多,首先是随着互联网络的广泛应用,使用网络的人、企业、机构增多,数据获取、分享变得相对容易,以前,只有少量的机构可以通过调查、取样的方法获取数据,同时发布数据的机构也很有限,人们难以短期内获取大量的数据,而现在用户可以通过网络非常方便的获取数据,同时用户在有意的分享和无意的点击、浏览都可以的提供大量数据;其次是随着各种传感器数据获取能力的大幅提高,使得人们获取的数据越来越接近原始事物本身,描述同一事物的数据量激增。

(二)数据类型多样

数据类型繁多,复杂多变是大数据的重要特性。以往的数据尽管数量庞大,但通常是事先定义好的结构化数据。结构化数据是将事物向便于人类和计算机存储、处理、查询的方向抽象的结果,结构化在抽象的过程中,忽略一些在特定的应用下可以不考虑的细节,抽取了有用的信息。

(三)数据处理速度快

要求数据的处理,是大数据区别于传统海量数据处理的重要特性之一。随着各种传感器和互联网络等信息获取、传播技术的飞速发展普及,数据的产生、发布越来越容易,产生数据的途径增多,个人甚至成为了数据产生的主体之一,数据呈爆炸的形式增长,新数据不断涌现,增长的数据量要求数据处理的速度也要相应的提升,才能使得大量的数据得到有效的利用,否则不断激增的数据不但不能为解决问题带来优势,反而成了解决问题的负担。

更多培训课程: 郑州大数据 更多学校信息: 郑州中原区达内IT培训机构 咨询电话:

相关内容: 大数据 大数据的概念 大数据的特征

同类文章
导航

雅思 托福 GRE 托业 SAT GMAT A-Level ACT 多邻国英语测试 OSSD 英语四六级 词汇 职称英语 英语口语 商务英语 考研英语 青少儿英语 成人英语 个人提升英语 少儿英语 初高中英语 剑桥英语 一级建造师 二级建造师 消防工程师 消防设施操作员 BIM 造价工程师 环评师 监理工程师 咨询工程师 安全工程师 建筑八大员 注册电气工程师 一级注册建筑师 公路水运检测 通信工程 装配式工程师 二级注册建筑师 智慧消防工程师 智慧建造工程师 全过程工程咨询师 EPC工程总承包 碳排放管理师 初级会计师 中级会计师 注册会计师(cpa) CFA ACCA CMA 基金从业 证券从业 会计证 初中级经济师 薪税师 企业合规师 会计就业 教师资格 人力资源管理 导游考试 心理咨询师 健康管理师 家庭教育指导师 普通话 营养师 物流师 网络主播 专利代理师 教师招聘 少儿编程 书法培训 国学启蒙 绘画美术 音乐 舞蹈 棋类 国画 乐器 机器人编程 小孩子注意力训练 儿童专注力 儿童情绪管理 少儿小主播 信奥赛C++