聊聊关于常用数据类型一热门基金选择二三

数据剖析师的作业中最离不开的便是数据,事务中一切的状况都离不开数据这个载体,今日就来看下数据的都有哪些类型以及它们有什么特色。

数据是用某种计量规范对事物测度的成果,选用不同的计量规范会得到不同类型的数据,数据包含:各种数字、文字、图画、音频、视频及它们的组合等多种格局。

1。数据的分类

因为事物有简略和杂乱的,如用户的表面高矮等特征较直观,用户的偏好则不直观;有的差异能够用数量衡量,有的则只能用分类衡量。所以核算量就有定性、定量之分,对核算数据的特点、特征进行分类、标明和核算叫衡量,分类见下图:

(1)定性数据,又名分类数据。它用于确认数据的特点,不支持算术运算,只用于阐明事物的质量,可能是文字或数字,能够细分为两类:

①无序数据。如:人的性别能够分为:男,女,不知道3类,也能够把它们记为0,1,2;学生的成果能够分为:及格,不及格……为了便于了解,一般可按常规来界说,也能够按详细的事务需求等。该类数据的用数字标明时仅标明不同类别的质量是什么,而不标明量的次序或巨细,该类数据规范的数学特征是“=”或“≠”。

②次序数据,无序分类数据不要求有次序,次序数据是有序的。如:空气污染能够分为:优,良,轻度污染,中度污染,重度污染,其间后边一级都比前面一级的程度更严峻,也能够用1,2,3,4,5来标识这几种分类;学生的成果也能够分为:优异,杰出,及格,不及格,后边一级的数据也都比前面的更差。此刻的规范不能标明等级的量,仅能标明其等级差异,该类数据规范的数学特征是“>”或“<”。

(2)定量数据,又称为数值型数据,用于阐明事物的数量,方式是数字,也能够分为两类,主要按数值是否接连区别:

①离散型数据,离散型是经过计数得到的,增长量不固定,比方:北京市上月的空气质量有20天是优,本月共10天优;北京市上一年净流出200万人,本年净流出100万人。它不仅能对事物区别不同的类型,还能对其排序,做数学运算。

②接连型数据,这是一向叠加上去的,增长量能够区别为固定的单位。如:人的年纪是1岁,1.2岁,1.5岁,2岁。。。。。。人的身高1.5米,1.51,1.52。。。。。。

不论是什么类型的数据,界说数据时,有逻辑地区别、表达更易让人了解、便当核算。

定性与定量数据的联系:定性数据与定量数据彼此弥补,定性是定量的条件、根据,定量使定性愈加详细、精确,结合运用才干经过比较来剖析、阐明问题。这四类数据的层次一类比一类高。

因不同类型的数据选用的处理、剖析的核算办法不同,所以区别衡量的层次、数据的类型很重要。如,对无序数据,一般核算出各组的频数或频率,核算其众数和异众比率,进队伍联表剖析和x2查验等;对次序数据,能够经过其间位数和四分位差,然后估量样本数据的整体;对离散数据还能够用更多的核算办法进行处理,如核算各种核算量、进行参数估量和查验等。

适用于低层次丈量数据的核算办法,也适用于较高层次的丈量数据,因为后者具有前者的数学特性,但前者不具备后者的特性,所以反之不成立。如:描绘数据的会集趋势时,对无序数据一般核算众数,对次序数据一般是核算中位数,但对接连、离散类的定量数据也能够核算众数和中位数。反之,关于离散和接连数据能够核算平均数,但关于无序数据和次序数据则不能核算平均数。了解这一点,则有助于剖析时挑选适宜的核算剖析办法。

2。数据的质量

数据质量的好坏乃至能决议咱们剖析的成功与否。点评数据的质量主要从内容质量、表述质量、束缚规范三方面着手。

(1)内容质量

内容质量是数据最基本的特征,包含相关性、精确性、及时性,这是数据质量的基本特征,短少其间一个,数据就失去了转化为信息的效果。

①相关性

相关性指数据是否正是用户感兴趣的核算数据,它反映了数据满意需求的程度,相关性与可用数据是否是用户最关怀的主题有关。因为对相关性的点评是片面的,会随用户需求方针的改动而改动,所以要平衡不同用户的需求方针,在给定的资源条件束缚下,尽可能满意大部分用户的大部分需求。

②精确性

精确性指观测值或估量值与不知道的实在值之间的间隔(挨近程度),一般用核算差错来衡量,它是数据质量的根底和中心。一般地,差错分为系统差错和随机差错。因可能会遭到本钱、环境等各种束缚,彻底精确几乎是不可能的。所以只要是差错已下降到用户能够承受的境地即可。

③及时性

与用户需求相关且精确的数据假如没有在用户做出决议计划之前传递给他,那么该数据对用户来说便是没用的。所以,及时性也是核算数据能否满意用户需求的重要特征。假如要核算的现象改变较快,则对该类核算数据的及时性要求高;假如该现象改变较缓慢,则对及时性要求不高。

(2)表述质量

仅考虑数据内容的质量是不行的,多个人一同做需求时,要想被人看到、看懂,必定离不开描绘需求相关的多个数据,这时就要考虑表述的质量问题。如:单个数据的内容是正确的,但表述不明晰、不充分,就会影响整套数据的质量,乃至引起误解。核算数据的表述质量包含可比性、可联接性和可了解性,这些都是咱们做需求、对外供给数据或剖析陈述时需求留意的点。

①可比性

可比性指同一项意图核算数据在时刻上、空间上的可比程度。这要求核算的概念和办法要相对安稳,运用共同的核算准则办法和分类规范,保证核算数据的口径规模、核算办法共同,可比较。

②可联接性

聊聊关于常用数据类型一热门基金选择二三

可联接性指同一核算组织内部不同项目、不同组织及与世界组织间核算数据的联接程度。这要求一切专业核算项目在共同的核算结构系统、分类规范下,按共同的办法核算、查询、加工收拾、运用共同的办法和程序,一起选用世界核算规范,如世界规范时刻等。

③可了解性

可了解性指核算数据便于用户正确了解、运用的程度。核算数据是供给给用户运用的,假如用户看不懂数据、剖析陈述,也就谈不上运用数据。为了恰当地运用从核算组织得到的数据,用户有必要了解所获得数据的性质。这就要求核算组织在供给核算数据时顺便供给对数据的弥补阐明。如:供给隐含在有关概念下面的阐明、运用到的分类办法、数据搜集和加工过程中运用的办法及核算组织本身对数据质量的点评等。

(3)束缚规范

在完成核算数据方针的过程中,除了留意核算数据的内容质量和表述质量这两方面外,还需留意以下两项束缚规范,这表现了数据的质量特征。

①可获得性

可获得性是指用户获取数据的便当程度。关于有用的数据,用户必定要考虑:能得到哪些数据,怎么得到这些数据。因而,核算数据有必要以一种用户便当运用且能够担负的方式供给给用户。这要求供给核算数据时,有必要列明用户从核算组织能够获得的核算数据内容,一起便当用户获取。

②有效性

有效性指运用核算数据所发生的效益要大于供给该数据的本钱。假如相反,则供给这种数据对供给方和运用方来说都是不值得的,这要求在核算数据的其他质量不受大的影响的条件下,尽可能下降核算数据的出产费用,进步功率。

发布于 2022-07-31 12:07:37
收藏
分享
海报
0 条评论
90
目录

    0 条评论

    请文明发言哦~