文本“中级统计师2017《统计工作实务》要点:数据描述”由留学群统计师栏目整理,希望对考生有所帮助。
数据描述
一、用图表展示定性数据
定性数据包括分类数据和顺序数据,可能用频数分布表和图形来描述。常用饼图和条形图、环形图表示。
饼图:又称圆饼图、图形图,是利用圆形及圆内扇形面积来表示数值大小的图形。
条形图:用宽度相同的条形的高度或长度来表述数据多少的图形。
环形图:
二、用图表展示定量数据
定性数据图示的表示方法,也都适用于定量数据。定量数据有一些特定的图示方法,并不适用于定性数据。
一般的分级个数在5-15之间。最大值为上限,最小值为下限。
组距=上限-下限
采取上限不在内的原则,计算在与下限相同的组内。
常用来表述定量数据的统计图形有直方图、折线图、散点图,还有茎叶图、箱线图。
直方图:横坐标代表变量分组,纵坐标代表各变量值出现的频数。
三、用统计表来表示数据
统计表由五个部分组成:表头、行标题、列标题、数字资料和表外附加构成。
表头放在表的上方,说明的是表的主要内容;
行标题和更标题一般放在表的第一行和第一列,表示的是所研究问题类别的名称和指标名称;
表的其余部分是具体的数字资料;
表外附加放在统计表的下方,用来说明资料来源、指标注释和必要的说明内容。通常情况下,统计表的左右两边不能封口。
四、用数字来概括数据
1、对定性的集中趋势常用的方法就是计算百分比、中位数和众数。
中位数(Median),它是按照大小排列之后位于中间的那个数(如果样本量为奇数),或者中间两个数目的平均(如果样本量为偶数)
众数(MODE)是数据中出现次数或出现频率最多的数值,用得最多。
2、定量数据:
反映数据的集中趋势水平度量:平均数、中位数、众数和分位数等。
反映数据离散程度的差异度量:极差、四分位差、标准差和方差。】
平均数对于严重偏态分布的数据,代表性较差。
中位数和众位数不受极端值的影响,具有统计上的稳健性,当数据为偏态分布,特别是偏斜程度较大时,可以考虑选择中位数和众数,这时它们的代表性要比平均数好。
在一个统计样本中,其标准差越大,说明它的各个观测值分布越分散,它的趋中程度就越差。反之,其标准差越小,说明它的各个观测值分布的越集中,它的趋中程度就超好。<...