统计学的性质及分类
1. 统计学的性质
(1)统计学的概念统计学是研究如何有效地搜集数据、整理数据、分析或推断数据,并以此为依据对所研究对象做出判断或者决策的一门方法论科学。
(2)统计学的性质及其具体要点统计学的性质:统计学是一门研究客观现象总体的数量表现及其变动规律的方法论科学。
具体要点可概况为:
① 统计学研究的客观现象包括社会经济现象和自然现象。
② 统计学研究的是总体现象的数量表现及其规律。
③ 统计学是一门研究数量方面的方法论科学。
2. 统计学的分类
(1)理论统计学和应用统计学
① 理论统计学从统计学理论方面来看,由于受客观现象的复杂性、多样性以及随机性等因素的影响,人们在认识数量方面时,常常受到研究方法的制约,这就需要应用相关科学的基本理论与数学原理,寻求研究客观现象数量方面的具体方法,并从理论上对其加以科学论证,使其真正成为科学的方法论。这些科学的理论和方法构成了理论统计学的主要内容。
② 应用统计学从统计学应用方面看,统计学又是一门应用性非常强的科学。在人类活动的一切领域中都能不同程度地找到统计方法的应用。例如:统计方法在国民经济领域中的应用形成了国民经济统计学;在生物领域中的应用形成了生物统计学;在人口研究和管理中的应用形成了人口统计学;等等。所有这些都属于应用统计学的主要内容。理论统计学所提出的科学的数量方法为应用统计学研究提供了理论依据和条件,而应用统计学的发展又可进一步改进、完善和发展理论统计学所提出的数量方法.
2)描述统计学和推断统计学统计学按所处的发展阶段和采用的研究方法不同,可分为描述统计学和推断统计学。
① 描述统计学:
研究如何对客观现象的数量进行计量、观测、概括和表述。描述统计学是整个统计学的基础和统计研究工作的第一步,其内容包括统计指标及其设计、统计调查、统计整理、统计图表、集中趋势测度、离散程度测度、统计指数和时间序列常规分析等理论方法。
② 推断统计学:
研究如何根据总体中的部分数据(样本指标)去推断总体数据(总体参数)的方法。推断统计学是现代统计学的核心内容,它以概率论为理论依据,利用部分数据对总体数据的某些性质或数量特征进行推断和检验。其主要内容包括概率与概率分布、抽样分布、参数估计、假设验证、方差分析、相关与回归分析、统计预测和统计决策等。一般来说,描述统计学和推断统计学是统计方法的两个组成部分。描述统计学是整个统计学的基础,推断统计学则是现代统计学的主要内容。
统计学的基本概念
1. 总体和个体
(1)总体和个体的概念统计活动就是通过对所研究对象进行观测取得其数据资料,并对这些数据资料加以整理和分析推断的过程。构成统计活动研究对象的全部事物所组成的整体,就称为统计总体,简称总体或母体。总体中的每个个体事物则称为个体。总体中全部个体事物的数量称为总体容量,通常用N表示。
(2)统计总体分类
① 一种总体是由自然物体所组成的总体。另一种总体是由变量值所组成的总体。
② 有限总体和无限总体如果总体中只包含有限个个体,即总体容量是一个有限数,则称为有限总体。如果总体中包含有无限多个个体,即总体容量无穷大,则称为无限总体。确定统计总体就是确定统计活动的研究对象及范围,这需要根据统计研究的目的来进行。研究目的不同,统计总体往往也不同。在出现总体中个体不明显情形,一般将每个观察单位看作一个个体,而观察单位的大小以及计量方法则根据观察手段而定。
2. 样本
(1)总体和样本的概念通常将所要研究事物全体构成的集合称为总体。样本是指从总体中随机抽取出来,并作为其代表的那一部分个体所组成的子集。构成样本的个体数目称为样本容量,通常用n表示。虽然样本单位数相对总体而言只是很少一部分,但样本是从总体中抽取并代表总体的,基于这种关系,总体又可称为母体,而样本可称为子样。样本也是由一部分个体所构成,它也属于总体的范畴。为了便于区别,通常将由样本构成的总体称为抽样总体。
(2)样本的特点
① 样本中的每个个体都必须取自于总体的内部。
② 从一个总体中可以抽取许多个不同的样本。总体是唯一确定的,而样本则是不确定的,一般情况下,从一个总体中能抽取许多个容量相同的不同样本。
③ 样本是总体的代表。抽取样本的目的是用它来推断总体。
④ 样本的随机性。从总体中抽取样本,不受调查者主观因素的影响,总体中的每个个体被抽中与不被抽中完全是由随机因素决定的。
3. 变量
(1)变量的概念变量是统计学中一个常用概念,变量的概念有广义与狭义之分:
① 广义的变量
是指对客观现象进行计量的概念,凡是客观现象的特征取值或类别在一个以上者,均可定义为变量。它包括可以用数字表示变量取值的数字变量,如年龄、收入和消费支出等;也包括不能用数字计量、只能用类别表示的属性变量,如反映人口特征的性别,产品质量的合格与不合格等。
② 狭义的变量
仅指可用具体数字表示取值的数字变量。
(2)变量的特征
① 变量是用于研究总体和个体具有属性变异与数值变异的量化概念。
② 变量是一个具有量化性质的概念或名称,它不是指具体的数字。变量所表现的具体数字称为变量值,变量与变量值是两个不同的概念。
③ 变量的取值有两个方面,一是在时间上取值,如历年职工工资水平;二是在空间上取值,如某一时期内不同行业或地区的职工工资水平。
(3)变量的分类
① 变量按其取值是否可用数字表示,一般分为属性变量和数字变量两种。
② 变量按其取值是否连续,可分为离散变量和连续变量。凡变量的取值只能是整数而不会出现小数时,这样的变量被称为离散变量;凡变量的取值在整数之间可以取无限的数值,即变量的数值是连续不断的,这样的变量被称为连续变量。
③ 变量按其变动是否具有确定性,可分为确定性变量和随机变量。凡变量的变动具有确定性、方向性的,则称为确定性变量;凡变量的变动没有确定的方向,并具有一定偶然性的,称为随机变量。
④ 变量按其在因果关系中所处的位置不同,可分为因变量与自变量。因变量是受其他因素影响的结果性变量,通常作为研究的目的或对象来对待,又称为被解释变量;自变量是影响因变量的各种原因性变量,又称解释变量。
⑤ 变量按其是否由研究对象体系范围内决定,可分为内生变量和外生变量。内生变量是由研究对象体系范围决定的,外生变量是由研究对象体系范围之外决定的。
⑥ 变量按其取值是否具有客观性,可分为实在变量和虚拟变量。凡取值是客观实际存在的变量,称为实在变量或实体变量。虚拟变量则是为了满足统计研究的需要,对客观现象的各类属性表现人为规定的数字,又称工具变量或开关变量。
4. 指标及其测度
在统计活动中,人们所真正关心的主要是总体的某些特征数量,而总体特征数量的数值则完全取决于总体中各个个体的相应特征数量。
(1)统计指标及其相关概念用来测度研究对象某种特征数量的概念称为统计指标,简称指标。其中,测度总体特征数量的概念称为总体指标,而测度个体特征数量的概念则称为个体指标。
(2)按个体特征将测度计量尺度分为四类,分别为:
① 定类尺度定类尺度又称为名义尺度,它是对个体进行类别划分的测度计量尺度。既不能用数值大小直接测度,又不能用等级顺序计量,而只适用划分类别来测度的计量尺度就称为名义尺度或定类尺度。定类尺度是最简单、计量层次最低的个体特征测度计量尺度,主要用于对个体品质特征的测度计量。
② 定序尺度定序尺度又称为顺序尺度,是对个体进行排序或分等基础上的测度计量尺度。这种不能直接用数值大小测度而只能用顺序等级来说明个体特征表现位次的测度计量尺度称为顺序尺度或定序尺度。
③ 定距尺度定距尺度又称为差距尺度,它是对个体特征的差距进行测量的测度计量尺度。测量得出的数值结果只是相对于某一个标准水平的差距数值,这种测度计量尺度被称为差距尺度或定距尺度。
④ 定比尺度定比尺度又称为比例尺度,它是对个体特征的绝对数量大小进行测量的测度计量尺度。5具有绝对零点的测度计量尺度称为比例尺度或定比尺度。上述四种测量计量尺度对个体特征的测量层次是依次递升的,其中定类尺度是最粗略的测度计量尺度,而定比尺度则是最精细的测度计量尺度。对于不同层次的测度计量尺度的测量结果,如果要统一化为同一层次的测度计量尺度的测量结果,则只能将高层次的测度计量尺度的测量结果转化为低层次测度计量尺度的测量结果,而不可能将低层次测度计量尺度的测量结果转化为高层次测度计量尺度的测量结果。
统计指标体系及其设计
1. 统计指标体系的概念
一个统计指标一般只能反映研究对象一个方面的特征数量,而一系列相互联系、相互补充的统计指标的集合就可以全面地反映和描述所研究对象的各个方面的特征数量。这种反映总体及其所含个体的各个方面特征数量的一系列相互联系、相互补充的统计指标所形成的体系,称为统计指标体系。
2. 统计指标体系中指标的分类
从一个统计指标体系中所包含的指标的表现形式上看,一般分为绝对数指标、相对数指标和平均数指标三大类。
2.1 绝对数指标
(1)绝对数指标的概念及其功能
① 绝对数指标的概念:是反映统计研究对象某一方面绝对数量的统计指标,通常又称总量指标。
② 绝对数的指标的功能:这类指标的主要功能是用来描述研究对象的规模大小或者水平高低,如人口数、财政收入、货币供应量、社会商品零售额、进出口总额、利润总额、存款总额等。其数值的表现形式为绝对数,都有计量单位。
(2)绝对数指标的分类
① 绝对数指标其所反映的时间状况不同,可分为时期指标(流量)和时点指标(存量)两类。
a.时期指标是反映研究对象在某一段时间内累计发生数值总量的指标,如全年社会商品零售总额、季工业增加值、月商品销售额、年新增人口数等都属于这类指标。
b.时点指标是反映研究对象在某个时点上所表现数值总量的指标。
② 时期指标与时点指标相比较具有不同的特点。具体表现在:
a.时期指标数值的大小与其所反映的时期长度有直接关系,而时点指标数值的大小与其所统计的时间间隔长短没有直接关系;
b.时期指标的前后各时期上的指标值直接相加有实际意义,而时点指标前后各时点上的指标数值直接相加没有实际意义。正确区分时期指标和时点指标,对于进行动态分析和研究具有很重要的意义。一般来说,时期指标应注意其所反映的时间长度,而时点指标则应注意其所反映的时刻或者时点。③ 由于绝对数指标的数值都使用计量单位表示,
因此,按其所使用的计量单位不同,它又可分为实物指标和价值指标两类。实物指标是指使用实物单位进行计量的指标。价值指标是指使用货币单位进行计量的指标。实物指标意义具体明确,但综合性能差,不同物品的总量不能相加汇总;价值指标综合性能强,任何物品的价值总额都可以相加汇总,但意义却比较抽象。
因此,在经济统计中,单一物品的总量往往用实物指标表示,而多种物品的总量则用价值指标表示。
2.2 相对数指标
(1)相对数指标的概念相对数指标,是指由两个相互联系的统计指标相除而得出的比率,又称为比率指标,它反映了研究对象内部各部分之间或各方面之间的相互关系。其数值表现形式有无名数和有名数两种,其中绝大部分相对指标的数值都采用无名数表现,最常用的是系数和百分数,而仅有部分强度相对指标的数值采用有名数表现。
(2)实际工作中常用相对数指标主要有以下几种:
① 结构相对指标,是指总体中部分数值与全部数值的比率,它可用来反映研究对象内部的构成状况。其计算公式为:结构相对指标=总体中部分数值/总体中全部数值
② 比值相对指标,是指某个总体对另一个总体或某个个体对另一个个体的同一指标数值的比率,它可用来反映两个总体或两个个体之间的差异程度。其计算公式为:比值相对指标=某个总体(或个体)的某个指标数值/另一总体(或个体)的同一指标数值
③ 动态相对指标,是指本期(报告期)数量与过去某期(基期)相同性质数量的比率,或者本期与过去某期相减的增长量与过去该期数量的比率,统称为动态相对指标。其计算公式为:动态相对指标=报告期水平/基期水平(或:(报告期水平-基期水平)/基期水平)
④ 弹性相对指标78弹性相对指标又称弹性系数,是指一定时期内相互联系的两个经济指标增长速度的比率,它反映一个经济变量的增长幅度对另一个经济变量增长幅度的依存关系。其计算公式为:弹性系数=一个经济变量的增长率/另一个经济变量的增长率
⑤ 强度相对指标,是指两个性质不同但有联系的总量指标值的比率。其计算公式为:强度相对指标=某一总量指标值/另一有联系但性质不同的总量指标值
3. 统计指标体系设计的内容
统计指标体系的设计是进行统计活动的前提。一般来说,统计指标体系的设计主要有下面四个方面的内容:
(1)设置统计指标体系的框架进行统计活动,首先需要根据研究的目的,确定需要对所研究总体及其所含个体的哪些方面进行观察计量,每个方面需要设置哪些指标,从而确定出指标体系的框架结构。
(2)确定每一个指标的内涵和外延任何统计指标都是一个可以测度计量的数量概念,因此,对于指标体系框架中的每个指标都必须有一个明确的定义,确切地规定出每个指标的内涵与外延。对统计指标下定义,主要应当依据研究对象所属领域的某种专业理论。统计指标的外延又称为指标口径,是指统计指标所包括的具体范围。
(3)确定每个统计指标的计量单位统计指标是对研究对象某一方面特征数量的计量测度,因而都具有计量单位。许多统计指标往往可以有多种计量单位,所以必须对其进行选择,挑选出最适当的计量单位。
(4)确定每个统计指标的计算方法统计指标的计算方法并不仅仅是一个数学方法问题,任何统计指标的计算方法都既要符合数学原理,也要符合研究目的所属领域的专业理论。
4. 统计指标体系设计的原则
在设计统计指标体系时,通常必须遵守以下几个原则:
(1)目的性原则设计统计指标体系应紧紧围绕着研究的目的,满足科学研究或生产管理的需要。即使是对于同一总体,研究目的不同,观测和分析的角度也不同,所用的统计指标也就不同。
(2)科学性原则统计指标体系的设计要符合科学的原理,准确地刻画和描述研究对象的各种特征数量。要做到这一点,不仅要考虑研究目的的所属领域的专业理论和数学原理,而且有时还必须考虑到研究对象所处的自然历史环境。
(3)可行性原则统计指标体系的设计必须实用可行,每个指标都必须能够准确地计算出指标数值。因此,设计统计指标体系时,还必须考虑到计量手段的特点和计量方法是否简便可行,使得每个统计指标的计量与计算都具有可操作性。
(4)联系性原则统计指标体系的设计,必须考虑到指标体系内各个指标之间的相互联系,避免信息的重复与遗漏。