范文资料网>反思报告>名词解释>《统计学名词解释与重点

统计学名词解释与重点

时间:2022-11-20 02:32:32 名词解释 我要投稿
  • 相关推荐

统计学名词解释与重点

1、数据类型:

分类数据:只能归于某一类别的非数字型数据,它是对事物进行匪类的结果,数据表现为类别,是用文字来表述。(定性数据或品质数据)

顺序数据:只能归于某一有序类别的非数字型数据。有类别,但类别是有序的。(定性数据或品质数据)

数值型数据:按数字尺度测量的观察值,其结果表现为具体的数值。现实中所处理的大多数都是数值型数据。(定量数据或数量数据)

2、截面数据:在相同或近似相同的时间点上收集的数据,这类数据通常是在不同的空间上获得的,用于描述现象在某一时刻的变化情况。

3、总体:是包含所研究的全部个体(数据)的集合,它通常由所研究的一些个体组成。可分为有限总体和无限总体。

4、样本:从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本量。

5、参数(对应总体)是用来描述总体特征的概括性数字度量,是研究者想要了解总体的某种特征值。

6、统计量(对应样本)是用来描述样本特征的概括性数字度量。是根据样本数据计算出来来的一个量,由于抽样时随机的,因此统计量是样本的函数。

7、调查方法:普查,抽样调查,统计报表

8、抽样采集数据的方式分为概率抽样和非概率抽样。

9、概率抽样:简单随机抽样、分层抽样、整群抽样、系统抽样、多阶段抽样。

10、非概率抽样:方便抽样、判断抽样、自愿样本、滚雪球抽样、配额抽样。

11、搜集数据的基本方法:自填式、面访式、电话式

12、数据的误差:抽样误差和非抽样误差

抽样误差:是有抽样的随机性引起的样本结果与总体真值的误差。

非抽样误差:相对抽样误差而言的,初抽样误差之外的,由于其他原因引起的样本观察结果与总体真值之间的差异。

13、集中趋势:一组数据向某一中心值靠拢的程度,反映了一组数据中心点的位置所在

14、众数(分类数据):是一组数据中出现次数最多的变量值,用M0表示。众数主要用于测度分类数据的集中趋势,当然也适用于作为顺序数据以及数值型数据集中趋势的测度值。众数是一个位置代表值,他不受数据中极端值的影响。从分布的角度看,众数是具有明显集中区试点的数值,一组数据分布的最高峰点所对应的数值即为众数。

15、中位数(顺序数据):一组数据排序后处于中间位置上的变量值,用Me表示。中位数主要用于测度顺序数据的集中趋势,也适用于测度数值型数据的集中趋势,但不是用于分类数据。中位数是一个位置代表字号,特点是不受极端值的影响,在研究收入分配时很有用。

16、四分位数(顺序数据):也称四分位点,是一组数据排序后处于25%(下四分位数)和75%(上四分位数)位置上的值。四分位数是通过3个点将全部数据等分为4部分,每部分包含25%的数据。

17、平均数也称均值,是一组数据相加后除以数据的个数得到的结果。

18、异众比率:非众数组的频数占总频数的比例,用Vr表示。异众比率主要用于衡量众数对一组数据的代表程度。异众比率越大,说明非众数组的频数占总聘书的比重约达,众数的代表性越差,越小,说明占总频数的比重越小,众数的代表性越好。主要是和测度分类数据的离散程度,对于顺序数据以及数值型数据也可以计算异众比率。

19、极差:一组数据的最大值与最小值只差成为极差,也称全距,用R表示。

20、平均差:也称平均绝对利差,是各变量值与其平均数离差绝对值的平均数,用Md表示。

21、标准分数:变量值与其平均数的离差除以标准差后的值成为标准分数,也称标准化值或Z分数。

22、相对离散程度:离散系数:也成为变异系数,是一组数据的标准差与其相应的平均数之比。离散系数是测度数据离散程度的相对统计量,主要是用于比较不同样本数据的离散程度。离散系数大,说明数据的离散程度也大;小,说明数据的离散程度也小。

23、偏态:是对数据分布对称性的测度。测度偏态的统计量是偏态系数,记作SK。如果分布式对称的,则偏态系数等于0。大于1或小于-1,成为高度偏态分布,在0.5-1或-1到--0.5,被认为是中等偏态分布;越接近0,偏斜程度越低。0.4表示右偏,偏斜程度不大。SK为正值时,表示正离差值较大,可以判断为正偏或右偏;负值时,表示负离差值较大,判断为负偏或左偏。数值越大,偏斜程度越大。

24、峰态:是对数据分布平峰或尖锋程度的测度。测度峰态的统计量是峰态系数。峰态通常是与标准正态分布相比较而言的。服从标准正态分布,峰态系数的值等于0;不等于0,表明分布比正态分布更平或更尖,通常称为平峰分布或尖峰分布。当K>0,尖峰分布,数据的分布更集中;小于0,扁平分布,数据的分布越分散。

《统计学名词解释与重点》全文内容当前网页未完全显示,剩余内容请访问下一页查看。

25、中心极限定理:设从均值为,方差为(有限)的任意一个总体中抽取样本量为n的样本,当n充分大是,样本均值X的抽样分布近似服从均值为,方差为/n的正态分布。

26、区间估计:是在点估计的基础上,给出总体参数估计的一个区间范围,该区间通常由样本统计量加减估计误差得到。

27、置信区间:在区间估计中,由样本统计量所构造的总体参数的估计区间称为置信区间,区间的最小值称为置信下限,最大值称为置信上限。

28、置信水平:如果将构造置信区间的步骤重复多次,置信区间中包含总体参数针织的次数所占的比例称为置信水平,为成为置信度或置信系数。

29、评估估计量的标准:无偏性(小样本中)、有效性(小样本中)、一致性(大样本中)。 无偏性:估计量抽样分布的数学期望等于被估计的总体参数。

有效性:对同一总体参数的两个无偏估计量,有更小标准差的估计量更有效。

一致性:随着样本量的增大,点估计量的值越来越接近被估计总体的参数。

30、t分布:类似正态分布的一种对称分布,通常要比正态分布平摊和分散。一个特定的t分布依赖于称之为自由度的参数。随着自由度的增大,t分布也逐渐趋于正态分布。

31、匹配样本:一个样本中的数据与另一个样本中的数据相对应。

32、错误(弃真错误):原假设H0为真却被我们拒绝了,烦这种错误的概率用表示

33、错误(取伪错误):原假设为伪我们却没有拒绝,犯这种错误的概率用表示。

34、P值:当原假设为真时所得到的样本观察结果或更极端结果出现的概率。P值越小,我们拒绝原假设的理由越充分。

统计学名词解释2017-04-09 08:52 | #2楼

1、统计学是收集、分析、表述和解释数据的科学。

2、社会统计方法是指搜集、整理与分析资料的研究技术或手段。

3、大量观察是就总体中足够多的单位进行调查和综合分析,用以反映社会总体的数量特征,大量观察法是统计调查阶段的重要方法。

4、统计按其内容主要包括两个方面:描述统计和推断统计。

5、描述统计就是讨论范围仅以搜集的资料本身为限,而不予以扩大,是统计分析方法的基础。内容有搜集数据、整理数据、展示数据、描述性分析,目的在于描述数据特征、找出数据的基本规律。

6、推断统计主要是依据概率论,研究如何依据有限资料对总体性质作推断,从而使统计的功能大为扩充。内容有参数估计和假设检验,目的在于对总体特征作出推断。

7、参数估计,即由样本的指标数值推断总体的相应的指标数值,包括点估计和区间估计。

8、假设检验,即就社会研究中提出的某种假设应用抽样方法来加以统计检验。

9、程序是指研究工作的顺序和步骤,是人们根据客观法则和人的认识规律而作出的一种逻辑安排。

10、社会统计工作的程序:①制定计划 ②统计调查 ③统计整理 ④统计分析 ⑤统计报告

11、统计调查就是按照统计研究所预定的目的和任务,运用各种调查的组织形式,有组织、有计划地向调查对象搜集原始资料的工作过程。

12、统计整理就是根据统计研究的目的和任务,对调查所得的资料进行加工整理,使之条理化、系统化。

13、统计分析是对研究对象进行定量分析。

14、统计报告就是将所得结果用文字报告的形式表达出来。

15、统计数据是对现象进行计量的结果,不是指单个的数字,而是由多个数据构成的数据集,不仅仅是指数字,它可以是数字的,也可以是文字的。

16、统计数据的分类:①按计量层次分:分类数据、顺序数据、数值型数据 ②按收集方法分:观察的数据、试验的数据

③按时间状况分:截面数据、时序数据

17、分类数据:对事物进行分类的结果,数据表现为类别,用文字来表述,例如,人口按性别分为男、女两类。

18、顺序数据:对事物类别顺序的测度,数据表现为类别,用文字来表述,例如,产品分为一等品、二等品、三等品、次品等。

19、数值型数据:对事物的精确测度,结果表现为具体的数值,例如:身高为175cm、168cm、183cm。

20、观测的数据:通过调查或观测而收集到的数据,在没有对事物人为控制的条件下而得到的,有关社会经济现象的统计数据几乎都是观测数据。

21、试验的数据:在试验中控制试验对象而收集到的数据,比如,对一种新药疗效的试验,对一种新的农作物品种的试验等,自然科学领域的数据大多数都为试验数据。

22、截面数据:在相同或近似相同的时间点上收集的数据,描述现象在某一时刻的变化情况,比如,2002年我国各地区的国内生产总值数据。

《统计学名词解释与重点》全文内容当前网页未完全显示,剩余内容请访问下一页查看。

23、时间序列数据:在不同时间上收集到的数据,描述现象随时间变化的情况,比如,1996年至2002年国内生产总值数据。

24、总体,就是作为统计研究对象的、由许多具有共性的单位构成的整体,构成总体的每一个个体称为总体单位,简称单位,也称为个体。也可以说是所研究的全部元素的集合,其中每一个元素称为个体。总体具有三个基本特征:大量性、同质性和变异性。

25、总体按其包括的单位的数目是有限还是无限,分成有限总体和无限总体。有限总体的范围能够明确确定,且元素的数目是有限的,无限总体所包括的元素是无限的,不可数的。

26、无限总体是指在一个合理时间内不能将全部单位一一列举。

27、样本是从总体中抽取的一部分元素的集合,构成样本的元素的数目称为样本容量。从总体中选出样本的过程叫做抽样。

28、总体的每个单位都具有许多属性和特征,说明总体单位属性或数量特征的名称在统计上称为标志。如在学生总体中,每个学生的性别、籍贯、年龄、文化程度、民族等特征,就是该总体单位的标志。

29、凡能用数量的多少来表示的标志,称为数量标志,如年龄,它们用以说明事物量的规定性。

30、凡不能用数量的多少来表示而只能用文字表述的标志,称为品质标志,如性别,它们用以说明事物质的规定性。

31、标志按变异情况可以分为不变标志和可变标志。

32、不变标志是构成总体同质性的基础,任何个体只有在某些预设的不变标志的基础上才能集合成一个总体。

33、可变标志是统计研究真正所关心的,可变的品质标志无法用数值表示,我们称之为变项;可变的数量标志能够用数值表示,我们称之为变量。

34、变量是可变的数量标志,如年龄;变量值是它的大小,如某甲年龄是18岁,某乙年龄时25岁等等。

35、通过调查得来的关于某一数量标志的一系列数值,在统计上又称数据。

36、变量的取值有连续和非连续之分。凡是相邻的两个变量值之间可以连续不断分割的变量,称为连续变量。凡是各变量值之间是以整数断开的变量,称为离散变量。离散变量可以精确计算,其值可以是精确值。连续变量不可能精确计量,其值都是近似值。

37、分类变量:说明事物类别的一个名称。

38、顺序变量:说明事物有序类别的一个名称。

39、数值型变量:说明事物数字特征的一个名称。

40、当品质标志的变异性用离散变量来表达时,这个变量可称为虚拟变量。此时,其数值大小只是代码,并无真实意义。

41、自变量是作为变化依据的变量,而因变量是随自变量而发生对应变化的变量。

42、变量按其性质分又可分为确定型变量和随机变量。在相同条件下进行观测,其可能实现的值(或观测值)不止一个,有这种性质的变量称为随机变量。确定型变量条件一定,实现的值就确定了。

43、统计指标是反映总体(或样本总体)的数量特征的概念或范畴。例如中国国土面积是9.6*10^6 km^2,其中“中国国土面积”是指标名称,“9.6*10^6 km^2”则是指标数值。

44、统计指标按其内容或作用分,可分为数量指标和质量指标。数量指标说明总体在外延上的数量特征,如人口总数、居民收入、产品产量等,一般都以总量指标的形式出现。质量指标说明总体在内涵上的数量特征,如人口密度、劳动生产率、产品价格等,一般都以相对指标或平均指标的形式出现。

45、统计指标按其数值的三种表现形式,又有总量指标、相对指标和平均指标之分。总量指标一般由统计汇总而来,它是研究问题的基础。相对指标和平均指标一般由总量指标派生而来。

46、参数:研究者想要了解的总体的某种特征值。

47、统计量:根据样本数据计算出来的一个量。

48、典型的统计软件:SAS、SPSS、MINITAB、STATISTICA、Excel

【统计学名词解释与重点】相关文章:

统计学名词解释09-23

统计学名词解释整理09-23

统计学简答名词解释09-23

社会统计学名词解释09-23

淘宝重点名词解释09-23

卫生统计学名词解释09-23

建筑常识名词解释重点09-22

毛概名词解释辨析重点09-23

病理学重点及名词解释02-27

预防医学重点名词解释09-23