统计工作的阶段有哪几个他们之间的是什么关系8篇统计工作的阶段有哪几个他们之间的是什么关系 、简答题: 统计学综合练习题 1.统计学的研究对象是什么?有何特点? 2.统计工作过程分为哪几个阶段? 3.统计指标和标志的下面是小编为大家整理的统计工作的阶段有哪几个他们之间的是什么关系8篇,供大家参考。

篇一:统计工作的阶段有哪几个他们之间的是什么关系
、简答题:统计学综合练习题
1.统计学的研究对象是什么?有何特点?
2.统计工作过程分为哪几个阶段?
3.统计指标和标志的区别和联系是什么?
4.普查与统计报表均为全面调查,两者能否相互替代?为什么?
5.统计调查方案的基本内容有哪些?
6.什么是统计分组?有何作用?
7.什么是标志变异指标?有何作用?
8.在抽样调查中,影响抽样误差大小的因素有哪些
9.在抽样调查中,影响样本必要的样本单位数的因素有哪些?
10.相关分析和回归分析的联系和区别有哪些?
11.序时平均数和强度相对数有何区别?
12.时期数列和时点数列有哪些不同点?
13.什么是同度量因素?有什么作用?
14.编制数量指标综合指数和质量指标综合指数应遵循的一般原则是什么
、计算题:
1.某班学生上学期《统计学》考试成绩资料如下:656980597584759590776650
78828378757780818064738892
60719681867987647280707279
82817880706872687985868170
69
要求:按成绩进行分组,编制一个次数分布数列。
2.某厂两个车间生产同一产品的产量和成本资料如下:
2008年
2009年
单位成本(元)I产量
(吨)I单位成本(元)I产量(吨)
甲车间
600
乙车间
700
合计
660
要求:①计算产量结构相对指标;
200
18002000
600
400
700
1600
640
2000
②各车间单位成本不变,全厂单位成本下降20元,试分析原因。
3•某市某局所属15个企业产值计划完成情况如下表所示,求平均计划完成程度。
计划完成程度
(%90—100100—110110—120
合计
企业数(个)
58215
实际完成数(万元)
1008001001000
4.某公司下属生产同一种产品的三个企业的实际产量及完成情况资料如下:
企业甲乙丙
要求:
计划产量(件)
900
600500
计划完成(%)11010590
①根据资料计算该公司三个企业产量计划平均完成程度;②如果将资料中的计划
产量改变为实际产量,又如何计算产量计划平均完成程度?
5.已知甲班的统计学课程期末考试成绩,见下表:
按考试成绩分组
(分)
60以下60—7070—8080—90
人数
(人)
4102010
90以上
6
合计
50
又知乙班统计学课程平均考试成绩为85分,标准差为12分。试比较甲乙两
平均考试成绩的代表性高低。
6.某地区2000-2005年粮食产量资料如下:
年份
20002001
粮食产量(万吨)
400
2002
2003
2004
2005
定基增长量(万吨)
-
50
40
环比发展速度(%)
-
110
110
95
2005年期间粮食产量的年平均增长量以及按水平法计算的年平均增长速度。
要求:①利用指标间的关系将表中所缺数字补齐;②计算该地区
2001年至
7.某省2005—2009年人口资料如下表:
单位:万人
年份
年末人口数出生人口数
死亡人口数
2005
9200
131
58
2006
9355
133
60
2007
9466
120
56
2008
9550
126
59
2009
9620
120
60
计算该省2006-2009年年平均人口自然增长率。&某工厂2009年有下列资料如下表:
月份
1月
2月
3月
月初工人数(人)
300031003200
总产值(万元)
320
350380
4月3060360
要求:计算该工厂第一季度每一工人的平均月产值。
9.某企业2005年各季度产品销售计划的完成情况如下:
季
度
第一季
第二季度
度
计划销售额(万元)
850
900
销售计划完成程度(%)
130
120
试计算平均每季度产品销售计划完成程度。
第三季度
第四季度
900
1000
125
134
10•某大学12000名学生中,随机抽选10%,调查出每月看各种文艺演出的次数,其资料整理结
果如下:
观看次数(次)
0~22~44~6
占学生总人数的(%)试以95.45%的可靠程度:
82240
①估计平均每月看文艺演出的次数;
②确定每月看演出在4次以上的比重,其误差不超过3%。
6~88~10255
11.某洗衣机厂随机抽选100台洗衣机进行质量检验,发现有5台不合格。要求以95.45%(t=2)的概率保证程度推断这批洗衣机的不合格率的区间。
12.
表:
耐用时间(小时)
1000以下1000—12001200—14001400-16001600以上
合计
为检查某批电子元件的质量,随机抽取
1%勺产品,将测得结果整理成如下
电子元件数(只)
301002508040500
试以95.45%的概率(t=2)估计该批电子元件的平均耐用时间置信区间。
13.某地区的八家百货商店,每人平均销售额和利润率资料如下:
商店编号
每人平均销售额
利润率(%)
12345
67
8
要求:①计算相关系数;
(元)
62004300
800012004500
600034007000
12.64
18.53.08.112.56.2
16.8
②建立以利润率为因变量的直线方程,并计算估计标准误差。
14.某公司所属8个企业的产品销售资料如下表:
企业编号
产品销售额(万元)销售利润(万元)
1
160
8
2
250
13
3
400
18
4
430
22
5
480
26
6
650
40
7
950
64
8
1000
70
要求:
①确定利润额对产品销售额的直线回归方程,说明回归系数的含义。
②确定产品销售额为1200万元时利润额的估计值。
15.某企业生产甲乙两种产品,其产量资料及对A种材料的单耗资料如下:
产品
计量
产量
单耗(公斤)
单位
上月
本月
上月
本月
甲
台
1200
1380
20
19
乙
套
500
550
8
7
计算并分析A种材料总消耗量的变动受产品产量及单耗变动的相对影响程度
及影响的绝对量。
16.某企业三种产品的成本资料如下表:
产品名称
生产总成本(万元)
第一季度
第二季度
第二季度成本比第
篇二:统计工作的阶段有哪几个他们之间的是什么关系
统计学原理与实务知识点第一章绪论
1、统计有三种含义,即统计工作、统计资料和统计科学。统计工作,即统计实践,是为了反映所研究的客观事物的某种数量特征及其
规律性,对从事社会、政治、经济、科技、文化、国防、人口及自然现象的数据资料进行搜集、整理和分析的活动过程。
统计资料,是统计工作活动过程所获得的各种有关数字资料以及与之相联系的其他资料的总称。
统计学,即统计理论,是研究如何收集、整理统计资料,并分析研究客观事物在一定条件下的数量特征及其规律性的方法和科学。换言之,统计学是关于认识社会现象总体、数量特征及其规律的方法论科学。2、统计工作、统计资料和统计学三者之间的关系(1)统计工作与统计资料是统计活动过程与活动成果的关系。(2)统计工作与统计学是统计实践与统计理论的关系。(3)统计学和统计资料是统计分析和目的的关系。3、统计的发展过程:(1)古典统计学时期(2)近代统计学时期(3)现代统计学时期4、统计的特点
(一)数量性(二)总体性(三)变异性(四)社会性5、统计的职能(1)信息职能(2)咨询职能(3)监督职能6、统计的作用(一)统计是社会认识的一种有力武器(二)统计可以引导国民经济健康有序发展(三)统计是制定政策的依据(四)统计是实行管理的手段(五)统计是认识世界、开展国际交流和科学研究的工具7、统计学的分类(1)按统计研究的性质不同分为:理论统计学和应用统计学。(2)按统计方法的特点不同分为:描述统计学和推断统计学。8、统计的工作过程:(1)统计设计阶段(2)统计调查阶段(3)统计整理阶段(4)统计分析阶段
9、统计研究的基本方法
(1)大量观察法
(2)统计分组法
(3)综合指标法
(4)统计模型法
(5)归纳推断法
10、统计总体:简称总体,是指统计调查研究的对象是客观存在的、具有某种共
同性质的许多个别事物所构成的整体。
11、总体的特征:
(1)大量性
(2)同质性
(3)差异性
12、总体单位:简称单位,是指构成总体的每个个体是总体的基本单位。
13、单位标志:简称标志,是指总体中各单位所共同具有的属性和特征。
14、单位标志的分类:
(1)按标志是否存在差异分为不变标志和可变标志。
(2)按标志表现的特征不同分为品质标志和数量标志。
15、标志表现:是指某一标志在总体各单位的具体表现
16、标志表现的分类:
标志表现按表现特征分为:品质标志表现和数量标志表现
(1)品质标志表现:只能用文字来表示
(2)数量标志表现:可以用数值来表示(标志值)
17、变异:可变标志的属性或特征由一种状态变到另一种状态,即标志的具体表
现在总体各单位间的差别,统计上称之为。
18、变量:可变的数量标志称为变量。
19、变量值:变量的具体表现称为变量值,又称标志值。
20、变量和变量值的分类
(1)变量按其数值形式的不同分为连续型变量和离散型变量。
(2)变量按其性质不同分为确定性变量和随机性变量。
21、统计指标:简称指标,反映总体数量特征的概念和数值,是对在现实生活中
大量存在的、反复出现的具体社会经济现象的某些共同点加以概括所形成的基本
概念。
22、统计指标的分类:
(1)按总体现象的内容分为:数量指标和质量指标
数量指标和质量指标都可以用数值表示。
(2)按数值的形式不同分为:绝对数指标、相对数指标和平均数指标。
23、统计指标的特点:
(1)数量性(2)综合性
(3)具体性
24、统计指标的分类:
(1)按总体现象的内容分为:数量指标和质量指标
(2)按数值的形式不同分为:绝对数指标、相对数指标和平均数指标。
25、标志和指标的主要区别是:
(1)标志是说明总体单位特征的,而指标是说明总体特征的;
(2)标志有不能用数值表示的品质标志与能用数值表示的数量标志,然而不
论什么指标,都是用数值表的。26、标志与指标的主要联系是:
(1)有些统计指标的数值是从总体单位的数量标志值汇总得到的,如一个县的粮食实际入库总产量是所属各乡村粮食实际入库量的汇总数,一个工业主管局的总产值是所属各企业总产值的总和等等;
(2)在一定的研究范围内指标和数量标志之间存在着变换关系,当研究目的改变,原来的总体如变为总体单位,则相应的统计指标就变为数量标志了,反之亦然。27、指标体系:是各种相互联系的统计指标群体所构成的整体,用来说明所研究的社会经济各方面相互依存和相互制约的关系。28、统计指标体系的分类:(1)按研究问题范围的大小分为:宏观统计指标体系和微观统计指标体系(2)按反映的内容不同分为:基本统计指标体系和专题统计指标体系
第二章统计数据搜集
1、统计数据的收集:是指按照预定的统计任务,运用科学的统计方法,有计划、有组织地向客观实际搜集数据资料的过程。2、统计数据收集的意义
从统计工作的全过程来看,数据搜集是获得感性认识的阶段,它既是对现象总体认识的开始,也是进行统计整理和分析的基础环节。3、统计数据资料的来源:(1)直接来源
统计数据的直接来源主要有两个渠道:一是调查或观察;二是实验。调查是取得社会经济统计数据的主要手段,包括统计部门进行的统计调查、其他部门或机构为特定目的而进行的专门调查等。(2)间接来源
如果调查者不是直接进行调查或实验得到第一手资料,而是通过其它渠道使用别人的调查成果,称为统计数据资料的间接来源,所搜集的数据资料称为第二手资料。这些第二手资料主要见诸于各种媒体的有关数据资料。4、间接来源的统计数据也可以直接使用5、统计数据的质量要求(1)对于第一手资料(原始资料)其质量要求一般有三个方面:准确性、完整性、及时性。(2)对于第二手资料(次级资料)要进行有效地加工、取舍。6、统计调查是一项复杂、严格、高度统一的工作。为了在调查过程中统一认识、统一内容、统一方法、统一步骤、确保调查质量,在调查前需制定一个周密的调查方案。调查方案是统计设计在调查阶段的具体化。7、调查方案包括以下内容:(1)确定调查目的(2)确定调查对象和调查单位(3)确定调查项目,设计调查表(4)明确调查时间与调查时限(5)制定调查的组织实施计划
8、统计调查的种类(1)按调查对象的范围不同,统计调查分为全面调查和非全面调查。(2)按调查登记的时间是否连续,统计调查分为连续调查和不连续调查。(3)按调查组织形式不同,统计调查分为统计报表和专门调查。9、普查
普查是专门组织的一次性的全面调查,如全国人口普查、全国经济普查、全国工业普查、全国农业普查等。普查一般用于搜集一定时点上的社会经济现象总量,有时也不排除调查一些时期现象。10、普查特点:(1)能获得全面、详尽、系统的统计资料。(2)涉及面广、工作量大,需要的人力、物力较多,组织工作也比较复杂。11、组织普查工作必须遵循的原则:(1)必须统一规定调查资料所属的标准时点。(2)正确确定调查期限、选择登记时间。(3)规定统一的调查项目和计量单位。(4)普查尽可能按一定周期进行,以便于研究现象的发展趋势及其规律性。12、抽样调查
抽样调查是按随机原则从总体中抽取一部分单位进行观察,用这部分单位指标数值来推算总体的指标数值的一种调查方式。它是专门组织的非全面调查,是非全面调查中最主要的一种组织形式。13、工商局对超市的商品进行检查,最适宜的调查方法是抽样调查。14、抽样调查特点:(1)按随机的原则抽取一部分调查单位。(2)是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体,而不是用随意挑选的个别单位代表总体。(3)所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证。(4)抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高。(5)由部分推算总体,即由样本的数量特征推算总体的数量特征。15、抽样调查相对于全面调查或其他非全面调查具有明显的优势,具体表现在:(1)经济性。(2)时效性强。(3)准确性高(4)适用面广。16、抽样调查的组织形式主要有以下几种:(1)简单随机抽样
简单随机抽样又称纯随机抽样,它是指对总体不作任何处理,不进行分类也不进行排除,而是完全按随机的原则,直接从总体中抽取样本单位加以观察。
从理论上说,简单随机抽样是最符合抽样调查的随机抽样。(2)等距抽样
等距抽样又称机械抽样或系统抽样。它是将总体全部单位按某一标志排队,而后按固定的顺序和相等间隔在总体中抽取若干样本单位,构成一个容量为n的样本。
此法的优点是抽样样本分布比较好,有好的理论,总体估计值容易计算。
(3)分层抽样
分层抽样又称类型抽样。它是根据某些特定的特征,将总体分为同质、不相
互重叠的若干层,再从各层中独立抽取样本,是一种不等概率抽样。
(4)整群抽样法
整群抽样是先将总体单元分群,可以按照自然分群或按照需要分群,随机选
择群体作为抽样样本,调查样本群中的所有单元。
(5)多阶段抽样法
多阶段抽样是采取两个或多个连续阶段抽取样本的一种不等概率抽样。
17、统计报表:是按照国家的统计报表制度与要求,自上而下统一部署,自下而
上定期提供基本统计资料的一种调查方法。
18、统计报表最大特点是统一性,即要求统一的表式、统一的指标项目、统一的
报送时间。
19、目前我国的统计报表,由国家统计报表、业务部门统计报表和地方统计报表
三部分组成。
20、统计报表按报送周期长短,可分为日报、旬报、月报、季报、半年报、年报
等。
21、重点调查:是当统计总体中存在重点单位时,在所要调查总体的全部单位中,
选择一部分重点单位进行调查,用对一部分重点单位调查的结果,来掌握统计总
体的基本情况的统计调查方法。
22、典型调查:是在对所研究现象进行初步分析的基础上,有意识地选择若干典
型单位进行调查的一种非全面调查,其目的是认识现象发展变化的规律。
23、典型调查一般有两种形式:一种是解剖麻雀式;一种是划类选典式。
24、典型调查在实践中往往与其他调查结合运用。
25、数据资料的搜集方法
(1)询问法
(2)报告法
(3)观察实验法
26、调查误差的种类:
(1)登记误差:是调查过程中工作的不准确所造成的误差。
(2)代表性误差:是非全面调查所固有的。非全面调查由于只调查总体的个别
或部分单位,这部分单位不能完全反映总体的性质,就产生了误差。通常所说的
代表性误差是对抽样调查而言。
27、调查资料的检查方法
(1)逻辑检查:即检查调查资料是否合理,项目之间有无矛盾,以及数字之间
的平衡关系。
(2)计算检查:检查调查表和统计报表中各项指标数字的计算方法、计算口径、
计算结果有无差错,是否符合规定。
此外,还要检查调查资料的完整性和及时性。
28、撰写书面调查报告的基本要求
(1)实事求是
(2)符合经济规律及有关政策的规定
(3)观点与数据要结合运用
29、调查报告的格式一般是由:标题、概要、正文、结尾、附件几部分组成。
30、某自行车企业对其产品质量进行调查,其调查单位是每辆自行车。
31、设某人口普查的标准时点规定为7月1日零点,并以常住人口为普查对象,
在标准时点后几天,调查人员遇到下列情况(1)7月3日在第一家调查时,得知这家7月2日死去1人,在普查表上不列为死亡(2)同日在第二家遇到婚礼,10天以前,新婚夫妇办理好结婚登记,调查人员应登记这对青年人已婚(3)7月4日到第三家,这家6月30日出生1个小孩,在调查表中应对该小孩进行登记(4)7月4日到第四家,户主告诉调查员:他在7月1日已办理离婚手续,对被询问者的婚姻状况应填写没有离婚(5)7月5日在第五家,遇到户主的儿子从外地回家探亲,户主对调查员说:他儿子6月25日后回家后在派出所办理了一个月的临时户口,他的户籍应登记临时户口。
第三章统计数据整理与显示
1、统计数据整理:即统计整理,就是根据统计研究的任务,对搜集得到的原始数据进行审核、分组、汇总,使之条理化,系统化,变成能反映各组及总体特征的综合数据的工作过程。对已整理过的资料(包括历史资料)进行再加工也属于统计整理。
3、统计数据整理的步骤(1)拟定整理方案(2)数据预处理(3)统计分组或分类(4)统计汇总(5)编制统计表、绘制统计图4、数据预处理:是在数据分组或分类之前所做的必要处理,包括数据的审核和筛选。5、数据整理的关键在于对调查资料进行分组。6、统计汇总:在统计分组基础上,将所有数据分别归纳到各组中去,计算各组单位数和总体单位数,计算出各组指标和总体指标的数值,使反映总体单位的资料转化为反映总体综合数量特征的过程称为统计汇总或数据汇总。7、统计表和统计图是数据整理结果的基本表现形式,可以更加直观、简明地反映客观现象数量方面的具体表现和有关联系,便于进一步的数据分析。8、统计分组:根据统计研究目的和现象的内在特点,将现象总体按照某一(或某些)标志划分为性质不同的组成部分,称为统计分组或分类。9、统计分组的作用(1)统计分组整理后,可以发现其特点与规律(2)划分社会经济类型(3)研究总体内部的结构(4)分析现象之间的依存关系10、统计分组的方法(1)正确选择分组标志
(2)按品质标志或按数量标志分组(3)简单分组和复合分组(4)统计分组体系11、统计分组根据分组标志的性质不同可分为按品质标志分组和按数量标志分组。12、按品质标志分组即定性数据的分组;按数量标志分组即定量数据的分组。13、按品质标志分组:就是用反映事物的属性、性质的标志分组,它可以将总体单位划分为若干性质不同的类型。例按职工性别、民族、文化程度的分类。14、品质标志分组一般较简单,分组标志一旦确定,组数、组名、组与组之间的界限也就随之确定。有些复杂的品质标志分组可根据统一规定的划分标准和分类目录进行。15、按数量标志分组的目的并不是单纯确定各组在数量上的差别,而是要通过数量上的差别来区分各组的性质,反映总体本质的特征。16、数量标志分组方法包括以下几个方面(1)单项式分组和组距式分组(2)等距分组和不等距分组(3)组限重叠和组限不重叠的分组17、组距式分组有等距分组和不等距分组之分。各组的组距都相等的分组,称为等距分组。各组组距不都相等的分组,称为不等距分组,也叫异距分组。如果变量值变动比较均匀,则可以采用等距分组;如果变量值变动很不均匀,变动幅度较大,则需要采用不等距分组。18、在组距式分组中,如果数值中有极大值或极小值存在,为避免出现空白组或个别极端值被漏掉,第一组和最后一组可以采用“xx以下”及“xx以上”这样的开口组。
例如:90%以下、90%-100%、100%-110%、110%以上19、组距式分组掩盖了组内数据分布的状况,为反映各组数据的一般水平,通常用组中值作为该组数据的一个代表值。每组上下限之间的中点数值称为组中值,即组中值=(上限+下限)/2.开口组的组中值一般是参考相邻组的组距计算,公式为:缺下限的开口组的组中值=上限-相邻组组距/2缺上限的开口组的组中值=下限+相邻组组距/220、离散型变量根据实际情况既可采用单项式分组,也可采用组距式分组,组限既可重叠,也可不重叠;连续型变量只能采用组距式分组,并且组限必须重叠。21、简单分组:是指对总体只按一个标志进行的分组。
比如,人口总体只按性别分组,学生总体只按考试成绩分组等。22、复合分组:是指对研究总体按两个或两个以上标志进行的多层次分组。
比如,职工总体先按技术级别分组,在此基础上再按性别分组。23、次数分布:是指将总体中的所有单位按某个标志分组后,所形成的总体单位数在各组之间的分布。24、根据分组标志的性质不同,分布数列可分为品质分布数列和变量分布数列。按品质标志分组形成的分布数列叫品质分布数列,简称品质数列;按数量标志分组形成的数列叫变量分布数列,简称变量数列。25、变量数列有单项式数列和组距式数列两种。26、分布数列有等距数列和异距数列之分
27、变量数列的编制步骤:(1)将原始资料按其数值大小重新排列(2)确定全距(3)确定组距和组数(4)确定组限(5)编制变量数列28、次数分布的主要类型(1)钟型分布(正态分布)(2)U型分布(3)J型分布29、U型分布的特点是两头大,中间小30、统计表:统计调查所得来的原始资料,经过整理,得到说明社会现象及其发展过程的数据,将这些数据按一定的顺序排列在表格上,就形成了统计表。31、统计表的结构,可以从表式和内容两个方面来认识。(1)从表式上看,统计表是由纵横交叉的线条组成的一种表格,表格包括总标题、横行标题、纵栏标题和指标数值四个部分。(2)从内容上来看,统计表是由主词栏和宾词栏两个部分组成。
此外,统计表还有补充资料、注解、资料来源、填表单位、填表人等附加内容。32、统计表的设计要求是:科学、实用、简练、美观。33、描述定性数据的图形:条形图、饼图34、描述定量数据的图形:直方图、折线图35、饼图:是用来描述总体中各组成部分所占比重的统计图。36、统计图的绘制原则(1)根据研究目的和资料的性质选择统计图形。(2)图形的设计要符合科学性原则。(3)统计图的内容应具有鲜明性。(4)统计图的形式和排列要有一定的艺术性。
第四章总量指标和相对指标分析
1、总量指标:是反映一定时间、地点和条件下某种社会经济现象总体规模和总水平的统计指标,是各种社会经济现象总量的表现。2、总量指标的基本特点:(1)总量指标是绝对数形式,一定有计量单位。(2)总量指标的大小受总体范围的影响(3)总量指标的计算只对有限总体计算3、总量指标的作用:(1)是人们认识社会经济现象的起点。(2)是制定政策、编制计划、经行科学管理的重要依据。(3)是计算相对指标和平均指标的基础。4总量指标的种类(1)总量指标按其说明的总体内容不同分为:总体单位总量和总体标志总量。(2)总量指标按其反映的时间状况不同分为:时期指标和时点指标。(3)总量指标按其所采用计量单位的不同分为:实物指标、价值量指标和劳动
量指标
5、总体单位总量和总体标志总量的关系
二者地位随着统计研究目的的不同和研究对象的变化而变化。例:当以工业
企业为总体时,职工人数是标志总量;当以全部职工为总体时职工人数则是单位
总量。
6、时期指标:反映现象在一段时期内发展过程的总数量,如产品产量、商品销
售额、国内生产总值等。
7、时点指标:表示现象在某一时刻上的状态,如人口数、商品库存额、固定资
产原值等。
8、总量指标是反映社会经济现象一定时间、地点、条件下总的规模、水平的统
计指标。
9、总量指标一般表示现象总量,其表现形式绝对数,是一个有名数。
10、总量指标也可表现为总量之间的绝对差数,如增加量、减少量等。
11、国民生产总值(GNP):是按市场价格计算的国民生产总值的简称,是一个国
家(地区)所有常住机构单位在一定时期内(年或季)收入初次分配的最终成果。
12、国内生产总值(GDP):指的是一国(或地区)一年以内在其境内生产出的全
部最终产品和劳务的市场价值总和。
13、相对指标:又称相对数,是由两个有联系的指标数值对比计算得出的统计指
标,也称相对数指标,用以反映现象的发展程度、结构、强度、普遍程度或比例
关系。
14、相对指标可分为有名数和无名数。
15、相对指标的作用
(1)可以综合地反映社会经济现象之间的数量关系,说明现象和过程的比率、
构成、速度、密度、普遍程度等,从而能够更加深刻地反映现象的实质。
(2)可以使原来不能直接相比的数量关系变为可比,有利于对所研究的事物进
行比较分析。
16
结构相对指标
总体中某一部分数值总体全部数值
100%
17、比例相对指标:是反映总体内部各个组成部分之间的数量对比关系的相对指
标。计算公式:
比例相对指标
总体中某一部分指标数值同一总体中另一部分指标数值
18、比较相对指标:是用来说明同一时期内,同类现象在不同总体之间的对比关系的指标。比较相对指标是两个不同地区的同类指标相对比而得出的指标。
计算公式:
比较相对指标
某条件下某类指标数值另一条件下同类指标数值
19、强度相对指标是两个性质不同、但有一定联系的总量指标数值之比。
计算公式:
强度相对指标
某一总量指标数值另一性质不同但有联系的总量指标数值
20、
计划完成程度相对指标
实际完成数计划任务数100%
21、动态相对指标:是表明某类现象在不同时间上的指标数值对比关系的相对指标,用以说明现象发展变化的方向和程度。
计算公式:
动态相对指标
报告期指标数值基期指标数值
100%
22、某单位某月职工的出勤率是95%,这个指标是结构相对指标。23、某地区2013年年末居民储蓄存款余额已达到250亿元,这个指标属于时点指标。24、某地区2012年1-6月新批240个外商投资项目,这个指标属于时期指标。25、实物指标的综合性能差,而价值指标的综合性能好。26、某地区某年出生人数是时期指标,27、比例相对指标和比较相对指标的异同点
区别:比例相对指标是同一总体内,不同组成部分的指标数值的对比,说明总体内部的比例关系;比较相对指标是同类现象在不同空间上的对比,说明现象发展的不均衡程度。
相同点:二者都是无名数,同一时间,同类现象。28、某企业2011年A产品产量为10000台,计划规定2012年产量增长4%,实际增长5%。计算(1)2012年A产品产量计划数和实际数;(2)2012年A产品产量计划完成情况相对指标解:(1)A产品2012年产量计划数=10000×(1+4%)=10400(台)
A产品2012年产量实际数=10000×(1+5%)=10500(台)(2)A产品2012年产量计划完成情况相对指标=10500/10400=100.96%
第五章平均指标和标志变异指标分析
1、平均指标:又称平均数,是指在同质总体内将各单位某一数量标志表现的差异抽象化,用以反映在一定时间、地点、条件下的总体单位一般水平数量特征的综合指标。2、平均指标的特点(1)将数量差异抽象化。(2)只能进行同类现象计算。(3)反映总体分布的集中趋势。3、平均指标的作用(1)平均指标可用于同类现象在不同空间条件下的对比(2)平均指标可用于同一现象在不同时间的对比(3)平均指标可以概括说明总体的一般水平(4)平均指标可以分析现象之间的依存关系(5)平均指标可以进行数量上的估算4、平均指标的种类
(1)根据平均指标反映的内容不同,可以把平均数分为静态平均数和动态平均数(2)根据平均指标计算方法的不同,可以把平均数分为数值平均数和位置平均数5、算术平均数是分析社会经济现象一般水平和典型特征的最基本指标,是统计中计算平均指标最常用的方法之一。一般如不加特别说明,所称的平均数都是指算术平均数。
公式为:
算术平均数
总体标志总量总体单位总量
6、应用平均指标需注意的问题(1)注意社会经济现象的同质性(2)注意用组平均数补充说明总体平均数(3)注意用分配数列补充说明总体平均数(4)注意极端数值的影响7、中位数:将被研究总体各单位的标志值按大小顺序排列,位于中间位置的那个标志值就是中位数。在变量数列中,有一半单位的标志值小于中位数,另一半单位的标志值大于中位数,因而中位数也叫分割值。8、众数:是总体中出现次数最多的标志值。9、中位数和众数都属于位置平均数,它们是一种代表值。10、中位数是位于数列中间的那个变量值,众数是总体中出现次数最多所对应的那个变量值。中位数和众数也可以成为位置平均数。11、标志变异指标:是反映总体各单位标志值差异程度的综合指标,又称标志变动度。12、标志变异指标的作用(1)标志变异指标反映总体数据分布的离中趋势(2)标志变异指标可以衡量平均数的代表性(3)标志变异指标可以说明现象总体变动的均衡性、稳定性(4)标志变异指标是确定必要抽样单位数和计算抽样误差的必要依据
第六章时间数列分析
1、时间数列:把某一社会经济现象在不同时间上的一系列统计指标数值按时间的先后顺序加以排列形成的数列称为时间数列或时间序列,又称动态数列。2、时间数列的作用(1)可以从事物在不同时间上的量变过程中,认识社会经济现象的发展变化方向、程度、趋势和规律,为制定政策、编制计划提供可行的依据。(2)可以发现研究现象发展变化的规律和未来趋势,以便对经济现象进行预测分析。(3)可以将不同国家或地区的同类现象进行比较分析。
3、时间数列的种类根据时间数列中统计指标的表现形式不同,时间数列可分为总量指标(绝对
数)时间数列、相对指标(相对数)时间数列、平均指标(平均数)时间数列三种。4、总量指标时间数列按其所反映时间状况的不同,又分为时期数列和时点数列。5、时期数列:是指由时期指标构成的数列,即数列中每个指标值都反映某现象在一段时间内发展过程的总量。6、时点数列:是指由时点指标构成的数列,即数列中的每个指标反映的是现象在某一时刻(时点)上的总量。7、时间数列的编制原则(1)各项观察值所属时间可比(2)各项观察值总体范围可比(3)各项观察值经济内容可比(4)各项观察值的计算方法可比(5)指标的计算价格和计量单位可比8、发展水平:是指时间数列中的每一项具体指标数值,它反映了某种社会经济现象在某一时间上所达到的一种数量状态,也是计算各项动态分析指标的基础。9、平均发展水平:又称序时平均数或动态平均数。是把时间数列中各个不同时期或时点上的发展水平加以平均而得到的平均数,能概括性地描述出现象在一段时间内所达到的一般水平。10、根据时期数列计算平均发展水平:
由于时期数列的各项指标数值可以相加,所以计算平均发展水平时用简单算术平均法:
aa1a2...ana
n
n
11、发展速度:是根据报告期发展水平和基期发展水平对比而得到的动态相对数,一般用百分数表示,也用倍数表示。
发展速度%
报告期水平基期水平
100%
12、各个发展水平反映现象在各时期或时点上所达到的实际水平。
13、例题:某企业2011年9月—12月月末职工人数资料如下:
某企业职工人数
日期9月30日10月30日11月30日12月30日
月末人数
1400
1510
1460
1420
计算该企业第四季度的平均职工人数。
答:
10月份平均职工人数14001510145(5人)2
11月份平均职工人数15101460148(5人)2
12月份平均职工人数14601420144(0人)2
第四季平均职工人数145514851440146(0人)3
14、例题:某企业2011年各月的总产值资料如下:
某企业2011年各月的总产值
单位:万元
月份
总产值
月份
总产值
1
190
7
270
2
190
8
300
3
220
9
330
4
240
10
380
5
220
11
350
6
260
12
410
计算各季度平均每月的总产值。
答:
第一季度平均每月总产值190190220200(万元)3
第二季度平均每月总产值240220260240(万元)3
第三季度平均每月总产值270300330300(万元)3
第四季度平均每月总产值380350410380(万元)3
第七章指数分析
1、指数的概念
(1)广义指数:是指反映社会经济现象数量变动的全部相对数。
(2)狭义指数:是指综合反映数量上不能直接加总的复杂社会经济现象总体数
量综合变动程度的相对数。
2、指数的特点:
(1)相对性
(2)综合性
(3)平均性
3、指数的作用
(1)可以用来说明不能直接相加和对比的社会经济现象综合变动的方向和程度。
(2)可以用来分析受多种因素影响的现象总变动中各个因素变动影响的方向和
程度。
(3)通过编制指数数列,反映社会经济现象在长时期内的变动趋势。
4、指数的种类
(1)按指数反映对象范围的不同,分为个体指数和总指数
(2)按指数化指标的性质不同,分为数量指标指数和质量指标指数
(3)按指数采用的基期不同,分为定基指数、环比指数和年距指数
(4)按编制指数的方法不同,分为综合指数和平均数指数
(5)按指数反映现象的状况不同,分为时间指数、区域指数和计划完成指数。
5、数量指标综合指数的同度量因素必须是质量指标,质量指标综合指数的同度
量因素必须是数量指标。
6、在编制数量指标指数时,一般采用基期的质量指标作为同度量因素;而在编
制质量指标指数时,一般则采用报告期的数量指标作为同度量因素。
7、编制综合指数的一般原则
(1)同度量因素与指数化因素相乘后必须是有实际经济意义的总量指标;
(2)数量指标综合指数以基期的质量指标为同度量因素;质量指标综合指数以
报告期的数量指标为同度量因素。
8、平均数指数:是计算总指数的另一种计算形式,有其独立应用的意义,它是
从个体指数出发来编制总指数的。
9、根据选用的权数不同,其基本形式主要有加权算术平均数指数和加权调和平
均数指数两种。
10、加权算术平均数指数:是将个体指数按加权算术平均数形式计算的总指数。
11、加权调和平均数指数,是将个体指数按调和平均数形式加权平均计算的总指
数。
12、指数体系:在统计上,把经济上有联系、数量上保持一定对等关系的若干个
指数所形成的整体,称为指数体系。
13、指数体系的特征:
(1)关系式中具备三个或三个以上的指数。
(2)指数体系中的单个指数在数量上能相互推算。
(3)现象总变动差额等于各个因素差额的总和。
14、指数体系的作用
(1)指数体系是因素分析法的基本依据。
(2)利用指数体系,可以进行指数之间的相互推算。
(3)用综合指数法编制总指数时,指数体系也是确定同度量因素时期的根据之
一。
15、因素分析:是指以指数体系为基础,以综合指数的编制原则为依据,从数量
上分析社会经济现象的总变动中各因素变动影响的方法。
16、因素分析的步骤(1)计算现象总变动指数,测定现象总变动的相对程度和绝对效果。(2)分析计算各因素指数,测定各因素变动对现象总变动影响的相对程度和绝对效果。(3)从相对数和绝对数两方面进行影响因素的综合分析,即总变动程度等于各因素影响程度的连乘积,总变动的绝对效果等于各因素影响的绝对效果之总和。17、因素分析包括相对数和绝对数分析。
第八章抽样推断分析
1、抽样推断的概念(1)从广义的角度理解,凡是抽取一部分单位进行观察,根据观察结果来推断全体的都是抽样调查,可分为随机抽样和非随机抽样两种。(2)从狭义的角度理解,抽样推断是在抽样调查的基础上,运用数理统计的原理,以被抽取部分单位的数量特征为代表,从数量上对总体做出具有一定可靠程度的估计与推断的一种统计分析方法。2、抽样推断的特点(1)抽样推断是由部分推算总体的一种认识方法。(2)抽样推断是建立在按随机原则抽取样本的基础上。(3)抽样推断是运用概率估计的方法。(4)抽样推断产生的误差可以事先计算、并加以控制。3、抽样推断的作用(1)应用抽样推断法,可对某些不可能或不容易进行全面调查,而又要了解其全面情况的社会经济现象进行数量方面的统计分析。(2)应用抽样法可对全面调查的结果加以补充或订正。(3)应用抽样法可对生产过程中产品质量进行检查和控制。(4)应用抽样推断法可对总体的某种假设进行检验,判断假设的真伪。4、全及总体:又称母体,简称总体,是由被调查对象的全部单位所构成的集合体,即具有某种共同性质的许多单位组成的整体。5、样本总体:又称子样,简称样本,是从全及总体中按照随机原则抽取出来,代表全及总体的那部分单位的集合。6、总体指标:又称全及指标或母体参数,是根据全及总体各单位的标志值或标志特征计算的,反映总体特征的综合指标。7、样本指标:又称样本统计量或抽样指标,是根据抽样总体中各单位的标志值或标志特征计算的综合指标,是用来推断或估计总体指标的。8、重复抽样:也称重置抽样、回置抽样,是指从全及总体N个单位中随机抽取一个容量为n的样本,每次抽中的单位在登录其有关标志表现后又放回总体中,重新参加下一次的抽选。9、不重复抽样:也称不重置抽样、不回置抽样,是指从总体N个单位中随机抽
取容量为n的样本时,每次从总体中抽取一个单位,不再放回去,下一次则从剩下的总体单位中继续进行抽取,如此反复构成一个样本。10、抽样方式(1)简单随机抽样(2)类型抽样(3)等距抽样(4)整群抽样(5)多阶段抽样11、简单随机抽样:又称纯随机抽样,是在不对总体进行任何划分、排队的情况下,完全按随机原则直接从总体中抽取一部分单位来组成样本的抽样组织方式。12、简单随机抽样是抽样中最基本、最简单的组织方式,它适用于均匀分布的总体。
13、简单随机抽样具体方法有三种(1)直接抽选法(2)抽签法(3)随机数表法14、对于纯随机重复抽样,若其他条件不变,允许误差缩小一半时,抽样单位数必须扩大到原来的(4)倍;若允许误差增加2倍,则抽样单位数减少到原来的(1/4)。15、纯随机抽样就是按随机的原则,直接从总体中抽取样本。16、类型抽样:又称分类抽样或分层抽样,抽样时先将总体按主要标志划分为若干个组,在各组中按随机原则抽取样本单位的抽样组织形式。17、类型抽样的样本单位数在各类型之间的分配有三种(1)等数分配类型抽样法(2)等比例类型抽样法(3)不等比例类型抽样法18、等距抽样:也称机械抽样或系统抽样,是将总体各单位按某一标志进行排序后,按固定的顺序和相同的间隔抽选样本单位的方法。19、根据排序标志的不同,等距抽样又可以分为有关标志排序抽样、无关标志排序抽样两种形式。20、整群抽样:又称集团抽样或区域抽样,是将总体全部单位分为许多个“群”,然后随机抽取若干“群”,对被抽取中的各“群”内的所有单位进行全面调查的抽样方法。21、多阶段抽样:是把整个抽样过程分为若干个阶段,逐级抽出样本单位的抽样方法。22、抽样误差:是指调查所得的统计数据与调查总体未知的真实数据之间的差别。23、抽样误差包括登记性误差和代表性误差两种。24、影响抽样误差的因素(1)样本容量的大小(2)总体各单位被研究标志的变异程度(3)抽样方法(4)抽样的组织方式25、影响样本容量的主要因素(1)总体被研究标志的变异程度(2)允许的抽样误差的大小
(3)概率保证程度的高低(4)抽样调查的组织方式和方法(5)人力、物力和财力的允许条件
第九章相关关系与线性回归分析
1、一切客观事物都是相互联系相互制约的。客观现象间的互相联系,可以通过一定的数量关系反映出来。而这种数量关系可以分为两种类型,即函数关系和相关关系。2、函数关系:是指现象之间有一种严格的确定性的依存关系。表现为某一现象发生变化另一现象也随之发生变化,而且有确定的值与之相对应。3、相关关系是指客观现象之间存在的非确定的相互依存关系。也就是说,当一个现象发生数量变化时,另一个现象也会发生数量变化,但这种数量关系是不确定的,不是唯一的。4、相关关系的特点:(1)现象之间确实存在着数量上的依存关系。(20现象之间数量上的关系不是确定的。5、相关关系的种类(1)按照相关的方向不同分为:正相关和负相关。(2)按照相关形式不同分为:线性相关和非线性相关。(3)按相关程度分为:完全相关、不完全相关和不相关。(4)按研究的变量(或因素)的多少分为:单相关、复相关和偏相关。6、两个相关现象之间,当一个现象的数量由小变大,另一个现象的数量由小变大,这种相关称为正相关;当一个现象的数量由小变大,另一个现象的数量由大变小,这种相关称为负相关。7、相关分析的主要内容(1)确定现象之间有无关系。(2)确定相关关系的表现形式。(3)测定相关关系的密切程度和方向。8、回归分析:为了测定现象之间数量变化上的一般关系通常要使用数学方法,这类数学方法称为回归分析。9、一元线性回归分析的特点(1)两个变量之间不是对等关系,一个是自变量,一个是因变量,在进行回归分析时,首先加以确定。(2)相关系数是个抽象的系数,而回归方程是利用自变量的给定值来推算因变量值,它反映的是变量之间的具体的变动关系。(3)有些现象因果关系不明显,x、y两个变量可以互换。(4)直线回归方程中的回归系数也有正负号,回归系数为正号,表示两个变量之间的变动方向相同,为负号则表示两变量之间的变动方向相反。
(5)回归分析中的自变量是给定数值,不是随机的,而因变量是随机的,代入给定的自变量值,求出因变量的估计值,这个估计值是许多可能数值的平均值,存在着估计标准误差。10、相关分析与回归分析的关系
相关分析是回归分析的基础和前提,回归分析则是相关分析的深入和继续。相关分析需要依靠回归分析来表现变量之间数量相关的具体形式,而回归分析则需要依靠相关分析来表现变量之间数量变化的相关程度。只有当变量之间存在高度相关时,进行回归分析寻求其相关的具体形式才有意义。11、在回归分析中应注意的问题(1)在定性分析的基础上进行定量分析,是保证正确运用回归分析的必要条件。(2)在回归方程中,回归系数的绝对值只能表示自变量与因变量之间的联系程度,以及两变量间的变动比例。(3)在进行回归分析时,为了使推算和预测更准确,应将相关系数、回归系数和估计标准误差结合使用。(4)要具体问题具体分析。12、估计标准误差是用来说明回归直线方程代表性大小的统计分析指标。
篇三:统计工作的阶段有哪几个他们之间的是什么关系
第三章统计整理(一)填空题1、统计整理是统计工作的第三阶段。在这一阶段,通过对原始资料进行科学的加工,可以得出反映事物总体特征的资料。2、统计整理在统计分析中起着承前启后的作用,它既是统计调查的必然继续,又是统计分析的基础和前提条件。3、统计分组实质上是在统计总体内部进行的一种定性分类。4、对原始资料审核的重点是真实性。5、区分现象质的差别是统计分组的根本作用。6、标志是统计分组的依据,是划分组别的标准。7、根据分组标志的特征不同,统计总体可以按品质分组,也可以按数量分组。8、对所研究的总体按两个或两个以上的标志结合进行的分组,称为复合分组。9、次数分布数列根据分组标志特征的不同,可以分为品质分布数列和数量分布数列两种。10、变量数列是单项变量分组、组距式分组所形成的次数分布数列。11、按品质标志分组的结果,形成品质分布数列。12、组限是组距变量数列中表示各组数量界限的变量值,其中下限是指最小值的变量值,上限是指最大值的变量值。13、组距变量数列的组距大小与组数的多少成反比。与全距的大小成正比。14、组距变量数列的分布可以用次数分布曲线图表示。15、划分连续变量的组限时,相邻组的组限必须重叠;划分离散型变量的组限时,相邻组的组限可以重叠,也可以不重叠。16、统计资料的整理方法主要有统计分组和统计汇总两种。17、钟形分布、U形分布和J形分布是次数分布的三种主要类型。18、统计分组体系有品质标志分组和数量标志分组两种。19、统计表按主词是否分组和分组的程度可分为简单表、简单分组表和复合分组表三种。20、统计表从内容结构上看,是由主词和宾词两部分构成。
(二)单项选择题(在每小题备选答案中,选出一个正确答案)
1、统计分组的结果表现为(A)
A.组内同质性,组间差异性
B.组内差异性,组间同质性
C.组内同质性,组间同质性
D.组内差异性,组间差异性
2、统计分组的依据是(A)
A、标志
B、指标
C、标志值
D、变量值
3、下面属于按品质标志分组的有(C)
A.企业按职工人数分组
B.企业按工业总产值分组
C.企业按经济类型分组
D.企业按资金占用额分组
4、统计分组的关键在于(A)
A、正确选择分组标志
B、正确划分各组界限
C、正确确定组数和组限
D、正确选择分布数列种类
5、下面属于按数量标志分组的有(B)
A.工人按政治面貌分组
B.工人按年龄分组
C.工人按工种分组
D.工人按民族分组
6、在全距一定的情况下,组距的大小与组数的多少成(B)
A、正比
B、反比
C、无比例关系D、有时成正比有时成反比
7、某地区商业企业按所有制形式分组,然后在各种所有制形式中再按销售额多少分组,这
样的分组属于(C)
A.按数量标志分组
B.简单分组
C.复合分组
D.平行分组体系
8、次数分配中,靠近中间的变量值分布的次数少,靠近两端的变量值分布的次数多,这种
次数分布的类型是(B)
A.钟形分布B.U形分布C.J形分布
D.洛伦茨分布
9、变量数列中的各组频率(以百分比表示)的总和应该(D)
A.大于100%B.小于100%C.不等于100%D.等于100%
10、等距分组适合于(B)
A、一切变量
B、变量变动比较均匀的情况
C、呈急剧升降变动的变量
D、按一定比率变动的变量
11、单项数列中,某组的向上累计次数是80,这表示总体中(C)
A.低于该组标志值的单位有80个
B.等于该组标志值的单位有80个
C.等于和低于该组标志值的单位有80个
D.高于该组标志值的单位有80个
12、确定连续型变量的组限时,相邻的组限要求(B)
A、不重叠
B、重叠C、不等D、重叠或不重叠
13、在编制等距数列时,如果全距等于56,组数为6。为统计运算方便,组距取(D)
A.9.3
B.9
C.6
D.10
14、简单表与分组表的区别在于(A)
A、主词是否分组
B、宾词是否分组
C、分组标志的多少
D、分组标志是否重叠
15、正态分布的图形为(C)
A.U形
B.J形
C.钟形D.不确定形
16、统计表的横行标题表示各组的名称,一般应写在统计表的(B)
A、上方
B、左方
C、右方D、均可以
17、组距变量数列的全距等于(D)
A.最大组的上限与最小组的上限之差
B.最大组的下限与最小组的下限之差
C.最大组的下限与最小组的上限之差
D.最大组的上限与最小组的下限之差
18、在统计汇总时,如果只要求计算各组分配的单位数,可采用(B)
A、过录法B、划记法C、折叠法D、卡片法
19、工业企业按经济类型分组和资金利税率分组(C)
A.都是按品质标志分组
B.都是按数量标志分组
C.前者按品质标志分组,后者按数量标志分组
D.前者按数量标志分组,后者按品质标志分组
20、在填写统计表时,当发生某项不应有数字时,用(C)符号表示
A、O
B、X
C、—
D、...
21、某小组5个学生的“统计学”考试成绩分别为80分、70分、62分、86分、76分,这
5个数字是(B)
A.标志B.标志值C.变量D.指标
22、累计次数或累计频率中的“向上累计”是指(C)
A、将各组变量值由小到大依次相加
B、将各组次数或频率由小到大依次相加
C、将各组次数或频率从变量值最低的一组向最高的一组依次相加
D、将各组次数或频率从变量值最高的一组向最低的一组依次相加
23、划分连续型变量的组限时,相邻两组的组限(A)
A.必须重叠
B.必须间断
C.既可以是重叠的,又可以是间断的
D.以上都不是
24、某商业局对其所属商店的销售计划完成百分比采用如下分组,请指出哪项是正确的
(C)
A.80%-89%90%-99%100%-109%110%以上
B.80%以下80.1%-90%90.1%-100%100.1%-110%
C.90%以下90%-100%100%-110%110%以上
D.85%以下85%-95%95%-105%105%-115%
篇四:统计工作的阶段有哪几个他们之间的是什么关系
一、数据的特征值(一)数据的_位置特征值
1)平均值x
如果从总体中抽取一个样本,得到一批数据x1,x2,x3…。xn,则样本的平均值x为:
_
x
1n
ni1
xi
n—数据个数;xi—第i个数据数;∑-求和。
~
2)中位数x
有时,为减少计算,将数据x1,x2,x3…。xn按大小次序排列,用位居于正中的那个数或中间两个数的平均值(当数据为偶数时)表示数据的总体平均水平。
3)中值M测定值中的最大值xmax与最小值xmin的平均值,用M表示。
Mxmaxxmin2
4)众数在用频数分布表示测定值时,频数最多的值即为众数。若测定值按区间做频数分布时,
频数最多的区间代表值(一般取区间中值)也称众数。
(二)数据的离散特征值1)极差R
测定值中的最大值xmax与最小值xmin之差称为极差.通常R用于个数n小于10的情况下,n大于10时,一般采用标准偏差s表示.
2)偏差平方和S
_
各测定值xi与平均值x之差称为偏差。各测定值的偏差平方和称为偏差平方和,简称
平方和,用S表示。
_
_
_
S=(x1x)2(x2x)2...(xnx)2
n
_
=
(xix)2
i1
无偏方差
各个测定值的偏差平方和除以(n—1)后所得的值称为无偏方差(简称方差),用s2表示:
s2
Sn1
1n1
ni1
(xi
_
x)2
1
标准偏差s方差s2的平方根为标准偏差(简称标准差),用s表示:
s
s2
Sn1
1
n1
ni1
(xi
_
x)2
(三)变异系数
以上反映数据离散程度的特征值,只反映产品质量的绝对波动大小。在工程实践中,测量较大的产品,绝对误差一般较大,反之亦然。因此要考虑相对波动的大小,在统计技术上用
变异系数CV来表达:
CV
s
_
x
上式中σ和μ为总体均值_和总体标准差,当过程在受控状态下,且样本容差较大时,可
用样本标准差s和样本均值x估计.
2
Ca、Cp、Cpk的计算过程准确度指数(Ca值):表示过程特性中心位置的偏移程度,越小越好
Ca=(样本平均值-规格中心值)/(规格公差/2)
等级A:|Ca|≦12。5%表示作业员遵守作业规范,并达规格要求等级B:12.5%〈|Ca|≦25%表示必要时尽可能提升至A级等级C:25%〈|Ca|≦50%表示作业员可能看错或未按标准作业,或须修改规格及作业标准。等级D:50%<|Ca|表示应采取紧急措施,全面整改可能影响之因素,必要时应停止生产。
过程精密度能力系数(Cp值):表示过程特性分散的程度,值越大越集中。
Cp=(规格上限-规格下限)/(6×标准差)
合格:1。33≦Cp表示能力足够警告:1。00≦Cp<1。33表示能力无足够宽度,平均值稍有偏差时,不良率既会增加。不合格:Cp<1。00表示能力不足,有不合格品,须全数筛选,并设法缩小变异或整改规格公差。过程综合能力系数(Cpk值):同时考虑“偏移”程度及“分散程度
Cpk=(1-Ca)×Cp
此系数为过程评价用系数,用于过程改善客户指定Cpk值时,欲达到此Cpk值,可先探讨Ca及Cp值:“准确度"“精密度”是否有适当能力一般客户是指定值多数为≧1.33;Cpk值≧3.00时,表示过程能力已经足够了,继续维持即可;若想进一步改善,应考虑成本效益。
Cp=(Ucl-Lsl)/6δCpku=(Ucl-Xbar)/3δCpkl=(Xbar—Lsl)/3δCpk=min(Cpku:Cpkl)
3
二、回归分析(一)什么是回归分析
回归分析是用来研究一个指标与几个变量间的相关关系的方法。设有两个变量x和y,前者为自变量,后者为因变量,并均为随机变量。当自变量X变化时,Y会产生相应的变化,如果具有大量或较多的统计数据(xi,yi),则可以用数学方法找出两者之间的统计关系y=f(x),这种数学方法称为回归分析。当y=a+bx时,称之为一元线性回归;当y=f(x)为非线性函数关系时,称之为非线性回归;当x变量不止1个,有几个时,即有(x1,x2···,xn),则y=f(x1,x2···,xn)称之为多元回归。当有y=a+b1x1+b2x2+···+bnxn时,称之为多元线性回归,否则为多元非线性回归.回归分析可用于预测、质量控制等方面。
(二)一元线性回归方程的计算方法
设一元线性回归方程的表达式为:y=a+bx
现在给出了n对数据(xi,yi),要求根据这些数据去估计a与b的值。则:
aybx
bLxyLxx
其中n
Lxx:-——-x的离差平方和Lxx(xix)2i1
n
Lyy-———y的离差平方和Lyy(yiy)2i1
n
Lxy-———x,y的离差成积之L和xy(xix()yiy)i1
三、统计过程控制基本概念
4
StatisticalProcessControl(SPC--—统计过程控制)的概念是:应用统计技术对过程中的各个阶段进行评估和检察,保持过程处于可接受的和稳定的水平,以保证产品与服务满足要求的均匀性。
这里的统计技术涉及到数理统计内容,但所应用的主要工具是控制图。SPC可以判断过程的异常,及时告警。但是不能告知此异常是什么因素引起的,发生于何处。20世纪80年代起,我国的张公绪先生提出StatisticalProcessDiagnosis理论(SPD——-统计过程诊断).20世纪90年代起又发展为StatisticalProcessAdjustment(SPA---统计过程调整)。三者循环关系如下:SPC—--告诉过程是否有异常SPD——-告诉过程是否有异常,若异常,告知问题出在哪里SPA-——告诉过程是否有异常,若异常,告知问题出在哪里,如何进行调整所以SPC是质量改进循环的首要步骤,应该熟练掌握运用。
四、控制图的应用
5
统计过程控制的主要工具是控制图(SPC图).控制图是将一个过程定期收集的样本数据按顺序描点绘制成曲线的一种技术,可以发现过程异常,是采取预防措施的重要手段。1984年日本名古屋工业大学调查了上百家中小型企业,发现平均每家企业采用137张控制图。美国柯达一共应用了35000张控制图.(一)控制图的原理
当质量特性值x服从正态分布时,由两个参数决定分布曲线的位置与形状,即平均值μ和标准差σ。不论μ和σ取什么值,产品质量特性值x落在[μ-3σ,μ+3σ]区间内的概率为99.73%。根据小概率事件可以忽略的原则,若变量x超出±3σ范围,则认为过程存在异常。
一个控制图有三条线:中心线,简称CL线。CL=μ上控制线,简称UCL线。UCL=μ+3σ下控制线,简称LCL线。LCL=μ-3σ将正态分布曲线图旋转180度,即得到控制图。
(二)如何利用控制图判断过程异常多数点子在μ±1σ范围内(68%左右),小部分点子在μ±2σ和μ±1σ之间(27%左
右),点子随机排列,是过程控制的理想状态。中心线一侧的点子明显比另一侧多,应考虑均值可能产生偏移。较多的点子接近上下控制线,说明标准差已经变大.中心线一侧连续出现多个点子或点子连续上升/下降,证明有系统因素干扰.点子按一定时间间隔呈周期性变化,可能工艺、环境等因素失控。
(三)常规控制图(休哈特控制图)常规控制图即休哈特控制图,参见下表“常规控制图”。
常规控制图
6
分布控制图代号
XR
Xs
正态分布(计量
值)
X~RXRs
控制图名称均值—极差控制图均值—标准差控制图中位数-极差控制图
单值—移动极差控制图
控制图界限
UCLxXA2RUCLRD4RLCLRD3R
UCLxXA3sUCLsB4SLCLRB3R
UCLXX~m3A2RUCLRD4RLCLRD3R
UCLXX2.66RSUCLRS3.267RSLCLRSX2.66Rs
备注
正态分布的参数μ与σ互相独立,控制正态分布需要分别控制μ与σ,故正态分布控制图都有两张控制图,前者控制μ,后者控制σ。
二项分布与泊松分布则并非如此。
二项分布(计件值)
泊松分布(计点值
)
左列两图
p
不合格品率控制图
UCLPP3p(1p)/n可由通用不
np
不合格品数控制图
合格品数nprUCLnPnP3np(1p)图代替。
u
单位不合格数控制图UCLuu3u/n
左列两图
可由通用缺
c
不合格数控制图
UCLcc3c
陷数cr图代替.
五、过程能力分析、过程能力指数计算
7
(一)、过程能力分析过程能力(processcapability)指过程加工质量方面的能力,决定因素是人、机、料、
法、测和环(即5M1E),与公差无关。分析过程能力只能在稳态的基础上,即统计控制状态。过程能力决定于由偶因造成的总变差σ,当过程处于稳态时,产品的计量质量特性值有
99。73%在μ±3σ范围内,即几乎全部产品的特性值包含在6σ范围之内。故常用6倍标准差(6σ)表示过程能力,它的数值越小,表示过程能力越强。
(二)、过程能力指数计算当产品质量特性分布的均值μ与公差中心M重合时
1、对于公差的上、下限都有要求时,过程能力指数计算公式如下:
CP
规定的公差过程变异度
T6
TUTL6
TUTL6ˆ
T为公差,TU为公差上限,TL为公差下限,ˆ是质量特性总体标准差的估计值。
在上述过程能力指数中,T反映对产品的技术要求(或客户对产品的要求),而σ反映本企业过程加工的质量。比值CP反映过程加工质量满足产品技术要求的程度。
根据T与6σ的比值,可以得到下图所示三种典型的情况。CP值越大,表明加工质量越好,但对设备和人员的要求也越高,加工成本相应升高.当CP=1,似乎既满足要求也节约成本,但由于过程的波动,分布中心一有偏移,不合格品率就要增加,因此,CP应取>1。一般情况下,当CP=1.33,T=8σ,整个分布基本上都在上下规范限度内,且留有变动空间。故ISO8258:1991要求CP≥1。33。
2、只对单侧公差限有规定时
只规定上限时,
CPU
TU3
只规定下限时,
CPL
TL3
当产品质量特性分布的均值μ与公差中心M有偏离时
8
这种情况下,需要对无偏离CP乘上一个修正系数(1-K)。
CP
规定的公差过程变异度
T6
TUTL6
TUTL6ˆ
有偏离情况下的过程能力指数是:T2
CPK(1K)CP6
过程能力指数与不合格品率的关系考虑过程能力指数与不合格品率的关系时,直接查@正态分布表比较方便。
当公差中心M与数据分布中心μ重合时,
P22(3CP)
当公差中心M与数据分布中心μ有偏离时,
P23CP1K3CP1K
例:在无偏离情况下,求CP=0。7时的不合格品率P.
解答:
P22(3CP)
CP=0。7,
3CP=2.1
查“正态分布表",得到(2.1)0.98214
不合格品率为:
P=2—2x0.98214=0.03572
6。4.3.36σ控制方法6σ控制方法,即过程能力指数达到2以上,不合格品率0。08197316,几乎达到零缺陷.
执行6σ需要多方面的专业技能和知识,包括:SPC、MSA、DOE、可靠度工程、FMEA、TQM、QFD、田口方法、ISO9000、质量成本QCOST、数理统计、顾客满意、同步工程、价值工程、绿色设计等等.
所用的工具可以是:SPC度量、分析、改进和监控过程的波动DOE/田口方法优化设计技术,通过DOE,改进过程设计,使过程能力达到最优水平FMEA风险分析技术,辅助确定改进项目,制定改进目标QFD顾客需求分析技术,辅助将顾客需求正确地转换为内部工作要求防错从根本上防止错误发生的方法
9
平均值加减标准差表示的是什么
标准差,标准差的平方是方差,方差就是为了统计这组数据偏离平均值的程度,也可以说是这组数据的稳定性.例如两个人打靶,A打6,7,8,9,10,平均值是8,方差就是[(—2)^2+(—1)^2+0+1^2+2^2]/5=2,标准差等于根号2B打8,8,8,8,8,平均值是8,方差就是0,这样来说B的成绩更稳定。
平均数加减标准差的范围内代表大概率事件,范围外代表小概率事件。用成绩为样本,则范围内的成绩为正常的大部分考生的成绩,范围外的为特殊的少部分考生的成绩(包括特别好的和特别差的)。通常,一次考试的成绩都是成正态分布的,平均数加减标准差的范围内的成绩应该达到85%以上.如果没有成正态分布,则说明试卷没有出好,出得太难或者太简单了。对某一个人所有考试的成绩看平均数和标准差就够了,对平均数加减标准差的分析没有多大意义。但是,某一个人在一段时间内某一特定科目的所有考试成绩又可以用平均数加减标准差来分析了。
平均数只能显示总体情况,而标准差能够看出变异程度.标准差越大,数据越离散。比如以下两组数:a。22222b.11233两组的均数相等,而a组数据集中(向均数集中),b组离散,a组标准差小于b组
10
P值与α值的关系?
P值(Pvalue)就是当原假设为真时所得到的样本观察结果或更极端结果出现的概率。α值是一个临界概率值。它表示在“统计假设检验”中,用样本资料推断总体时,犯拒绝“假设”错误的可能性大小。α越小,犯拒绝“假设”的错误可能性越小。P是“拒绝原假设时犯错误概率”又或者说是“如果你拒绝掉原假设实际上是在冤枉好人的概率”。不管怎么表达理解上都有点绕,所以你还是看例子吧。比如你做一个假设(nullhypothesis):你的女性朋友平均身高2米,输入你统计的样本数据后,计算机给你返回的p值是0。03。这意味着如果你拒绝“女性朋友平均身高2米”这个结论,犯错的概率是0.03,小于0.05(人们一般认为拒绝一句话时犯错概率小于0.05就可以放心大胆地拒绝了),这个时候你就可以拒绝原假设。如果计算机返回p值是0.9,那么你就会想,这说明拒绝原假设犯错概率高达90%,那么我就不应该拒绝原假设,即你应该认为你的女性朋友平均身高就是2米。至于什么是alpha呢,上面例子中0.05这个标准就是alpha值,这个标准是可以你自己人为改变的。==========================以下是补充内容===========================
11
篇五:统计工作的阶段有哪几个他们之间的是什么关系
思考题1.什么是统计学请简要说明一下它的发展过程。统计学是关于数据搜集、整理、归纳、分析的方法论科学。统计学的发展主要经历了三个阶段:(1)17世纪中叶至18世纪,统计学的产生和形成阶段;(2)18世纪末至20世纪中叶,统计推断方法和理论体系确立的阶段;(3)20世纪50年代以来,统计理论、方法和应用进入了一个全面发展的阶段。
2.统计学、统计数据,以及统计活动之间有什么关系统计活动直接影响统计数据的数量和质量;统计学是统计实践活动的理论概括,同
时,它又用理论和方法研究分析统计实践活动,统计学和统计活动是理论与实践的关系。
3.统计学的研究方法有哪些,它们有怎样的关系并举例说明。主要方法有两个:
(1)描述统计:搜集由试验或调查所获得的资料,进行整理、归类,计算出各种用于说明总体数量特征的数据,并运用图形或表格的形式将它们显示出来。
(2)推断统计:指利用概率论的理论,根据试验或调查获得的样本信息科学地推断总体的数量特征。
关系:描述统计和推断统计都是统计方法的两个组成部分,前者是统计学的基础,后者是现代统计学的主要内容。由于现实问题中,要获得总体数据存在很大的难度,能够获得的数据多为样本数据,因此,推断统计在现代统计学中的地位和作用越来越重要,它已成为统计学的核心内容。当然,描述统计的重要性不可忽略,通过它得到可靠的统计数据并为后面的推断统计提供有效的样本信息,只有这样,才可以运用推断统计方法得出符合实际情况的结论。
4.简要说明总体、样本、变量的概念。总体:根据一定的目的确定的所要研究对象的全体,它是统计问题最基本的要素;样本:从总体中随机抽取的若干单位构成的集合体,它是统计问题的第二要素;变量:可变的数量;变量的具体表现,即可变数量的不同取值,称为变量值。
5.简述SPSS统计软件的特点和应用领域。
(1)特点:第一,工作界面友好完善、布局合理、操作简便,大部分统计分析过程可以借助鼠标,通过菜单命令的选择、对话框参数设置、点击功能按钮来完成,不需要用户记忆大量的操作命令。菜单分类合理,并且可以灵活编辑菜单以及设置工具栏。第二,具有完善的数据转换接口,可以方便地和Windows其他应用程序进行数据共享和交换。可以读取Excel、FoxPro、Lotus等电子表格和数据库软件产生的数据文件,可以读取ASCII数据文件。第三,提供强大的程序编辑能力和二次开发能力,方便高级用户完成更为复杂的统计分析任务的需要,具有丰富的内部函数和统计功能。第四,附带丰富的数据资料实例和完善的使用指南,为用户学习掌握软件的使用方法提供更多的方便。软件启动后,用户可直接上网访问SPSS公司主页获得更多的帮助和信息。(2)应用领域:社会科学、自然科学、经济管理、商业金融、医疗卫生、体育运动等。
6.SPSS软件的数据编辑器包括哪些内容(1)标题栏,显示当前工作文件名称。(2)主菜单栏,排列SPSS的所有菜单命令。(3)工具栏,排列系统默认的标准工具图标按钮,此栏图标按钮可以通过单击View菜单的Toolbars命令选择隐藏、显示或更改。(4)状态栏,状态栏位于SPSS窗口底部,它反映了工作状态。当用户将光标置于不同的区域时或者进行不同的操作时将显示不同的内容。(5)数据编辑栏,用户通过键盘输入的数据首先显示在这里。(6)数据显示区域。它是一个二维的表格,编辑确认的数据都将在这里显示,其中每一个矩形格为单元格(Cell),其中边框加黑的单元格称为选定单元格。数据显示区域的左边缘排列观测量序号,上边缘排列要定义的各变量名。
7.调查表明,顾客每周花在某超市蛋糕的平均费用是30元,他们选择经常购买蛋糕的主要原因是该蛋糕味道很好。要求:
(1)总体是什么(2)该项研究所使用的方法是描述统计方法还是推断统计方法(1)总体是所有的购买蛋糕的顾客;(2)推断统计方法。
第二章数据整理和描述
思考题
1.获取统计数据有哪两种途径一种是直接向调查对象搜集反映调查单位的统计数据,一般称为原始数据或第一手数据;另一种是搜集已经加工、整理过的、说明总体现象的数据,一般称为次级数据或第二手数据。
2.统计数据的搜集有哪几种方法直接观察法、访问法、报告法、问卷法。
3.对统计数据进行搜集时,有哪几种组织方式普查、抽样调查、重点调查、典型调查。
4.什么是数据分组数据分组的方式有哪几种(1)统计数据分组是根据统计研究目的,按某一标志将数据分别列入不同的组,使组
与组之间有比较明显的差别,而在同一组内的单位具有相对的同质性,即同一组内各单位之间具有某些共同的特征。(2)统计数据分组可以按品质标志分组和按数量标志分组。(一)按品质标志分组就是按照事物的性质和属性特征进行分组。一般来言,按品质标志分组的操作比较容易,分组也相对稳定。如人口按性别分组、职工按文化程度分组等;(二)按数量标志分组,就是按照事物的数量特征进行分组。例如,企业按职工人数、产值、产量等标志分组,人口按年龄分组等。
5.简述组距、组限、组数与组中值的含义以及它们的计算方法。(1)组距是指各组中最大变量值与最小变量值之差,用i表示。计算方法为:
i=R/n,其中,n表示组数,R表示变量最大值与最小值之差(即全距);(2)组限是指限定各组组距的数值。各组的较大值称上限,较小值称下限;(3)组数是指数据被分成的组个数。计算方法为:
n13.322lgN式中:n表示组数;N表示变量值个数;
(4)组中值是上限到下限之间的中点数值,其计算公式为:组中值=(上限+下限)/2
6.向上积累和向下积累的数据有什么区别累计频数(或频率)可以是向上累计频数(或频率),也可以是向下累计频数(或频率)。(1)向上累计频数(或频率),通常是指由变量值小的组向变量值大的组依次累计;(2)向下累计频数(或频率),通常是指由变量值大的组向变量值小的组依次累计。
7.什么是频数分布试描述频数分布表的编制过程。(1)分布数列是指在统计分组的基础上,将总体的所有单位按一定标志分组整理,并按一定顺序排列,形成总体单位在各组的分布;(2)一、确定变量数列的形式。根据变量的类型和变量值的多少及现象本身的特点确定是编制单项数列还是编制组距数列。二、组距式变量数列编制方法:计算全距、确定组数、确定组距、确定组限、计算组中值、计算累计频数和累计频率。
8.对统计数据进行描述时,有哪几种统计图表表达方式有统计表和统计图,其中统计图包括:直方图、折线图、曲线图。
9.直方图和折线图有什么区别和关系折线图可以在直方图的基础上,将直方图的每个长方形的顶端中点用折线连点而成。如果不绘直方图,也可以用组中值与频数求出坐标点,连接而成。它们与横轴围成的区域面积相等。
10.请举出自己实际生活中的一组数据,对它进行分组,然后绘制直方图、折线图以及箱线图,分析该组数据的结构特征。
略
练习题
1.某地区7月份的气温数据(单位:摄氏度)如下:
28313229313330323429323038383739343636333430373632383530343535(1)对以上数据进行适当的分组;(2)绘制直方图,说明该城市气温分布的特点。解:(1)频数分布如下:[28,30)3;[30,32)6;[32,34)6;[34,36)7;[36,38)5;[38,40)4;(2)直方图略。从直方图可以看出,该地区7月份气温集中在34~36摄氏度的天数最多,其次多的时间集中在30~32摄氏度或32~34摄氏度。
2.某人的家位于城市的A地,工作单位位于城市的B地,为了确定A、B两地的车程,他记录了60天(来回共乘车120次)内往返于A、B两地所花的时间(单位:分钟),所得数据如下:
9810112011294968910810611111310910811299939810087891251201181031171111191001051089896110123117115109103929988808386939890120939890111109103108112123120109118929189879512111912310899103929795102108113991148995106109100108112109123121110110124108109113961231051091129698108112999093969996105111120989210310290113120(1)利用SPSS对以上数据进行排序。(2)以组距10进行等距分组,编制频数分布表,并绘制直方图。解:(1)略(2)频数分布表如下:[80,90)10,[90,100)37,[100,110)33,[110,120)25,[120,130)15;直方图略。
3.某百货公司冬天连续60天的销售额数据如下(单位:万元):372338403321286357328309329318368349369372353380331347302308383326329333342349351324369362370319342356393382
401396377379380356352349363370321316
322320336343389369375398359364354350
(1)用SPSS对以上数据进行适当的分组,编制频率分布表。
(2)计算出累积频数和累积频率。
(3)绘制直方图和折线图。
解:(1)、(2)
分组
频数
频率分布表向下累积
向上累积
[285,300)
1
1/60
1
60
[300,315)
3
1/20
4
59
[315,330)
12
1/5
16
56
[330,345)
7
7/60
23
44
[345,360)
13
13/60
36
37
[360,375)
11
11/60
47
24
[375,390)
8
2/15
55
13
[390,405)
5
1/12
60
5
(3)略。
4.为评价某餐馆服务质量,随机调查了120个顾客对它的评价。评价服务质量的等级分为
五种:A.优;B.较好;C.中等;D.较差;E.极差。调查结果如下表所示:
ACCBDBECDCABDCC
DBCBCCEDAACDDED
BBDCCDABDEEBCCE
DACDEBBACACEBBA
BCCDEDEBAACBCAE
AACDCCBEBCDEAEB
CCBEDCBABEEDBAC
BACCDADBECBDDBE
(1)编制频率分布表;
(2)绘制条形图,找出对该餐馆评价等级的分布。
解:(1)频率分布表如下:
评价等级
频数
频率
A
19
19/120
B
27
9/40
CDE(2)略
32
4/15
23
23/120
19
19/120
5.某小学对该校四年级160位学生的数学成绩分组如下:
成绩
60分以下
60~70
70~80
所占比例
%
%
%
(1)对该校四年级学生的成绩绘制直方图;
(2)根据直方图分析四年级学生的成绩分布特点。
解:(1)略;
(2)左偏分布。
80~90%
90~10015%
6.为了确定灯泡的使用寿命(单位:h),在一批灯泡中随机抽取100只进行测试,所得结
果如下:
688717696703729704726725699713
693697664681721720677679695691
692683712733717683707718671701
688689683685702741698713676702
727708749673651696689736690694
706692691747699682698700710722
698
696
666
698
658
674
697
693
710
668
708
729
694
681
695
685
706
661
735
665
701
707
692
690
708
691
722
712
715
706
700
716
728
719
685
709
691
684
705
718
(1)利用SPSS对上面的数据进行排序;
(2)以10为组距进行等距分组,构建频率分布表;
(3)根据分组数据绘制茎叶图和箱线图,说明数据分布的特点。
解:(1)略;
(2)频率分布表如下:
分组
频数
频率
[650,660)
2
1/50
[660,670)
5
[670,680)
6
[680,690)
14
[690,700)
26
[700,710)
18
[710,720)
13
[720,730)
10
[730,740)
3
[740,750)
3
(3)略。
1/203/507/5013/509/5013/1001/103/1003/100
第三章数据特征的度量
思考题
1.数据分布的特征可以从哪些方面进行度量和描述(1)数据集中程度度量的常用方法有均值(算术平均数)、调和平均数、几何平均数、众数、中位数。(2)数据离散程度的测度方法,常用的有极差、内距、标准差及离散系数。
2.简述中位数、四分位数、十分位数的概念,并举例说明。中位数是将顺序排列的统计数据从中间分成相等的两部分;四分位数就是将排序后的数据4等分的三个数值,每部分包含25%的数据,其中中间的四分位数就是中位数,其余两项分别为下四分位数(Q1)和上四分位数(Q3);十分位数和百分位数分别是将排序后的数据10等分和100等分的数值。
3.简述众数、中位数和均值的特点和关系。(1)关系:
当数据呈对称分布时,均值、中位数、众数必定相等,即有xMeMo;当数据呈左偏分布时,均值小于中位数且小于众数,即有xMeMo;当数据呈右偏分布时,均值大于中位数且大于众数,即有xMeMo;
(2)特点:均值是根据所有数据计算的一般水平代表值,数据信息的提取足够充分,特别是当用样本信息估计总体特征时,均值就更显示其良好的特征。因而在统计数据分析中均值起着很重要的作用。众数、中位数虽然数据信息利用不够充分,但当数据有极端值出现时,中位数的优势就显现了。
4.简述内距、极差、标准差的概念,并举例说明。(1)内距:又称为四分位数差,是指上四分位数和下四分位数之差,通常用Qd表示;(2)极差:也称全距,它是一组数据的最大值与最小值之差;
在组距式数列中,极差可以是最高组的上限与最低组下限之差;(3)标准差:也称均方差,是各数据和均值离差平方平均数的平方根。
5.什么是离散系数为什么要计算离散系数(1)常用的离散系数主要有标准差系数,也称均方差系数,它是数据的标准差与其相应的均值之比;(2)原因:总体和样本的离散程度除了受变量值之间的离散程度影响外,还受变量值本
身水平高低的影响,因此,在比较不同总体和样本的离散程度时,应消除由于变量值水平不同或计量单位不同带来的影响。在统计分析中,用离散系数来比较不同总体和不同样本的均值的代表性。
6.简述偏度和峰度的概念。偏度:偏度是对分布偏斜方向及程度的度量;峰度:是对数据分布尖峭程度的度量,它可以衡量频数分布的集中程度。
练习题
1.对某公司28位员工的年龄进行统计,得到数据如下(单位:周岁):
28293222234642232940263032374425
42302443253333313927
(1)计算员工年龄的众数、中位数和平均数;
(2)计算标准差;
(3)绘制员工年龄的茎叶图,说明员工年龄的分布特征。
解:(1)众数:25,中位数:30,平均数:x=S=887=31.6786;2828
(2);(3)略。
2527
2.某地区7月份上半月的气温数据如下(单位:摄氏度):35283237393733353729273031
(1)计算该地区7月份上半月气温的众数、中位数和算术平均数;(2)计算几何平均数;(3)计算气温的标准差;(4)绘制直方图,说明气温分布的特点。
解:(1)众数:37,中位数:35,算术平均数:x=S=504=33.6;1515
(2)几何平均数:G153537.5L312.671011;
(3);(4)略。(将第3题改成了分组数据)3.某百货公司冬天连续60天的销售额数据分组如下(单位:万元):
按销售额分组(万元)280~290
频数(fi)
1
组中值(xi)
285
290~300
3
295
300~310
9
305
310~320
10
315
320~330
13
325
330~340
11
335
340~350
8
345
350~360
5
355
试计算该组数据的平均数、中位数、众数。
解:(1)x325.1667,
(2)由N/230确定中位数在320~330组内,故60-23
Me320+2*10325.3846,13
(3)由题中数据分布知,众数在出现次数最多的320~330组内,故
Mo320+
13-10
*10326.
(13-10)+(13-11)
4.一项对大学生身高状况的调查表明,男生的平均身高为175cm,标准差为5cm,女生的
平均身高为165cm,标准差为5cm。试问是男生的身高差异大还是女生的身高差异大
解:比较男、女生身高的离散系数,
v男
=
男x男
=
5175
=0.02857,v女
=
女x女
=
5165
=0.0303,
v男v女,故女生的身高差异大。
5.对10名男生和10名女生的体重(单位:Kg)进行抽样调查,结果如下:
男生组
64
56
60
62
68
54
52
60
6561
女生组
52
54
45
50
48
47
54
55
4650
(1)现在要比较男生和女生的体重差异,应采用什么方法(2)比较分析哪一组的体重差异大解:(1)采用离散系数进行比较;
(2)
x男
=
60210
=60.2,男=5.0067,v男=
男x男
=0.0832,
x女
=
50110
=50.1,女
=3.573,v女
=
女x女
=0.0713,
由于v男>v女,故女生组体重差异大。
6.一种机器由多个零组件组成,在使用之前需要人工组装,现在有四种组装方法,为选取
最好的方法,随机抽取10个工人,由他们分别用四种方法进行组装。工人们分别采用四种
方法组装的机器数量(单位:台)如下:
方法A
方法B
方法C
方法D
92
65
82
79
93
69
88
73
90
59
78
69
85
60
70
70
89
62
79
75
91
67
83
68
87
56
85
65
82
58
80
70
83
63
79
72
90
62
78
71
试采用一种你认为比较好的方法来评价组装方法的优劣。解:下表给出了一些主要描述统计量:
方法A
方法B
方法C
方法D
平均数
中位数
众数
90
62
62
78、79
70
标准差
极差
11
13
18
14
最小值
82
56
70
65
最大值
93
69
88
79
7.A、B、C三个工厂生产3种产品的单位成本和总成本资料如下(单位:元):
产品名称
单位成本
A工厂
总成本B工厂
C工厂
甲
7
3410
2000
4150
乙
11
4000
5200
3820
丙
18
3890
5420
3000
试比较三个工厂哪一个总平均成本高
解:比较三个工厂的总平均成本:
34104000389011300xA3410400038901066.890110.592,
71118
xB
200052005420200052005420
126201059.5521
11.911,
71118
xC
415038203000415038203000
109701106.7967
9.911,
71118
故B工厂总平均成本最高。
(将第8题删除)
8.一应试者准备参加某公司的招聘测试,该测试分三个过程,在A项测试中,其平均分数
是120分,标准差为20分;在B项测试中,其平均分数是360分,标准差为40分,在
C项测试中,其平均分数是500分,标准差为60分。这位应试者参加测试后,在A项
测试中考了125分,在B项测试中得了380分,在C项测试中得了530分。与平均分数
相比,该应试者哪一项测试更为理想
解:通过计算标准化值来判断,
ZA
12512020
0.25,
ZB
3803600.5,40
ZC
5305000.5,60
说明在A项测试中该应聘者比平均分数高出个标准差,而B、C项测试中均高出个标准差,
由于B、C测试的标准化值A项测试,所以B、C项测试比较理想。
(将第9题删除或者放在第2章作为计算调和平均数的例子)
9.两个菜场有关销售资料如下:
绿叶蔬菜
单价(元/公斤)
甲市场的销售额(元)
A
5
2200
乙市场的销售量(公斤)330
B
1960
350
C
7
1500
430
试计算比较两个菜场价格的高低,并说明原因。
解:
x甲=
2200+1960+15002200+1960+1500
=56601004.2857
=5.636,
55.67
x乙
=
330
5+3505.6+430330+350+430
7
=
66201110
=5.964,
故乙菜场平均价格较高。
原因:尽管两个菜场的单价相同,但单价较低的蔬菜在甲菜场的销售量中所占比重较大,故
拉低了其平均价格。
10.某班学生《统计学》考试成绩表如下:
成绩(分)50~60
频率(%)(f)/f
60~70
70~80
80~90
90~100
合计
试计算该班学生的平均成绩。
解:这里是分组数据,取组中值为代表,
x=556.7%+6513.3%+7530.0%+8536.7%+9513.3%=3.685+8.645+22.5+31.195+12.635=78.66.
第四章统计指数
思考题
1.什么是统计指数统计指数与数学上的指数函数有何区别(1)统计指数:是表明复杂现象综合变动的相对数;(2)统计指数与数学上的指数函数是两种完全不同的概念。
2.统计指数的种类有哪些统计指数可以按不同的角度作不同的分类:(一)指数按其反映的对象范围的不同,可以分为个体指数和总指数;(二)指数按其所反映的社会经济现象特征的不同,分为数量指标指数和质量指标指数;(三)指数按其采用基期的不同,分为定基指数和环比指数;(四)指数按其对比内容的不同,分为动态指数和静态指数;(五)指数按照常用的计算总指数的方法或形式,可以分为综合指数和平均指数。
3.综合指数和平均数指数有何区别和联系(1)综合指数是以“先综合,后对比”的方式来编制得到的,就是将对比指标加总之后进
行对比的结果;(2)平均指数是以“先对比,后平均”的方式编制得到的,就是对个体指数进行平均的结
果。
4.什么是拉式指数和帕氏指数(1)拉氏指数是将同度量因素固定在基期水平上,因此也称基期综合指数,公式具体形式如下:
Lp
p1q0,p0q0
Lq
q1p0;q0p0
(2)帕氏指数将同度量因素固定在报告期水平上,因此也称报告期综合指数。公式具
体形式如下:
Pp
p1q1,p0q1
Pq
q1p1.q0p1
5.为何要建立指数体系指数体系有哪两种不同的含义(1)在经济分析中,一个指数通常只能说明某一方面的问题,而实践中往往需要将多个指
数结合起来加以运用,这就需要建立相应的指数体系。
(2)A.广义的指数体系类似于指标体系的概念,泛指由若干个内容上相互关联的统计指数所结成的体系;B.狭义的指数体系仅指几个指数之间在一定的经济联系基础上所结成的较为严密的数量关系式。
6.试举一日常生活中的实例来进行总量变动的因素分析。略
7.目前常见的经济指数有哪几种常用的经济指数有:居民消费价格指数、生产者物价指数(PPI)、股票价格指数、零售价格指数、农副产品收购价格指数。
练习题1.某工厂共生产三种不同的产品,其产量、成本和销售价格数据如下:
商品名称
计量单位
基期产量
报告期
产量
单位成本
销售价格
甲
台
29
33
720
850
乙
个
300
280
380
450
丙
件
198
230
45
60
计算下列指数:把(1)删除,只保留(2)
分别以单位产品成本和销售价格为同度量因素,编制该工厂的产量指数,并比较说明两
种产量指数具有何种不同的经济分析意义。解:以单位产品成本为同度量因素得
Pq=
q1c1=33720+280380+23045=140510=0.9772,q0c129720+300380+19845143790
以销售价格为同度量因素得
Pq=
q1p1=33850+280450+23060=167850=0.9785.q0p129850+300450+19860171530
同度量因素不同,以致在计算过程中产量的权数不同。
2.某市场上四种水果的销售资料如下表:
品种
销售量(kg)
基期
报告期
销售价格(元/kg)
基期
报告期
苹果
800
890
葡萄
520
572
荔枝
608
698
香蕉
746
800
合计
2674
2960
—
—
计算下列指数:
(1)用拉式公式编制四种水果的销售量指数和价格指数。(2)用帕式公式编制四种水果的销售量指数和价格指数。(3)比较两种公式编制出来的销售量指数和价格指数的差异。
解:(1)Lq=
q1p0=8905.8+5725.5+6984.8+8003.6=14538.4=1.1095,q0p08005.8+5205.5+6084.8+7463.613104
Lp=
p1q0=6800+5.8520+5.1608+3.4746=13453.2=1.0266;p0q05.8800+5.5520+4.8608+3.674613104
(2)Pq=
q1p1=8906+5725.8+6985.1+8003.4=14937.4=1.11,q0p18006+5205.8+6085.1+7463.413453.2
Pp=
p1q1=6890+5.8572+5.1698+3.4800=14937.4=1.027;p0q15.8890+5.5572+4.8698+3.680014538.4
(3)二者差异不大,帕式指数比拉式公式稍微大一些。
3.某基层供销社向农民收购农产品的有关资料如下表:
农产品名称报告期收购价格占基期的%
实际收购额(千元)
基期
报告期
甲
110
1200
1360
乙
115
800
920
丙
125
320
416
丁
140
80
140
要求:
(1)计算农产品收购价格总指数,以及由于收购价格提高使农民增加的货币收入是多少
(2)计算农产品收购量总指数,以及由于收购量的变动给农民货币收入带来的影响;
(3)计算报告期收购额与基期收购额的发展速度,及其变动差额。
解:(1)Ip
p1q01.112001.158001.253201.48027521.1467,
p0q0
120080032080
2400
p1q0p0q027522400352;
(2)Iq
q1p0
13609204161401.11.151.251.4
2469.1636
1.0288,
q0p0120080032080
2400
q1p0q0p02469.1636240069.1636;
(3)136092041614028361.1817,1200800320802400
变动差额为:2836-2400=436千元。
4.利用指数体系之间的关系回答下列问题:(1)某企业今年与去年相比,各种产品的产量增长了10%,总生产费用增长了15%。试问:
该企业今年的单位成本有何变化(2)某企业今年职工平均工资水平提高了10%,职工人数增加了3%,问该企业工资总额增
长了多少解:(1)设去年的单位成本为1,那么今年的单位成本为
1+15%=1.15=1+4.55%,1+10%1.1
比去年的单位成本增加了%;(2)设该企业去年的工资总额为1,那么今年的工资总额为
(1+10%)(1+3%)=1.11.03=1+13.3%,
比去年工资总额增加了%.
5.设有四种金融业类股票的价格和发行量数据如下:
股票名称
价格/元
发行量/万股
前收盘
本日收盘
甲
250000
乙
7500
丙
9000
丁
1230
计算股票价格指数,并对股价指数的变动作简要分析。解:
Ip=
p1iqi=3.06250000+12.567500+14.029000+16.451230=1005613.5=0.9568,p0iqi3.29250000+12.037500+13.129000+16.4712301051063.1
即股票价格指数下降了%.
6.某商场出售三种商品销售资料如下表所示:
商品计量
销售量q
价格p(元)
名称甲
单位基期q0
台
100
报告
期q1
120
基期
p0
80
报告
期p1
82
乙
件
250
300
18
20
丙
吨
400
600
40
50
销售额(元)
p0q0
p1q1
8000450016000
9840600030000
合计
—
—
—
—
试计算:(1)三种商品销售额总指数;(2)三种商品的价格综合指数;(3)三种商品的销售量综合指数;(4)分析销售量和价格变动对销售额影响的绝对数和相对数。
解:在表中把最后两列补上,
(1)vp1q19840600030000458401.6084;p0q0800045001600028500
(2)
Ip
p1q1
45840
45840
458401.1754;
p0q112803001860040960054002400039000
(3)Iq
p0q1390001.3684;p0q028500
(4)从绝对变动水平来看,
销售额变动p1q1p0q0458402850017340,价格变动的影响额=p1q1p0q145840-39000=6840,销售量变动的影响额=p0q1p0q039000-28500=10500,
三者之间的数量关系为17340(元)=6840(元)+10500(元),
即报告期与基期相比,该商场出售的3种商品的销售额增加了17340元,其中由于价格变动
使销售额增加了6840元,由于销售量变动使销售额增加了10500元。
三者之间的数量关系为1.6084=1.17541.3684,
即报告期与基期相比,该商场出售的3种商品的销售额提高了%,其中由于零售价格的变动
使销售额提高了%,由于销售量的变动使销售额提高了%.
思考题
第十章时间序列分析
1.什么是时间序列时间序列有哪些种类(1)时间序列就是将某一指标在不同时间上的数值,按照时间的先后顺序记录,并排
列而成的数列,也称为动态数列;(2)绝对数时间序列、相对数时间序列和平均数时间序列。
2.什么是基期和报告期在对各个时间的发展水平进行比较时,把作为比较基础的那个时期称为基期,把所研究
考察的那个时期t称为报告期,
3.请简述发展速度、增长速度,以及平均发展速度、平均增长速度的概念。(1)发展速度是时间序列中报告期水平与基期水平之比;(2)增长速度是指增长量与基期水平之比;(3)平均发展速度是各个时期环比发展速度的序时平均数;(4)平均增长速度是现象逐期增长的平均程度。
4.影响时间序列的主要因素有哪些长期趋势、季节变动、循环变动、不规则变动。
5.时间序列长期趋势的测定方法有哪些并分别简述它们的概念。时间序列长期趋势测定常用的方法有移动平均法、指数平滑法和趋势模型法;(1)移动平均法是用一定时间间隔内的平均值作为某一期的修匀值,从而消除时间序
列中的不规则变动以及其他变动,从而揭示出时间序列的长期趋势;(2)指数平滑法是通过计算一系列指数平滑值消除不规则变动,揭示(预测)现象的
基本趋势;(3)趋势模型法是根据时间序列的指标值的发展变化趋势,在平面直角坐标系中找到
距离所有观测点(t,xt),t1,2,L,n的平均距离最小的一条理想趋势线。
6.什么是时间数列的季节性变动季节变动数列的预测有哪些方法(1)季节变动是指时间序列受自然因素或社会因素的影响,而形成的在一年内有规律的
周期性变动;(2)常用的预测方法:按月平均法、趋势剔除法。
7.什么是时间数列的循环变动
循环变动往往存在于一个较长的时期中,是从低到高,又从高到低的周而复始的近乎规律性的变动。
练习题
1.某地区国民生产总值在2000-2003年平均每年递增11%,2004-2007年平均每年递增9%。试计算:
(1)问2007年与2000年相比,该地区国民生产总值共增长多少(2)该地区国民生产总值在这8年间发展的平均增长速度是多少(3)若2000年国民生产总值为70亿元,按(2)的平均增长速度,2007年的国民生产总值应为多少
解:(1)由于x2007=(1+11%)3(1+9%)4=(1+93.05%),故该地区国民生产总值共增长%.x2000
x2007=(1+11%)3(1+9%)4=(1+93.05%)=(1+G)7,(2)x2000
G=71.9305-1=9.8525%.(3)2007年的国民生产总值应为70(1+9.8525%)7=135.14(亿元).
2.某地区彩电制造厂2005年产量为100万台。(1)若规定2006-2007年年递增速度为9%,2008-2009年年增长速度为8%,那么2009年
该厂彩电产量是多少(2)若2007年的彩电总产量为130万台,以后每年的平均增长速度为%,那么2011年可
达到多少(3)如果2010年的彩电制造量为180万台,求5年的年平均增长速度。
解:(1)2009年的彩电产量为100(1+9%)2(1+8%)2=138.58(万台).
(2)2011年可达到130(1+8.5%)4=180.1616(万台).
(3)5年的平均增长速度为
180G5112.4746%.
100
3.某地区2001年-2006年居民消费水平资料如下:
年份
每人平均消费水平(千元)
2001年
123
2002年
134
2003年
156
2004年
159
2005年
149
2006年
205
要求:计算2002年—2006年居民每人平均消费水平的平均增长速度。
解:G5205151.66671=10.7571%.123
4.某股票公司近15年股票的每股收益如下(单位:元):
0.42
2.02
试用移动平均法预测该股票公司下一年的收益。
解:k=3时,下一年的收益为:2.02+2.49+2.53=2.3467(元),3
k=5时,下一年的收益为:1.47+1.85+2.02+2.49+2.53=2.072(元)。5
5.下表是某百货公司过去一年的营业额数据(单位:千万元):
月份
营业额(千万元)
月份
营业额(千万元)
1
7
2
8
3
9
4
10
5
11
6
12
(1)绘制时间序列图描述其形态。
(2)用3期移动平均法预测第二年1月份的营业额。
(3)采用指数平滑法,分别用平滑系数0.3,0.5预测第二年1月份的营业额,分
析预测误差,说明用哪一个平滑系数预测更合适解:(1)
(2)用10、11、12月的营业额平均值作为第二年1月份营业额的预测值,
7.89+8.6+9.098.5267(千万元)。3
(3)指数平滑法计算表如下:
月份t
营业额xt
0.3
x%t
|x%txt|
1
—
—
2
3
4
5
6
7
8
9
10
11
12
预测
—
—
合计
—
—
由于<,故当0.5时预测更合适。
0.5
x%t
|x%txt|
—
—
——
6.下表是某地区7月份前30天的气温数据(单位:摄氏度):
日期气温
日期气温
日期气温
日期气温
日期气温
1
28
7
30
13
38
19
36
25
32
2
31
8
32
14
38
20
33
26
38
3
32
9
34
15
37
21
34
27
35
4
29
10
29
16
39
22
30
28
30
5
31
11
32
17
34
23
37
29
34
6
33
12
30
18
36
24
36
30
35
(1)绘制时间序列图描述其形态。
(2)用5期移动平均法预测7月份最后一天的气温。
(3)采用指数平滑法,分别用平滑系数0.3,0.5,0.6预测7月份最后一天
的气温,分析预测误差,说明用哪一个平滑系数预测更合适解:(1)
(2)用26、27、28、29、30号的气温平均值作为7月31号气温的预测值,
38+35+30+34+35=34.4(摄氏度)5
(3)指数平滑法计算表如下:
日期t123456789101112131415161718192021222324252627282930
气温
xt
283132293133303234293230383837393436363334303736323835303435
0.3
x%t
|x%txt|
—
—
28
3
0.5
x%t
|x%txt|
—
—
28
3
0.6
x%t
|x%txt|
—
—
28
3
30
3
33
4
预测
—
—
—
—
合计
—
—
—
—
由于<<,故当0.3时预测最合适。
7.下表是某地区20年间的原煤产量数据(单位:千万吨):
年份原煤产量
年份原煤产量
年份原煤产量
1986
1991
1996
1987
1992
1997
1988
1993
1998
1989
1994
1999
年份2001200220032004
原煤产量
1990
1995
2000
2005
(1)绘制时间序列图并描述其趋势;
(2)选择一条适合的趋势线拟合数据,并根据趋势线预测2006年的原煤产量。
解:(1)
原煤产量
时间-原煤产量散点图
5
系列1
4
3
2
1
0
0
5
10
15
20
25
时间
(2)设拟合直线方程为yˆt=a+bt,根据系数公式得a=,b=。
根据yˆt=3.18542+0.00458t,当t=21时,得2006年的原煤产量为。
篇六:统计工作的阶段有哪几个他们之间的是什么关系
《统计学》(教育部教材)习题参考答案第一章
一、填空题1.数量方面定量认识2.统计总体同质性差异性大量性3.总体单位数量标志品质标志不变标志可变标志4.总体指标名称指标数值5.总量指标相对指标平均指标数量指标质量指标静态指标动态指标二、单项选择题1.B2.C3.A4.B5.B三、多项选择题1.ABDE2.ABC3.ABCD4.ABD5.ABD四、问答题1.什么是指标?指标和标志有何区别和联系?①统计指标简称指标,是指综合反映现象总体数量特征的概念(及其数值)。②指标与标志有两点区别:一是说明的对象范围不同,即指标是说明总体特征的,标志是说明总体单位特征的;二是具体表现的表示方式不同,即指标的具体表现都用数值表示,标志的具体表现只有数量标志用数值表示,品质标志则用文字表示。③指标与标志有密切联系:一是标志表现是计算指标数值的基础;二是两者随研究目的不同具有转化关系。2.指标有哪些具体分类?指标按表现形式分为总量指标、相对指标和平均指标;按性质或内容分为数量指标和质量指标;按时间状况分为静态指标和动态指标。3.什么是指标体系?设置指标体系有何意义?指标体系是指一系列相互联系的指标组成的整体。单项指标的局限性和社会经济现象的复杂性,决定了在统计中必须科学地设置指标体系,以便从不同角度、不同侧面来反映现象的全貌和事物间的联系。4.统计工作过程分哪几个阶段?如何理解统计“质—量—质”的认识过程?统计工作过程大致分为统计设计、统计调查、统计整理和统计分析四个相对
统计概述
独立、相互衔接的阶段。四个阶段基本体现了统计“质—量—质”的认识过程。统计首先要对现象进行初步的定性(质的)认识,作出统计设计;然后根据设计要求去进行量的调查和整理;最后通过统计分析,揭示现象的本质特征及其变化规律性,达到高一级的质的认识,实现统计之目的。
第二章
一、填空题
统计调查
1.准确及时全面(系统或经济)2.调查项目3.全部工业生产设备每台工业生产设备每个工业企业4.单一表一览表表头表体表脚5.调查得到的统计数字客观现象实际数量表现登记性代表性二、单项选择题1.A2.C3.C4.C5.B三、多项选择题1.BCDE2.BCDE3.ABD4.ABCDE5.ACE四、问答题1.什么是统计调查?统计调查有哪些种类?统计调查是根据统计设计的要求,采用科学的方式和方法,有计划、有组织地向总体单位登记其有关标志表现,以获取统计研究所需要的原始资料的工作过程。统计调查按组织方式分为统计报表制度和统计专门调查;按调查范围分为全面调查和非全面调查;按调查登记时间的连续性分为经常性调查和一次性调查;按搜集资料的具体方法分为直接观察法、采访法、报告法、通讯法和问卷法等。2.普查、抽样调查、重点调查和典型调查各有什么特点?普查是专门组织的一次性全面调查,其目的是为了取得调查对象在某一时点上的全面资料;抽样调查是随机抽取样本专门组织的一种非全面调查,其目的是为了从数量上推断总体;重点调查是有意识地选择一部分重点单位专门组织的一种非全面调查,其目的是为了及时了解调查对象的基本情况;典型调查是有意识地选择少数典型单位专门组织的一种非全面调查,其目的是为了深入研究调查对象的共性特征。3.什么是调查误差?如何防止可能发生的登记性误差?
统计调查误差是指调查得到的统计数字与客观现象实际数量表现的差别。防止登记性误差,首先要正确制定调查方案,调查方案所包括的各项内容,都要详细、具体、明确地加以规定和说明,使调查人员和填报单位能够正确理解和执行;其次要抓好调查方案的贯彻执行工作,包括:加强统计组织建设和人员培训,加强统计基础工作,加强统计数字质量检查;第三是全面加强统计法制建设,从根本上杜绝弄虚作假、虚报瞒报等违法行为。
第三章
统计整理
一、填空题1、分合2、组间组内3、上限不在内4、钟形U形J形5、总标题横行标题纵栏标题数字资料主词(主题栏)宾词(叙述栏)二、单项选择题1、C2、B3、B4、C5、A三、多项选择题1、BCE2、CDE3、BC4、BCD5、CE四、问答题1、简述统计整理工作的一般步骤。统计整理工作的一般步骤是:设计整理方案;审核调查资料;进行分组和汇总;复核整理资料;编绘统计图表。2、什么是统计分组?如何理解统计分组既是“分”又是“合”?统计分组是根据研究对象的特点和研究目的,按照一定的标志将总体划分为若干不同性质的组成部分(组)的一种统计方法。统计分组同时具有两方面的含义:对于总体而言是“分”,即把总体分为性质不同的若干部分;对于个体而言是“合”,即把性质相同的总体单位合并在一组。3、什么是次数密度?为什么需要计算次数密度?次数密度是指单位组距内分布的次数,表明各组内单位数分布的稠密程度。由于异距分组的次数分布受组距不同的影响,不能准确地反映总体实际的分布特征,因此需要用次数密度来消除组距不同对次数分布的影响。4、什么是分组标志?如何正确地选择分组标志?
分组标志就是统计分组时所采用的调查单位的可变标志。它是将总体区分为各个性质不同的组的标准或依据。正确地选择分组标志应遵循三个原则:根据研究目的选择分组标志;选择反映事物本质特征的主要标志;考虑现象所处的具体条件,因时因地制宜。五、综合练习某班同学上学期统计学成绩分布
分数60以下60~7070~8080~9090~100合计组中值5565758595人数(次数)491812750频率%818362414100向上累计次数413314350频率%8266286100次数密度0.40.91.81.21.4向下累计次数504637197频率%10092743814-
篇七:统计工作的阶段有哪几个他们之间的是什么关系
..(1)怎样理解统计的含义?它们之间有什么关系答:统计有三种含义:统计活动,统计数据,统计学。统计活动是对统计数据进行收集,整理,分析和推断的活动。通常划分为调查,整理,分析,统计数据是通过统计活动获得的。统计学是指导统计活动的理论和方法,是关于如何收集、整理和分析统计数据的科学;三种含义以统计数据为核心紧密联系:统计数据与统计活动是统计成果和统计过程的关系,统计活动与统计学则是统计实践与统计理论的关系。统计的本质:关于如何收集、整理和分析统计数据的科学。(2)统计研究对象是什么?它有哪些特点?统计学的研究对象是指统计研究所要认识的客体。一般来说,统计学的研究对象是客观现象总体的数量特征和数量关系,以及通过这些数量方面反映出来的客观现象发展变化的规律性。特点:数量性,具体性,社会性,总体性。(3)统计研究过程分为哪几个阶段?(一)设计整理方案
整理方案与调查方案应紧密衔接。整理方案中的指标体系与调查项目要一致,或者是其中的一部分,绝不能矛盾、脱节或超越调查项目的范围。整理方案是否科学,对于统计整理乃至统计分析的质量都是至关重要的。(二)对调查资料进行审核、订正
在汇总前,要对调查得来的原始资料进行审核,审核它们是否准确、及时、完整,发现问题,加以纠正。统计资料的审核也包括对整理后次级资料的审核。(三)进行科学的统计分组
用一定的组织形式和方法,对原始资料进行科学的分组,是统计整理的前提和基础。(四)统计汇总
对分组后的资料,进行汇总和必要的计算,就使得反映总体单位特征的资料转化为反映总体数量特征的资料。(五)编制统计表
统计表是统计资料整理的结果,也是表达统计资料的重要形式之一。根据研究的目的可编制各种统计表。(4)统计研究的基本方法包括哪些?(1)大量观察法;(2)统计分组法;(3)综合指标法;(4)时间数列分析法;(5)指数分析法;(6)相关分析法;(7)抽样推断法。(5)什么是总体和总体单位?试举实际例子说明
构成总体的每一个事物或基本单位称为总体单位。原始资料最初就是从各个总体单位取得的,所以总体单位是各项统计数字最原始的承担者。例如,研究某个工业部门的生产情况时,该工业部门的所有工业企业可以作为一个总体,每个工业企业则是总体单位,将每个工业企业的某些数量特征加以登记汇总,就取得该工业部门的统计资料。(6)什么是指标?指标和标志有什么区别和联系?
统计指标是反映社会经济现象总体某一综合数量特征的社会经济范畴,也可以说统计指标是指反映实际存在的一定社会总体现象的数量概念和具体数值.统计指标和标志的区别表现为:标志反映的是总体单位的属性和特征,有能用数量表示的数量标志,还有不能用数量表示的品质标志,而指标反映的是总体的数量特征,都能够用数量来表示。指标是通过标志的综合得到的,因此标志是总体指标的来源和基础,指标则是标志的综合。但不能因此而把指标看成仅仅是标志值的量的积累,总体指标能反映出现象的本质属性和特征,获得个体标志难以显现的信息。(7)什么是变异和变量?试举实际例子说明。
变异就是标志在同一总体不同总体单位之间的差别。例如:对某地区所有工业企业这个总体来说,其不变标志是“某个地区”,“工业”,这两个标志对总体各单位包括的范围进行了具体的界定,构成企业的同质性;而每个企业的职工人数、产量、产值等都可能不同,是变异标志。就是可变的。再有,例如:以每个职工为总体单位时,性别就是品质变异标志,因为性别分男、女。年龄、工资等是数量变异标志。
变量是将数量变异标志称为变量。它的表现形式是具体的数值,就是变量值。例如:某公司有人数650人,那人就是变量,650就是变量值。(8)什么是指标体系?指标体系指的是若干个相互联系的统计指标所组成的有机体。
-
优选
..
(9)什么是统计设计?它有哪几种类型?是根据统计研究对象的性质和目的,对统计工作各个方面和各个环节通盘考虑和安排,制定各种设计方案的过程。按研究对象的范围分为:整体设计和专项设计2)工作阶段分为:全过程设计和单阶段设计3)按时期长短分:长期短期中期设计。(10)统计设计的主要内容是什么?统计全阶段设计的内容主要有:①明确规定统计工作的目的;②确定统计对象的范围;③规定统计的空间标准和时间标准;④根据统计研究的目的,制订出调查登记的项目,分类和分组的方法以及统计指标的计算方法;⑤制定保证统计资料准确性的方法;⑥规定各个阶段的工作进度,时间安排,各个工作阶段的联系和各阶段的基本方法;⑦安排好统计工作全过程的组织工作。(11)指标的特点是什么?它有哪些分类?指标具有以下主要特点:a,数量性。指标是用数值表示客观现象两的特征的,不存在不能用数值表示的指标。b,综合性。指标是表示总体特征的数量表现,总体是有许多具有相同性质的个别事物构成的整体。总体的数量是其所包括的每个单位的标志值进行汇总和综合之后计算的,其有综合性。c,具体性。指标不是抽象的,而是一定的具体的社会经济想想两的反映,不存在脱离质的内容的指标,指标是一定时间、地点、条件下的客观实量的反应。分类:a,按指标说明的总体现象的内容不同,可以分为数量指标和质量指标。b,按指标的表现形式不同,可以分为总量指标、相对指标和平均指标。c,按指标反映事物的性质不同,可以分为实体指标和行为指标。d,按指标在管理工作的作用不同,可以分为考核指标和非考核指标。(12)设计指标体系时应遵循哪些原则?1.整体性原则:评价指标的设定应该是评价对象的各个方面,并且合理构造层次数量和指标数量。这样,才能科学地反映评价的对象,才能正确地表达评价的目的。如何划分层次和指标没有一个绝对的客观标准,要根据实际情况而定。选择评价指标,既要考虑正面收益,也要考虑负面风险,只有全方位的指标才能保证评价内容的完整性。2.重点性原则:在选择评价指标时,不可能事无巨细,面面俱到。如果将反映信息化绩效的多项指标一并罗列,既无法突出综合指标的高度概括功能和在评价中的主导作用,也夸大了一些具体指标对评价工作的影响程度,造成评价判断逻辑不清,主次不明,难以实现全面准确反映信息化绩效的基本目标。要尽可能筛选与目标关联最紧密的重要指标,指标设置数量要尽可能精简和概括,对于次要指标可以进行适当粗略化。3.层次性原则:对于反映企业信息化绩效的多重指标应该进行分析归类,一方面将主要的、概括性强的指标作为评价的主导指标,放在评价的第一层次,形成绩效评价的内在核心,将概括性稍差、从属性的指标放在第二层次,以此类推。这样有助于明确指标之间的内在联系,以利于简化评价过程。4.准确性原则:在选择评价指标时,必须对评价指标所反映的内容进行明确,确保指标的含义清楚,如果评价指标模棱两可,就会影响评价结果,甚至使评价无法进行。5.可比性原则:评价指标的建立要能够保证不同企业之间具有较好的可比性。指标体系内部及外部的同类指标之间要能够比较,同一指标要具有历史可比性。6.可度量原则:在选择关键绩效指标时,需要遵循可度量的原则。可度量是指绩效指标针对对企业目标起到增值作用的系统输出而设定,指标本身或者是定量的,或者是行为化的,验证这些指标的数据与信息可以获得,容易度量与界定。此外,数据资料应收集方便,计算简单。7.动态性原则:在信息化建设的不同阶段,要根据工作重点对指标进行调整和改变。8.独立性原则:同一层次的评价指标之间应该尽可能独立,指标的关联性应该尽可能小。(13)设计统计表时应该注意哪些问题?答:为了使统计表的设计合理、科学、实用、简明、美观,应注意以下问题:第一,设计表之前,要对列入表中的统计资料进行全面的分析研究。对如何分组,如何设置指标,哪些指标放在主栏,哪些指标放在宾栏,等等。要有一个全面的考虑与安排,务必使表的设计主次分明,简明醒目,科学合理。第二,统计表的形式应长宽比例适中,一般为长方形,既不要太长,也不能太粗短,也不能为正方形。第三,统计表的左右两端习惯上均不画线,采用开口式。第四,表中的横行“合计”一般列在最后一行(或最前一行),表的纵栏的“合计”一般列在最前一栏。第五,表的纵栏较多时,为便于阅读与核对指标之间的关系,可以按栏的顺序编号。第六,表中的总标题要简明扼要,并能确切说明表中的内容。标题内或在标题下面说明统计资料所属时间、空间。第七,表中的指标数字应有计算单位。第八,表内上下各栏数字的位数要对整齐,同类数字要保持有效的统一位数。第九,表内各主词之间、各宾词之间的排列顺序,应按时间先后、数量的大小、空间的位置等自然顺序合理编排。一般是按从
-
优选
..
小到大、从过去到现在、从低到高的顺序排列。第十,对某些资料必须进行说明时,应在表的下面注明。(14)什么是统计调查?它在统计工作中的地位如何?答:统计调查就是搜集统计资料,即根据一定目的、要求和任务,运用各种科学的调查方法,有计划、有组织地收集有关现象的各个单位的资料,对客观事实进行登记,取得真实可靠的工作过程。统计调查,在整个统计研究过程中,是基础环节,担负着提供基础资料的任务,所有的统计计算和统计研究,都是在原始资料收集的基础上建立起来的。若统计调查工作做不好,统计分析和统计预测就无从做起,也就不能发挥认识社会的作用。因此,统计调查是统计工作的基础。(15)什么是调查对象?调查单位和报告单位?三者的关系如何?答:调查对象就是需要进行研究的总体范围,即调查总体。调查单位就是要研究的总体单位,即是所要研究登记的标志的承担者。调查对象由许多性质相同的调查单位组成。例如,为了收集某地区国有工业企业生产情况的资料,则调查对象就是该地区的所有国有工业企业,每一国有工业企业就是调查单位。调查单位与填报单位的区别在于:调查单位是调查项目的承担者,而填报单位则是负责上报调查资料的单位。二者有时一致,有时不一致。例如,上例,当收集国有工业企业生产情况的资料时,每一国有工业企业是调查单位,也是填报单位。若为了收集某地区国有工业企业中高精尖设备的使用情况的资料,国有工业企业中每一台高精尖设备是调查对象,而填报单位则是每一国有工业企业(16)统计调查有哪几种类型?统计调查根据不同的标准,可以作出不同的分类。如根据调查范围的不同,可分为全面调查和非全面调查;根据调查登记时间的不同,可分为经常性调查和一次性调查;根据调查对象法定义务的不同,可分为义务性调查和自愿性凋查;根据调查组织实施主体的不同,可分为政府统计调查和民间统计调查等。本节主要介绍关于政府统计调查和民间统计调查的分类。(17)普查、重点调查、典型调查和抽样调查各自的含义和特点是什么?
普查:普查是为了某种特定的目的而专门组织的一次性的全面调查(普查通常是一次性的或周期性的;规定统一的标准时点;
规定统一的普查期限;规定普查的项目和指标;普查的数据一般比较准确,规范化程度也较高,因此它可以为抽样调查或其他
调查提供基本依据;普查的使用范围比较窄,只能调查一些最基本及特定的现象)重点调查:重点调查是指在全体调查对象中选择一部分重点单位进行调查,以取得统计数据的一种非全面调查方法(重点调
查的主要特点是:投入少、调查速度快、所反映的主要情况或基本趋势比较准确)典型调查:是根据调查目的和要求,在对调查对象进行初步分析的基础上,有意识的选取少数具有代表性的典型单位进行深
入细致的调查研究,借以认识同类事物的发展变化规律及本质的一种非全面调查(定性调查;是根据调查者的主观判断,选择
少数具有代表性的单位进行调查;面对面的直接调查;方便、灵活,可以节省时间、人力和经费)
抽样调查:是一种非全面调查,它是从全部调查研究对象中,抽选一部分单位进行调查,并据以对全部调查研究对象作出估计和推断的一种调查方法(调查样本是按随机的原则抽取的,在总体中每一个单位被抽取的机会是均等的,因此,能够保证被抽中的单位在总体中的均匀分布,不致出现倾向性误差,代表性强;是以抽取的全部样本单位作为一个“代表团”,用整个“代表团”来代表总体。而不是用随意挑选的个别单位代表总体;所抽选的调查样本数量,是根据调查误差的要求,经过科学的计算确定的,在调查样本的数量上有可靠的保证;抽样调查的误差,是在调查前就可以根据调查样本数量和总体中各单位之间的差异程度进行计算,并控制在允许范围以内,调查结果的准确程度较高)(18)什么是统计报表?它的作用是什么?统计报表是按国家统一规定的标志,统一的指标项目,统一的报送时间,自上而下逐级定期提供基本统计资料的一种调查方法。它是贯彻执行统计报表制度的重要条件,还是企业会计核算和业务核算的依据。(19)什么是数据整理?数据整理的主要内容是什么?数据整理是对调查、观察、实验等研究活动中所搜集到的资料进行检验、归类编码和数字编码的过程。它是数据统计分析的基础。内容是统计分组,汇总,编表和绘图等。(20)什么是统计分组?统计分组有哪些分类?答:统计分组就是根据统计研究的目的和客观对象的内在特点,按某个标志(或几个标志)把被研究的总体划分为若干个不同性质的组,就称为统计分组。
-
优选
..
统计分组按任务和作用的不同,分为类型分组、结构分组和分析分组;按分组标志的多少为分简单分组和复合分组;按分组标志的性质不同分为品质分组和变量分组。统计分组必须遵循以下两个原则:a、穷尽原则;b、互斥原则。(21)什么是简单分组和复合分组?为什么不宜用过多标志进行复合分组?
简单分组及平等分组体系。简单分组是只用一个标志对总体进行分组。只能反映现象在某一标志特征方面的差异情况,而不能反映现象在其他标志特征方面的差异。对于同一总体运用两个或两个以上标志进行简单分组后平等排列形成的体系即平行分组体系。
复合分组及复合分组体系。复合分组是对同一总体按两个或两个以上标志层叠进行的分组。进行复合分组时,要注意先按主要标志分组,再按次要标志分组。由复合分组形成的体系称不复合分组体系。
如果分组标志过多,那么形成的组数就会成倍增加,反而不易显示总体的特征。(22)什么是变量数列?它的构成要素是什么?如果将总体按数量标志分组就形成变量分组数列,简称变量数列。一是总体按某标志分的组;另一个是次数。(23)编制组距数列的方法、步骤是什么?基本步骤为:(1)将原始资料按数值大小依次排列。(2)确定变量的类型和分组方法【单项式分组或者组距式分组】(3)确定组数和组距。当组数确定后,组距可计算得到:【组距=全距÷组数全距=最大变量值-最小变量值】(4)确定组限【第一组的下限要小于或等于最小变值,最后一组的上限要大于最多打变值】(5)汇总出各组的单位数【注意:不同方法确定的组限在汇总单位数时的区别】计算频率,并编制统计表(24)常用的统计图有哪些?常用的统计图有:条形统计图,折线统计图和扇形统计图(25)什么是总量指标?它在经济统计中有何作用?总量指标:是反映某种社会经济现象在一定时间、空间和条件下的总规模、总水平或工作总量的综合指标,由于总量指标的表现形式为绝对数,因此,总量指标又叫统计绝对数。总量指标在社会经济统计中具有重要的作用:总量指标是认识社会经济现象的起点;总量指标是实行社会经济管理的依据之一;总量指标是计算相对指标和平均指标的基础(26)时期指标与时点指标有什么区别与联系?
时期数列的各指标值具体有连续统计的特点,而时点数列的各指标值不具有连续统计的特点;时期数列各指标值的大小与所包括的时期长短有直接的关系,而时点数列各指标值的大小与时间间隔长短无直接关系。(27)结构相对指标、比例相对指标和比较相对指标有什么不同的特点?试举例说明。答:结构相对指标:结构相对指标是在对总体分组的基础上,以总体总量作为比较标准,求出各组总量占总体总量的比重,来反映总体内部组成情况的综合指标。【如:各工种的工人占全部工人的比重】比例相对指标:是同一总体不同部分数量对比结果。【如:一个班男生人数是女生的2倍】比较相对指标:同类指标在不同空间下进行对比。【如:甲公司的职工平均收入是乙公司职工平均收入的2.2倍】(28)如何评价计划完成程度相对指标?计划完成程度相对指标简称“计划完成程度指标”、“计划完成百分比”,是社会经济现象在某时期内实际完成数值与计划任务数值对比的结果,一般用百分数来表示。计划完成程度相对指标是用来检查、监督计划执行情况的相对指标。它以现象在某一段时间内的实际完成数与计划数对比,来观察计划完成程度。(29)计算和应用相对指标应注意哪些问题?统计相对数是一种抽象化的指标数值,是对现象进行对比分析的一个重要手段,要使这种对比分析准确地、深刻地反映出现象之间的联系,充分发挥统计相对数的作用,在计算应用统计相对数时必须注意以下几个问题:必须注意指标的可比性;相对数与绝对数结合起来运用;要正确地选择作为比较标准的基期;为了从各方面分析和研究问题,需要把各种相对数结合起来使用。(30)什么是平均指标?它在社会经济统计中有何作用?平均指标是同类社会经济现象一般水平的统计指标,其数值表现为平均数。其主要作用有:第一,可以反映总体现象的一般水平;第二,可以用来对同类现象在不同空间.不同时间条件下的对比分析;第三,可以研究总体单位分布的集中趋势。(31)平均指标与强度相对指标的本质区别是什么?(1)概念不同。强度相对数是两个有联系而性质不同的总体对比而形成相对数指标。算术平均数是反映同质总体单位标志值一般水平的指标(2)反映的问题不同。强度相对数反映两不同总体现象形成的密度、强度。算术平均数反映同一现象在同一总体
-
优选
..
中的一般水平(3)计算公式及内容同。算术平均数分子、分母分别是同一总体的标志总量和总体单位数,分子、分母的元素具有一一对应的关系,即分母每一个总体单位都在分子可找到与之对应的标志值,反之,分子每一个标志值都可以在分母中找到与之对应的总体单位。而强度相对数是两个总体现象之比,分子分母没有一一对应关系4)有的强度相对指标的分子分母可倒置;平均数则不可(5)作用不同。平均指标的作用有:.反映总体各单位变量分布的集中趋势和一般水平;比较同类现象在不同空间或不同阶段的发展水平;分析现象之间的依存关系;作为评价事物和作为决策的数量标准或参考;可进行数量估算。强度相对指标的作用有:以说明一个国家、地区或部门的经济实力或社会服务能力;借助强度相对指标可以进行国家、地区之间的比较,确定发展不平衡和发展的差距。(32)在对相对数和平均数计算平均数时,如何应用加权算数平均数和加权调和平均数?加权算术平均数一般用在未知分子的情况下,即总体标志总量未知。调和算术平均数一般用在未知分母的情况下,即总体单位数未知(33)什么是标志变异指标?它的作用是什么?答:标志变异指标即标志变动度,它是反映总休各单位标志值的变异范围或差异程度的指标。标志变异指标是用来刻画总体分布的离散程度或变异状况,标志变异指标值越大,表明总体单位标志值的变异程度越大;反之,则小。作用:(1)用于衡量平均指标的代表性;(2)反映社会经济活动的均衡性;3)研究总体标志值分布偏离正态的情况;(4)用于衡量统计推断效果。(34)为什么要计算标准差、计算标准差系数?标准差系数是以相对数形式表示的变异指标。它是标准差与其平均数对比得到的。当不同总体平均数不相等、计量单位不一致时,则须采用标准差系数来比较平均数代表性大小。(35)平均差和标准差的主要异同是什么?标准差=方差的算术平方根;标准差,也称均方差,是各数据偏离平均数的距离的平均数,它是离均差平方和平均后的方根,用σ表示。标准差是方差的算术平方根。标准差能反映一个数据集的离散程度。平均数相同的,标准差未必相同。平均差是总体所有单位的平均值与其算术平均数的离差绝对值的算术平均数。平均差是一种平均离差。离差是总体各单位的标志值与算术平均数之差。因离差和为零,离差的平均数不能将离差和除以离差的个数求得,而必须讲离差取绝对数来消除正负号。(36)什么是动态数列?动态数列分为几种?各种动态数列有何特点?定义:将某种现象在时间上变化发展的一系列同类的统计指标,按照时间先后顺序排列,就形成了一个动态数列,也称时间数列,时间序列。种类:动态数列按其表现形式的不同,分为绝对数动态数列、相对数动态数列和平均数动态数列三种。绝对数动态数列:把一系列同类的总量指标按时间先后顺序排列而形成的动态数列,称之为绝对数动态数列。按照绝对数所反映的社会经济现象的不同性质,绝对数动态数列又可分为时期数列和时点数列两种。相对数动态数列:把一系列同类的相对指标数值按时间先后顺序排列而形成的动态数列,称之为相对数动态数列。它可以用来说明社会现象间相互联系的发展变化情况。平均数动态数列:把一系列同类的平均指标数值按时间先后顺序排列而形成的动态数列,称之为平均数动态数列。它可以用来说明社会现象在不同时期的一般水平的发展变化情况。(37)编制动态数列有何意义?编制动态数列应注意哪些基本要求?时间数列将反映社会经济现象数量特征的统计指标按时间顺序进行排列,可以从动态上了解现象发生、发展、变化的全过程,便于对现象有更深入、全面的认识;通过对时间数列指标的计算和分析,可以了解现象的发展速度、变化规律和未来趋势,便于对现象做出短期或长期预测,为生产、管理、决策提供依据;通过对时间数列各影响因素的分析,可以了解对现象数量变动起决定作用的因素是什么?从而更好地把握事物的发展方向。时间数列编制时应注意数列中各时期的一致性、指标所包含的经济内容、总体范围、计算方法等的一致性,使资料有充分的可比性。(38)什么是环比发展速度和定基发展速度?两者的关系如何?定基发展速度是报告期发展水平与某一固定基期发展水平之比。环比发展速度是报告期发展水平与前期发展水平之比。这两种速度指标之间存在一定关系,而环比发展速度的连乘积,等于定基发展速度。由各期环比增长速度求第N期的定基增长速度,先将各期环比增长速度加1,还原成各期环比发展速度,然后将其连乘后得出
-
优选
..
第N期定基发展速度,再用所得结果加减去1,就可得到定基增长速度了!(39)动态分析采用的分析指标有哪些?发展水平,平均发展水平,增长量,平均增长量,发展速度,平均发展速度,增长速度,平均增长速度。(40)为什么要注意水平指标和速度指标的结合运用?如何结合?答:现象发展的水平分析是现象发展速度分析的基础,速度分析是水平分析的深入和继续,把它们结合起来运用,就能够对现象发展变化规律作出更加深刻的分析。首先,要把发展速度和增长速度同隐藏在其后的发展水平结合起来。在进行动态分析时,既要看速度,又要看水平,有一个很有代表性的指标,即增长1%的绝对值。增长1%的绝对值=基期水平×1%。其次,要把平均速度指标与动态数列水平指标结合起来。平均速度是一个较长时期总速度的平均,它是那些上升、下降的环比速度是一个较长时期总速度的平均,它是那些上升、下降的环比速度代表值。如果动态数列中间时间时期指标值出现了特殊的高低变化,或者最初、最末水平受特殊因素的影响,使指标值偏离常太,不管用几何平均法或用方程式法来计算平均速度,都将降低或失去说明问题的意义。所以,仅仅计算一个平均速度指标是不够的,应该联系各期水平,计算各期的环比速度结合起来分析。在分析较长历史时期的动态资料时,这种结合可依据各个局部时期的发展水平,计算分段平均速度来补充说明总平均速度。(41)什么是抽样推断?它有哪些特点?抽样推断(SampleInference)是在根据随机原则从总体中抽取部分实际数据的基础上,运用数理统计方法,对总体某一现象的数量性作出具有一定可靠程度的估计判断。特点:1、按随机的原则抽取样本。2、在数量上,以样本推断总体。3、抽样推断的误差可以事先计算和控制。(42)抽样调查的组织形式有几种?各适合于什么情况?抽样组织方式是指简单随机抽样、类型抽样、等距抽样和整群抽样等基本抽样方式和不同抽样方式的组合方式。(43)什么是抽样误差?抽样误差与一般的统计误差有什么不同?影响抽样误差的因素有哪些?抽样误差是指由于随机抽样的偶然周素使样本各单位的结构对总体各单位结构的代表性差别,而引起的抽样指标和全及指标之间的绝对离差。影响抽样误差大小的因素主要有:(1)总体单位的标志值的差异程度。差异程度愈大则抽样误差愈大,反之则愈小。2)样本单位数的多少。在其他条件相同的情况下,样本单位数愈多,则抽样误差愈小。3)抽样方法。抽样方法不同,抽样误差也不相同。一般说,重复抽样比不重复抽样,误差要大些。4)抽样调查的组织形式。抽样调查的组织形式不同,其抽样误差也不相同,而且同一组织形式的合理程度也会影响抽样误差。(44)哪些因素决定了抽样的数量?(1)抽样推断的可靠程度。它与概率度t有关。若要求抽样的可靠程度较高,那么t值也较大。这样抽样的数目就要多些;若可靠程度要求不高,那么t值也较小,这样抽样的数目就要少些。(2)总体方差的大小。即被研究总体标志的变异程度σ2和p(1-p)若变异程度大,则需多抽取一些样本单位;若变异程度小,则可少抽取一些。可以想象,如果总体各单位标志值相等,只抽一个样本单位即可。(3)抽样极限误差Δx或Δp,的大小。即抽样推断的精确程度。抽样极限误差是指估计值的误差范围。如极限误差小,即允许误差小,则需多抽取样本单位。如果不允许有抽样误差,就只能进行全面调查,才能保证有较高的准确度。(4)抽样方法与组织形式。一般在同样的条件下,重复抽样需要多抽取样本,此外,抽样单位数目的多少还取决于不同的组织方式.一般分层抽样和等距抽样可以比纯随机抽样需要的样本单位数少,整群抽样比纯随机抽样需要的单位数多。(45)抽样估计有哪些特点?其优良标准是什么?估计的优良标准是无偏性、一致性和有效性影响时间序列的因素大体上可以分为四种,即长期趋势、季节变动、循环波动和不规则波动。(46)什么是概率度?什么是置信度?这两者有什么关系?置信度,也叫置信水平。它是指特定个体对待特定命题真实性相信的程度.也就是概率是对个人信念合理性的量度.概率的置信度解释表明,事件本身并没有什么概率,事件之所以指派有概率只是指派概率的人头脑中所具有的信念证据。置信水平是指总体参数值落在样本统计值某一区内的概率;而置信区间是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。(47)假设检验与参数的区间估计有何区别与联系?参数估计:指的是用样本中的数据估计总体分布的某个或某几个参数,比如给定一定样本容量的样本,要求估计总体的均值、方差等。
-
优选
..
假设检验:通过样本分布,检验某个参数的属于某个区间范围的概率。参数估计分两种,一种是点估计,另一种是区间估计。其中,区间估计与假设检验可以看作同一个问题的不同表述方式。(48)何为假设检验中的第一类错误和第二类错误?它们之间是什么关系?第一类错误:原假设H0符合实际情况,检验结果将它否定了,称为弃真错误。第二类错误:原假设H0不符合实际情况,检验结果无法否定它。称为取伪错误。(49)假设检验依据的基本原理是什么?它的基本思想可以用小概率原理来解释。所谓小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。(50)简述假设检验的一般步骤。(一)根据所研究问题的要求,提出原假设和备择假设二)找出检验的统计量及其分布。三)规定显著性水平,就是选择发生第一类错误的最大允许概率四)确定决策规则五)计算检验统计量的值,作出统计决策。(51)如何理解假设检验中的显著水平α?确定显著性水平的原则是什么?假设检验运用了小概率原理,事先确定的作为判断的界限,即允许的小概率的标准,称为显著性水平。如果根据命题的原假设所计算出来的概率小于这个标准,就拒绝原假设;大于这个标准则不拒绝原假设。这样显著性水平把概率分布分为两个区间:拒绝区间,不拒绝区间。显著性水平不是一个固定不变的数字,其越大,则原假设被拒绝的可能性愈大,原假设为真而被否定的风险也愈大。显著性水平应根据所研究的的性质和我们对结论准确性所持的要求而定。(52)什么是方差分析?它所研究的是什么问题?答:方差分析就是通过检验各总体的均值是否相等来判断分类型自变量对数值型因变量是否有显著影响。它所研究的是非类型自变量对数值型因变量的影响。(53)方差分析包括哪些类型?它们有何区别?答:方差分析可分为单因素方差分析和双因素方差分析。区别:单因素方差分析研究的是一个分类型自变量对一个数值型因变量的影响,而双因素涉及两个分类型自变量。(54)方差分析有哪些基本假定?1.可加性2.正态性3.方差同质性(齐性)。(55)简述方差分析的基本思想?方差分析的基本思想是根据研究目的和设计类型,将总变异中的离均差平方和SS及其自由度分别分解成相应的若干部分,然后求各相应部分的变异;再用各部分的变异与组内(或误差)变异进行比较,得出统计量F值;最后根据F值的大小确定P值,作出统计推断。(56)什么是交互作用?交互作用,是一因子对另一因子的不同水准有不同的效果。是指一个实验中有两个或两个以上的自变量,当一个自变量的效果在另一个自变量的每一个水平上不一样时,我们就说存在着自变量的交互作用。当存在交互作用时,单纯研究某个因素的作用是没有意义的,必须分另一个因素的不同水平研究该因素的作用大小。(57)解释相关系数的含义,并举出三个例子。相关关系是一种不完全确定的随机关系,在相关关系的情况下,因素标志的每个数值都可能有若干个结果标志的数值与之对应。因此,相关关系是一种不完全的依存关系。(58)简述相关关系的函数关系有何区别与联系。相关关系是两个现象数值变化不完全确定的随机关系,是一种不完全确定的依存关系。相关关系与函数关系的不同之处表现在:(1)函数关系指变量之间的关系是确定的,而相关关系的两变量的关系则是不确定的。可以在一定范围内变动;(2)函数关系变量之间的依存可以用一定的方程y=f(x)表现出来,可以给定自变量来推算因变量,而相关关系则不能用一定的方程表示。函数关系是相关关系的特例,即函数关系是完全的相关关系,相关关系是不完全的相关关系。(59)简述相关关系的种类。2)相关关系的种类:①按照相关关系涉及的因素(变量)多少,可分为单相关和复相关;②按照相关关系的表现形式不同,可分为线性相关与非线性相关。对于一元相关,即为直线相关和曲线相关;③对于单相关,按照现象数量变化的方向不同。可分为正相关和负相关;④按照相关程度不同,可以分为完全相关,不完全相关和无相关。(60)简述相关系数的取值及其意义。
-
优选
..
答:(1)相关系数的数值范围是在-1和+1之间,即-1≤r≤1,r>0为正相关,r<0为负相关。(2)判断标准:3.0r为微弱相关,0.3<r<0.5为低度相关;0.5<r<0.8为显著相关,0.8<r<1为高度相关;r=0时,不相关,r=1时完全相关。(61)简述回归分析和相关关系的区别与联系。就一般意义而言,相关分析包括相关分析和回归分析两方面的内容,因为他们都是研究变量间的相关关系的方法。但就具体方法而言,二者又有明显区别:(1)相关分析的具体形式,无法从一个变量的变化推测另一个变量的变化情况;回归分析则是用数学方程来反映变量之间相互关系的具体形式,可以从一个已知量的变化爱推测另一未知量,为估计预测提供一个重要的方法。(2)相关分析既可以研究因果关系的现象也可以研究共变关系的现象,不区别自变量和因变量,而回归分析则是研究变量间因果关系的,必须明确自变量的因变量。(3)计算相关系数的两个变量是对等的,相关系数只有一个;而在回归分析中,只能由自变量来估计因变量,不允许由因变量来推测自变量4)相关分析中两变量都是随机变量;而在回归分析中,因变量都是随机的,自变量是给定的。对于无明显因果关系的相关变量,可以先将某个因素确定为自变量的数值,需要时再将另一变量确定为自变量,估计因变量的数值,但绝不能用一个回归方程进行逆变。相关分析和回归分析的关系是:相关分析需要回归分析来表明变量间的数量关系的具体形式,而回归分析应建立在相关分析的基础上。依靠相关分析表明现在的数量变化具有密切的相关,进行回归分析求其相关的具体形式才有意义。(62)在直线回归方程yc=a+bx中,参数a和b的含义是什么?怎样求出a和b的值?参数a代表直线的起点值,在数学上称为直线纵轴截距,b代表自变量增加一个单位时因变量的平均增加值,数学上称为斜率,也称回归系数。(63)什么是统计指数?所有的相对数都可称作指数吗?有广狭二义:狭义指综合反映不能直接相加的社会经济现象总体总动态的相对数。通称总指数。广义指说明同类现象对比的相对数,既包括总指数,也包括个体指数;既包括时间上的对比,也包括空间上的对比。(64)什么是综合指数?什么是平均指数?二者之间有何区别与联系?区别:1综合指数是通过引进同度量因素,先计算出总体的总量,然后再进行对比,即先综合,后对比!平均指数是在个体指数的基础上计算总指数,即先对比,后综合。2、综合指数需要研究总体的全面资料,对于综合作用的同度量因素的资料要求也比较严格,一般应采用与指数化指标有明确经济联系的指标,且应有一一对应的全面实施资料!二平均指数则既适用与全面的资料,也适用与非全面的资料,对资料的要求也比较灵活。(65)同度量因素有何作用?在编制综合指数时,应如何选择使用同度量因素?其时期怎样固定?答:在统计指数编制中,能使不同度量单位的现象总体转化为数量上可以加总,并客观上体现它在实际经济现象或过程中的份额这一媒介因素,称为同度量因素。一般情况下,编制数量指标综合指数时,应以相应原基期的质量指标为同度量因素;而编制质量指标综合指数时,应以相应的报告期的数量指标为同度量因素。(66)什么是指数体系?因素分析与指数体系的关系如何?举例说明指数因素分析如何进行。指数体系是指经济上具有一定联系而且数量上具有对等关系的三个或三个以上的指数所构成的一个整体。利用指数体系从数量方面分析现象总动态中各个因素变动影响的方法称为因素分析。(67)两因素分析应如何进行?对多因素分析,在方法上要注意的问题有哪些?一个总指标,如果受两个因素的影响,则对这个总量指标的因素分析称为总量指标的两因素分析。两因素分析所依据的指数体系通常是由价格指数、数量指标指数和质量指标指数所构成的,因素指数一般用综合指数形式编制。总量指标变动的两因素分析的关系式如下:
q1p1q0p0
p1q1p0q1
q1p0绝对数变动分析:q0p0
p1q1
q0p0
(68)平均指标变动的因素分析应编制哪几种指数?如何进行分析?可变构成指数,固定构成指数,结构变动指数。(69)什么是统计预测?它有哪些种类?统计预测是在大量统计资料的基础上,运用社会、经济、环境统计和数理统计方法研究事物发展变化趋势和方向的预测方法。主要可分为定性预测和定量预测,按时间可分为:近期预测、短期预测、中期预测、长期预测按预测是否重复:一次性预测、反复预测
-
优选
..
(70)统计预测时必须遵循哪些原则?进行统计预测的步骤是什么?统计预测的程序为:①确定统计预测目标;②搜集与整理有关历史资料;③确定统计预测方法;④建立预测模式;⑤进行预测;⑥分析预测误差;⑦确定预测值。在环境预测中,常常采用统计预测的方法,即通过对大量实验或试验资料的统计处理(常用回归分析方法),建立反映开发活动与环境后果之间的关系式,然后在一定的条件下进行预测。运用统计预测,必须注意自变量和因变量之间要有必然的、本质的联系,统计数据的获得较易,统计数据的数量、精度应满足一定要求。(71)什么是统计综合分析?统计综合分析简称综合评价(prehensivestatisticalanalysis),是指根据分析研究的目的,依据统计资料,运用统计方法,结合现象所处的具体环境和条件,对事物总体的规模、水平、速度、质量等方面做出的综合分析评价。综合分析和评价是对事物的定性分析和定量分析的结合,是在定性分析的前提下,对研究现象进行更全面、更深刻的认识。(72)统计综合分析的一般步骤是怎样的?一)确定评价的目标二)确立评价的指标体系三)选择合适的综合评价方法四)确定评价指标的权重系数五)选择合适的评价标准六)提出改进意见(73)常见的综合评价方法有哪些?各有什么特点?一)定性法定性方法主要有综合法和分析法。综合法(Synthesismethod)是采取征集专家意见的方法来确定评价指标。一般采取研讨会或征询意见的方式来征集专家的意见。这种方法是借助于专家们的智力优势或经验来选择统计评价指标。由于专家可能比较集中、也可能比较分散,针对具体情况可以采取一次或者多次的形式选择确定。当专家们对选择指标的意见分散时,要进行客观的原因分析,是由于专家们对被评价现象的了解程度不同、还是对现象的认识不同,在准确分析的基础上,以获得客观的选择指标。分析法(AnalysisMethod)是将被评价对象划分为若干部分、不同的组、或不同的侧面,明确各个部分评价的问题的内涵和外延,然后对每个部分分别选择一个或几个指标来反映评价对象的特征。这种方法的应用更能充分利用人们的工作经验,反映客观实际的工作态度。二)定量法常用的定量法有试算法和系统聚类法。试算法(TestAlgorithm)是通过对历史数据的试算来判断指标的有效性。例如,要评价2007年全国耕地可持续利用的实施效果,可以以2006年的数据进行试算,通过试算结果判断所选指标是否合适,然后对相关指标进行科学比较分析,把代表性强的指标确定下来,不断筛选,直到满意为止。2.系统聚类法系统聚类法(Systemclusteringmethod)是通过判断指标之间的相似程度来筛选指标的方法。例如,假设有个指标,将每个指标作为一类,根据指标之间的相似程度,通过各类之间距离的比较,把距离最小的两类进行合并;然后在类中,再选择各类之间距离最小的进行合并;如此连续的进行,逐步选择出所需要的评价指标。被研究总体中所有指标的亲疏关系和并类选择的情况可以绘制成一X系统聚类图,
-
优选
篇八:统计工作的阶段有哪几个他们之间的是什么关系
《统计学原理》复习题一、填空题:1、在指数体系中,对象指数等于各因素指数的(连乘积),对象指数的绝对增减量等于各因素指数引起的相应的绝对增减量的(绝对数值之和)。2、对统计调查的基本要求是,在搜集统计资料时必须做到(准确)(及时)(全、、面)(系统)、。3、时间数列按排列的指标不同可以分为(绝对数)时间数列、相对数)时(间数列和(平均数)时间数列三种。4、普查是一种(全面)调查,而典型调查、重点调查和抽样调查都是(非全面)调查。5、抽样调查是按照随机)(原则从总体中抽取一部分单位进行观察,并根据样(本指标数值)的资料推断(总体指标数值)的一种方法。6、总量指标按计量单位不同可以分为实物指标、(价值)指标和(劳动)指标。7、一个完整的统计工作过程可以分为4个阶段:统计设计)(、(统计调查)统、(计整理)(统计分析)、。8、抽样调查的组织方式有(简单随机)抽样、(类型)抽样、(等距)抽样和(整群)抽样。9、标志是说明(总体单位拟属性或特征),指标是说明(总体数量特征)的。10、变量就是可变的(数量标志),变量的数值就是(变量值)。11、常见的专门调查的方法主要有(普查)(重点调查)(抽样调查)(典、、、型调查)。12、表明标志变异程度的指标主要有(全距)(平均差)(标准差)和(标志、、变动)。13、两个变量之间的相关关系称为(单)相关,三个或三个以上变量之间的相关关系成为(复)相关。14、时间数列由两个基本要素构成,一是现象所属的(时间),二是(各时间上的统计指标数值)。15、统计调查是根据(统计工作任务和统计设)的要求,运用科学的方法对(调查单位)进行有组织、有计划、有系统地收集(调查资料)的过程。
16、统计报表是按照(国家有关)部门统计规定的表式、统一指标、统一报送程序和报送时间,自下而上逐级提供(基本统计资料)的一种调查方式。17、调和平均数是总体单位标志值(倒数)的(简单算术平均数)的倒数。18、普查是专门组织的(一次性)的(全面)调查。19、用综合指数法编制总指数时,确定同度量因素时期的一般原则是:数量指标总指数,以(基期)指标作为同度量因素;质量指标总指数,以(报告期)指标作为同度量因素。20、抽样调查是按照(随机)原则从总体中抽取一部分单位进行观察,并根据这部分单位的资料推断(总体的相应指标数值)的一种方法。21、在直线回归方程yc=a+bx中,a为截距,表明x=(0)时,yc的数值;b反映y依x的回归关系,因此,b又称为(回归)系数。
二、单选:
1性别、年龄这样的概念可以用来(表示个体的特征)2某地区全部商业企业为总体,每个商业企业为总体单位,则该地区全部商品销售额为(数量指标)3某班4个学生考试成绩分别为75分、80分、90分和98分,这四个数字是(变量值)4商业企业职工人数、商品销售额是(前者是离散变量,后者是连续变量)'5在统计调查中,调查标志的承担者是(调查单位)6工业企业设备普查时,每个工业企业是(填报)单位7在统计工作中,营业员填写的发货票属于(原始记录)8对该地食品零售场所进行一次全面调查,其总体单位是(每个食品店)9下面属于品质分配数列的资料是(发行影片按种类)分配10下面属于变量分配数列的资料是(电站按发电能力)11向下累计次数的含义是(下限以上)累计次数12要准确反映异距数列的实际分布情况,必须采用(次数密度)13某月份某工厂工人出勤率属于(结构)相对数14计划成本降低3%,实际降低5%,则计划完成程度相对数为(97.9%)15时期指标和时点指标的最根本区别是在于各自反映现象的(时间状况不同)
16在相对指标中,主要用名数来表现指标数值的是(强度相对数)17在变量数列中,若标志值较小的组,而权数较大时,计算出来的平均数(接近于标志值小的一方)18某企业在基数老职工占60%,在报告期准备招收一批青年工人,估计新职工所占比重将比基期增加20%,假定老职工和新职工工资水平不变,老职工工资高于新职工,则全场的总平均工资将(降低)19某公司下属5个企业,共有2000名工人,已知每个企业某月产值计划完成程度和产值,要计算该公司月平均产值计划完成程度,采用加权调和平均数方法计算,其权数是(实际产值)20根据某管理局8家企业每一家的工人月平均工资和每家企业工人数占所有企业工人数的比重资料,要计算该管理局工人的月平均工资,应采用的计算形式是(加权算术平均数)21两个总体平均数不等,但标准差相等,则(平均数大,代表数大)22.已知甲、乙两班工人的日产量分别为X甲=5件,X乙=7件,其日产量的方差分别为,则(甲、乙两班的平均数代表性相同)23.标准差系数抽象了(总体单位数)的影响24.是非标志的标准差的最大值是(0.5)25.某现象指标发展变化的速度平均来说是增长的,该指标的增长量是(无法做决定)26.长期趋势测定的移动平均法,移动的项数越多(显现出波动越小,修匀得越平滑)27.某县1995-2000年期间粮食产量配合的直线趋势方程Y=800+5.5,式中时间变量t=-5,-3,-1,1,3,5.为确定1996年的趋势值,代入的t值应当是(-3)以1949年a为最初水平,2006年a为最末水平,计算钢产量的年平均发展速度时,须开(57)次方在掌握报告期几种产品实际总成本和这些产品的个体成本指数资料的条件下,要计算产品成本的平均变动,应采用(加权调和平均)指数在由三个指数所组成的指数体系中,两个因素指数的同度量因素通常(一个固定在基期,一个固定在报告期)
已知劳动生产率可变组成指数为134.2%,职工人数结构影响指数为96.3%,则劳动生产率固定构成指数为(139.36%)如果生活费用指数上涨20%,则现在的1元钱(只值原来的0.83元)已知概率为99.73%的抽样估计区间为51~69,则概率为95.45%的抽样估计区间为(54~66)在进行简单随机抽样时,为使抽样平均误差减少25%,则抽样单位数应该(增加78%)在其他条件都相同的情况下,若抽选总体5%的单位做样本,则重复抽样平均误差为不重复抽样误差的(1.03倍)影响类型抽样误差大小的主要是平均(组内方差)已知X和Y两变量之间存在着线性相关关系,则X与Y之间存在着(较密切的负相关)]两个变量之间的相关关系称为(单相关)估计标准误差是反映(回归直线代表性)的指标回归系数和相关系数的符号是一致的,其符号均可用来判断现象是(正相关还是负相关)三、多选:在全国工业普查中(所有工业企业是总体;各企业工资总额是标志;各企业的劳动生产率是变量;全国工业企业职工月工资平均额是质量指标)总体和总体单位之间的关系(不是固定不变的;是可以变换的;总体单位有时可以成为总体)一个统计指标体系之内,若干统计指标之间,在几个方面必须相互联系,是指(时间范围;空间范围;指标口径;计算方法)统计指标和指标体系设计的原则是(目的性原则;科学性原则;统一性原则;联系性原则;可比性原则)填报统计报表必须按照统一的(表式;指标;报送时间;报送程序)进行一次性调查可采用(重点调查;抽样调查;普查;典型调查)统计分组方法的主要问题是(选择分组标志;划分各组界限)影响次数分布的要素是(组数与组距;组限与组中值)
在相对指标中,属于同一总体数值对比的指标有(动态;结构;比例;计划完成)由两个同类指标对比计算出来的相对指标包括(结构;比较;比例;动态)下列应采取加权调和平均数的是(已知各级工人的月工资水平和工资总额,求平均工资;已知某工厂各车间废品率和废品量,求废品率;假定企业按工人劳动生产率分组,并已知各组产量求平均劳动生产率)由总体所有单位标志值计算的平均数有(算术平均数;调和平均数;几何平均数)平均差与标准差的相同点是(不易受极端数值的影响;以平均数为标准来测定各变量值的离散程度;计算公式有简单式和加权式两种;把所有的变量值都考虑在内)14.是非标志的标准差是()
15.总指数包括(加权平均指数;综合指数;平均指标指数;可变组成指数)16.报告期数值与基期数值只比可以称为(动态相对数;发展速度;统计指数)17.从一个全及总体中可以抽取一系列样本,所以(抽样指标的数值不是唯一的;抽样指标是随机变量;抽样指标可能大于、等于或小于总体指标)18.在区间估计中,如果其他条件不变,抽样推断的概率保证程度与精确度之间存在下列关系(前者越低,后者越高;前者越高,后者越低;两者呈相反方向变化)19.当两个现象完全相关时,下列统计指标值可能为(r=1;r=-1;Sy=0)20.直线回归方程Yc=a+bx中有以下性质(b的绝对值越大,斜率就越大,从而直线越陡;x与y的相关系数越大,斜率也越大;相关系数的绝对值越大,方程的估计标准误差就越小)
四、简答题:
1.统计有哪几种含义?它们之间是什么关系?含义:统计工作、统计资料、统计学。关系:①统计设计的进行要与统计调查、统计整理、统计分析结合在一起。②统计调查要根据统计设计的要求进行,而且统计调查将会对统计整理与统计分析有很大的影响③统计整理是统计调查工作的继续,又是拥挤分析活动的前提和条件。2.统计工作的阶段有哪几个?它们之间是什么关系?阶段:统计设计、统计调查、统计整理、统计分析。关系:1统计设计的进行要与统计调查,统计整理统计分析结合在一起。3.什么是统计调查,它的基本要求是什么?统计调查是根据统计工作任务和统计设计的要求,采用科学的方法,有计划有组织地向调查单位搜集调查资料的过程。基本要求:准确、及时、全面、系统。4.统计调查方案包括哪些主要内容?①明确调查目的②确定调查对象和调查单位③拟定调查项目和制定调查表④确定调查时间⑤调查工作的组织实施⑥编写填表说明5.什么是统计分组?统计分组有哪些作用?统计分组是指根据统计研究的需要,将统计总体按照一定的标志区分为若干组成部分的一种统计方法。作用:①可以将零星分散的统计资料,经过统计分组整理后,发现其特点与规律②可以区分现象的类型③可以分析总体内部结构和总体结构特征④可以揭示现象之间的依存关系6.选择分组标志应遵循哪些原则?①根据统计研究的目的与任务选择分组标志②在若干个标志中,要抓住具有本质性的或主要的标志作为分组的依据③根据现象所处的历史条件或经济条件来选择标志。7、什么是相对指标?它有哪些表现形式?答:相对指标就是将两个有联系的反映社会经济现象的统计指标相互对比得到的一种抽象的比值,是反映社会经济现象间数量对比关系的综合指标。
其表现形式有两种:无名数和有名数。8、计算和运用总量指标时应注意哪些问题?答:1、要注意相互比较的指标之间的可比性;2、相对指标要与总量指标结合运用;3、要把各种相对指标结合起来运用。9、什么是平均指标?它有哪些作用?答:是反映总体各单位某一数量标志值一般水平的综合指数,又称统计平均数。作用:1、平均指标可以反映现象总体的综合特征;;2、平均指标可以反映总体各单位变量值分布的集中趋势;3、平均指标经常用来揭示现象在不同时间的发展趋势;4、平均指标可以用于分析现象之间的依存关系;5、平均指标在抽样推断中是一个重要指标。10、算术平均数与调和平均数的关系如何?分别在什么情况下运用?答:(1)调和平均数实际是算术平均数的一种变形,它仍然是总体标志总量除以总体单位总量。(2)已知各组的变量值,又知各组单位数或次数时,采用算术平均数公式;已知各组变量值,不知各组单位数或次数,而已知各组标志总量时,应采用调和平均数公式。11、什么是标志变异指标?它是如何分类的?答:标志变异指标是反映总体各单位标志值的差异程度的,既反映分配数列中各标志值的变动范围或离差程度的综合指标,也叫标志变动度,简称变异指标。按照计算方法不同有全距、平均差、标准差和标志变动系数四种。12、何谓时间数列,它包括哪些构成要素?答:时间数列是将说明社会经济象在各个不同时期或时点上某种数量特征的指标数量,按时间的先后顺序排列起来而形成的统计数列。由于时间数列中每项数值是与时间相对应的,所以又称为动态数列。基本要素:一个是资料所属的时间,一个是各时间上的统计指标数值。13、比较时期数列与时点数列的不同。答:时期数列:(1)数列中各个指标的数值是可以相加的,即相加具有一定的经济意义。数列中每一个指标数值的大小与所属的时期长短有直接的联系。(2)(3)数列中每个指标数值,通常是通过连续不断的登记取得的。时点数列:(1)数列中每个指标数值除非计算过程需要相加外,一般不能相
加。(2)数列中每一个指标数值的大小与其间隔长短没有直接的联系。(3)数列中每个指标数值,通常是间隔一段时间登记一次而取得的。14、什么是统计指数?它有什么作用?统计值说有狭义和广义之分,广义的指数是指同类社会经济现象数量对比的相对数,包括动态相对数、比较相对数、计划完成相对数等;狭义的指数是指用来反映由不能直接加总的多要素所构成的复杂社会经济现象综合变动程度的特殊相对数。作用:1.利用统计指数可以综合反映社会经济现象变动的方向和程度。2.利用计指数可以分析受多种因素影响的复杂现象的总变动中,各因素的影响方向和影响程度。3.利用统计指数可以测定平均指数变动中各组标志值水平和总体构成变动的程度。4.利用统计指数可以研究事物在长时间没的变动趋势。15.说明综合指数与平均指数的联系与区别。区别:①综合指数要有全面的原始资料。而平均指数可以根据代表性资料计算②综合指数必须用数量指标或质量指标实际资料作为权数,而平均指数除了可以用实际资料作权数外,也可以再实际资料的基础上推算确定比重后再进行加权平均。联系:两者都是随机抽取16.影响抽样平均误差的因素有哪些?①抽样单位数目的多少②总体各单位标志差异程度③抽样组织形式和方法17.什么是重复抽样、不重复抽样?两者有什么异同?重复抽样也叫重置抽样,是从全及总体中随机抽取一个样本单位,经调查登记有有关标识后将其放回原总体中去,然后再从总体中抽取第二个样本单位,记录它有关标志表现后,把它放回总体中去,如此下去,直到抽够n个样本为止。不重复抽样也称为不重置抽样,是从全及总体中按随机原则抽取一个样本单位,观察记录有关标志后,不在将它放回到总体中去参加下一次抽选,而是从剩余的N-1个单位中抽取第二个样本单位。异同:重复抽样和不重复抽样两种抽选样本方法不同,会使可能抽取到的样本配合总数不同,在相同样本容量要求下,重复抽样抽到的可能样本数目总量大于不重复抽样的样本数目。18.相关分析的内容有哪些?
1.确定现象之间是否存在相关关系,以及相关关系的表现形式2.测定相关关系的密切程度和方向3.确定现象之间相关关系的一般关系式4.测定变量估计值的可靠程度19.相关系数是如何计算的?根据积差法计算相关系数,需要分别求出两个变量数列的平均数x¯和y¯,这两个平均数有时是除不尽的小数,为简化计算过程,增强计算的准确性,我们可以在积差法公式的基础上推导出不需要计算平均数值的简化公式,即:r=n∑xy-∑x·∑yn∑x²-﹙∑x﹚²·n∑y²-﹙∑y﹚²
