统计的知识

2024-05-05 11:06

1. 统计的知识

概念
人类对事物数量的认识形成的定义。汉语中的“统计”有合计、总计的意

  统计学
思。指对某一现象有关的数据的搜集、整理、计算、分析、解释、表述等的活动。
1. 指对某一现象有关的数据的搜集、整理、计算和分析等。
例:人口统计
2. 亦指总括地计算
例:把全国报来的数据统计一下
典故:明胡应麟《少室山房笔丛·经籍会通一》:“古今书籍,统计一代,前后之藏,往往无过十万;统计一朝,公私之蓄,往往不能十万。” 清宣鼎《夜雨秋灯录·银雁》:“ 佛奴 掘深窖藏之,统计约有二十馀万。”
外文词源
英语中的“统计”[statistics;count;add up] ,statistics用作复数名词时,意思是统计资料,作单数名词时,指的是统计学。词源:德语Statistik ,政治学;新拉丁语 statisticus ,国事;意大利语statista ,老练的政客;旧意大利语、拉丁语 status ,形势,政体。
三种涵义
在实际应用中,人们对统计一词的理解一般有三种涵义:统计工作、统

  
计资料和统计科学:
(1)统计工作。指利用科学的方法搜集、整理和分析和提供关于社会经济现象数量资料的工作的总称,是统计的基础。也称统计实践,或统计活动,是在一定统计理论指导下,采用科学的方法,搜集、整理、分析统计资料的一系列活动过程。它是随着人类社会的发展、治国和管理的需要而产生和发展起来的,至今已有四五千年的历史。现实生活中,统计工作作为一种认识社会经济现象总体和自然现象总体的实践过程,一般包括统计设计、统计调查、统计整理和统计分析四个环节。
(2)统计资料。指通过统计工作取得的、用来反映社会经济现象的数据资料的总称。统计工作所取得的各项数字资料及有关文字资料,一般反映在统计表、统计图、统计手册、统计年鉴、统计资料汇编和统计分析报告中。也称统计信息,是反映一定社会经济现象总体或自然现象总体的特征或规律的数字资料、文字资料、图表资料及其他相关资料的总称。它包括刚刚调查取得的原始资料和经过一定程度整理、加工的次级资料,其形式有:统计表、统计图、统计年鉴、统计公报、统计报告和其他有关统计信息的载体。
(3)统计科学。也称统计学,是统计工作经验的总结和理论概括,是系统化的知识体系。指研究如何搜集、整理和分析统计资料的理论与方法。统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。
总体来说,“统计”一词的三方面涵义是紧密联系的,统计资料是统计工作的成果,统计工作与统计科学之间是实践与理论的关系。
方法
均值、中位数、众数、正态分布、抽样、标准差、概率论、检验、方差分析、卡方检验。
编辑本段特征
数量性
社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。
总体性
社会经济统计的认识对象是社会经济现象的总体的数量方面。国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。
具体性
社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。
社会性
社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。
编辑本段职能
统计要达到认识社会的目的,不仅需要科学的方法,而且需要强有力的组织领导。因此统计兼有信息、咨询、监督三种职能。
信息职能是统计部门根据科学的统计指标体系和统计调查方法,灵敏、系统的采集、处理、传输、贮存和提供大量的以数据描述为基本特征的社会经济信息。
咨询职能指利用已经掌握的丰富的统计信息资源,运用科学的分析方法和先进的技术手段,深入开展综合分析和专题研究,为科学决策和管理提供各种可供选择的咨询建议与对策方案。
监督职能指根据统计调查和分析,及时、准确地从总体上反映经济、社会和科技的运行状态,并对其实行全面、系统的定量检查、监测和预警,以促使国民经济按照客观规律的要求,持续、稳定、协调地发展。
这三种职能是相互联系、相辅相成的。统计信息职能是保证咨询和监督职能有效发挥的基础;统计咨询职能是统计薪资职能的延续和深化;而统计监督职能则是信息、咨询职能基础上进一步拓展并促进统计信息和咨询职能的优化。
编辑本段组织
统计的组织必须贯彻集中统一的原则,在全国范围内建立集中统一的统计系统,执行统一的方针政策和统计调查计划,贯彻统一的统计制度和统计标准,使用统一的统计报表和数字管理制度,以及协调统计、会计、业务核算制度和核算标准及分工等。国家集中统一的统计系统有各级部门的综合统计系统、各级业务部门的专业统计系统、以及城乡基层组织企业单位的统计组织所组成。
综合统计系统
各级政府部门的综合统计系统是由国家统计局和地方各级统计机构所组成,是国家统计组织的主系统。其主要职责:
1. 制定统计调查计划,部署和检查全国或者行政区域内的统计工作;
2. 组织国家统计调查、地方统计调查。搜集、整理、提供全国或行政区域内的统计资料;
3. 对国民经济和社会发展情况进行统计分析,实行统计监督;依照国务院的规定组织国民经济核算;
4. 管理和协调各部门制定的统计调查表和统计标准。
专业统计系统
专业统计系统是由中央及地方各级业务部门的统计机构所组成,是国家专业统计组织的子系统。其主要职责:
1.组织、协调部门各职能机构的统计工作,完成国家统计调查和地方统计调查任务,制定和实施部门的统计调查表,搜集、整理、提供统计资料;
2.对部门和管辖系统内企业事业组织的计划执行情况,进行统计分析,实行统计监督;
3.组织、协调部管辖系统内企业事业组织的统计工作,管理部门的统计调查表。
基层单位的统计组织
基层单位的统计组织包括乡镇统计组织或统计专业人员,企业事业单位的统计组织或统计负责人。其主要职责:
1.组织、协调单位的统计工作,完成国家统计调查、部门统计调查和地方统计调查任务,搜集、整理、提供统计资料;
2.对单位的计划执行情况进行统计分析,实行统计监督;
3.管理单位的统计调查表,建立健全统计台账制度,并会同有关机构或者人员建立健全原始记录制度。
编辑本段产生与发展
历史沿革
夏禹时代(公元前22世纪)分为九州,有人口约1352万,可见人口统计的久远。《书经·禹贡篇》记述了九州的基本土地情况,被西方经济学家推崇为“统计学最早的萌芽”。西周建立了较为系统的统计报告制度。秦时《商君书》中提出“强国知十三数”,其中包括粮食储备、各国人数、农业生产资料及自然资源等等。
公元前27世纪,埃及为了建造金字塔和大型农业灌溉系统,曾进行过全国人口和财产调查。公元前15世纪,犹太人为了战争的需要进行了男丁的调查。
公元前约6世纪,罗马帝国规定每5年进行一次人口、土地、牲畜和家奴的调查,并以财产总额作为划分贫富等级和征丁课税的依据。
15至18世纪,欧洲出现了许多以报导国情为内容的统计著作。
在19世纪30年代后,出现了所谓“统计狂热时代”。
1,statistics
起源于国情调查,最早意为国情学。
十 七世纪,在英格兰人们对“政治算术”感兴趣。1662年,John Graunt发表了他第一本也是唯一一本手稿,《natural and politics observations upon the bills of mortality》, 分析了生男孩和女孩的比例,发展了保险公司所用的那种类型的死亡率表。
英文的statistics大约在十八世纪中叶由德国学者 Gottfried Achenwall所创造,是由状态status和德文的政治算术联合推导得出的,第一次由John Sinclair所使用,即1797年出现在Encyclopaedia Britannica。(早期还有一个单词publicitics和statistics竞争“统计”这一含义,倘若得胜,就开始流行 publicitical learning了)。
2,高斯分布或正态分布
1733年,德-莫佛(De Moivre)在给友人分发的一篇文章中给出了正态曲线1783年,拉普拉斯建议正态曲线方程适合于表示误差分布的概率。
1809年,高斯发表了他的关于天体运行论的伟大著作,在这一著作的第二卷第三节中,他导出正态曲线适宜于表示误差规律,同时承认拉普拉斯较早的推导。
正态分布在十九世纪前叶因高斯的工作而加以推广,所以通常称作高斯分布。卡尔-皮尔逊指出德-莫佛是正态曲线的创始人,第一个称它为正态分布,但人们仍习惯称之高斯分布。
3,最小二乘法
1805年,Legendre提出最小二乘法,Gauss声称自己在1794年用过,并在1809年基于误差的高斯分布假设,给出了严格推导。
4,其它
在十九世纪中叶,三个不同领域产生的重要发展都是基于随机性是自然界固有的这个前提上的。
阿道夫·凯特莱特(A. Quetlet,1869)利用概率性的概念来描述社会学和生物学现象孟德尔(G.Mendel,1870)通过简单的随机性结构公式化了他的遗传法则
玻尔兹曼(Boltzmann,1866)对理论物理中最重要的基本命题之一的热力学第二定律给出了一个统计学的解释。
1859 年,达尔文发表了《物种起源》,达尔文的工作对他的表兄弟高尔登爵士有深远影响,高尔登比达尔文更有数学素养,他开始利用概率工具分析生物现象,对生物计 量学的基础做出了重要贡献(可以称他为生物信息学之父吧),高尔登爵士是第一个使用相关和回归这两个重要概念的人,他还是中位数和百分位数这种概念的创始 人。
受高尔登工作影响,在伦敦的大学学院工作的卡尔-皮尔逊开始把数学和概率论应用于达尔文进化论,从而开创了现代统计时代,赢得了统计之父的称号,1901年Biometrika第一期出版(卡-皮尔逊是创始人之一)。
5,关于总体和样本
在早期文献中可找到由某个总体中抽样的明确例子,然而从总体中只能取得样本的认识常常是缺乏的。 ----K.皮尔逊时代
到十九世纪末,对样本和总体的区别已普遍知道,然而这种区分并不一定总被坚持。----1910年Yule在自己的教科书中指出。
在 1900年代的早期,区分变的更清楚,并在1922年被Fisher特别强调。----Fisher在1922年发表的一篇重要论文中《On the mathematical foundation of theoretical statistics》,说明了总体和样本的联系和区别,以及其他概念,奠定了“理论统计学”的基础。
6,期望、标准差和方差
期望是一个比概率更原始的概念,在十七世纪帕斯卡和费马时代,期望概念已被公认了。K.皮尔逊最早定义了标准差的概念。1918年,Fisher引入方差的概念。
力学中的矩和统计学中的中数两者之间的相似性已被概率领域的早期工作者注意到,而K.皮尔逊在1893年第一次在统计意义下使用“矩”。
7,卡方统计量
卡方统计量,是卡-皮尔逊提出用于检验已知数据是否来自某一特定的随机模型,或已知数据是否与已给定的假设一致。卡方检验被誉为自1900年以来在科学技术所有分支中20个尖端发明之一,甚至敌人Fisher都对此有极高评价。
8,矩估计与最大似然
卡-皮尔逊提出了使用矩来估计参数的方法。
Fisher则在1912年到1922年间提出了最大似然估计方法,基于直觉,提出了估计的一致性、有效性和充分性的概念。
9,概率的公理化
1933年,前苏联数学家柯尔莫格洛夫(Kolmogorov)发表了《概率论的基本概念》,奠定了概率论的严格数学基础。
10,贝叶斯定理
贝叶斯对统计学几乎没有什么贡献,然而贝叶斯的一篇文章成为贝叶斯学派统计学的思想模式的焦点,这一篇文章发表于1763年,由贝叶斯的朋友、著名人寿保险原理的开拓者Richard Price在贝叶斯死后提出来的----贝叶斯定理。
概 率思想的两种方法,(1)作为一个物理系统内在的一种物理特性,(2)对某一陈述相信程度的度量。 在1950年代后期止,多数统计学家采取第一种观点,即概率的相对频数解释,这一时期贝叶斯定理仅应用在概率能在频数框架内解释的场合。贝叶斯统计学派著 作的一个浪潮始于1960年。自此,赞成和反对贝叶斯学派统计的两方以皮尔逊和费舍尔所特有的激情和狂怒进行申辩和争辩。
在1960年以前,几乎所有的统计书刊都避免使用贝叶斯学派方法,Fisher坚持避免使用贝叶斯定理,并在他的最后一本书中再一次坚决的拒绝了它。卡尔-皮尔逊偶然使用,总的来说是避免的。奈曼和E.S.皮尔逊在他们有关假设检验的文章中坚决反对使用。

统计的知识

2. 统计知识

求样本方差的目的是估计总体方差

修正方差是总体方差的无偏估计,其公式为1/(n-1)sigma (Xi-X')^2 
这个是可以用数学方法证明

1/n sigma (Xi-X')^2是样本方差,要小于总体方差。

也就是说,修正方差是总体方差的无偏估计,而方差不是。所以要除以N-1,而不是N

3. 统计知识:

统计总体和总体单位
 
(1)统计人口的目的和要求,对客观事物需要学习统计,统计的人口(总)。 
统计人口形成了三个条件:
首先,客观,全面和整体的单位必须是客观存在的,可以观察和测量; 
同质组成,总体而言,所有的个人都必须是相同的某些特性; 
第三。差异;单位构成的整体均匀性方面还必须有一个侧的差异,否则,是统计研究的需要。 
有限的统计人口整体单元分为两种类型:有限总体和无限的人口。包括在一个统计的总体数量的单元,如果它是有限的,称为作为一个有限的整体。如果它是无限的,被称为无限的人口。 
(2)的整体单元:由一般的事情,称为整体的单元,作为一个单独的提及。 
统计人口是多样的和整体的单位。统计学群体的整体单元不是固定的,在一般情况,与整体的单体相,改变与变化的研究任务。研究目的和要求。 
例如:要了解生产和经营的国有工业企业(研究目的),整体该地区所有国有工业企业中,国有工业企业的整体单位。为了了解国有企业工人的工资(小范围的研究目的),整体所有工人在企业中,总体单位的每一位员工。例如,我们在网上看到的查表员工的区域电力系统的员工的年薪达到12万,我们可以看看在电力企业职工的工资,总体而言,所有工人的电力企业,总体单位是每一位员工。标志和指标
 
 
(1)标识:描述的特点,整体单位名称。 
迹象表明总体单位的属性特征,不能表示其质量标志的数量。主要用作分组的基础。 
表现的一些迹象显示单位特点的总数可以量化。可以计算出来。 
(2)指标:既要理解和使用。 
统计指标,反映的一些概念的整体现象的特征。适用于统计理论和统计设计。 
另一个统计指标反映整体现象的特性和具体的数值的数量的概念。适用于实际的统计工作。 
(3)指标和标志的区别:
①指标说明总体特征,而标志是一个单体单元的功能; 
②标志质量标志不能被数字表示,并可以使用必须使用的数字表示; 
(4)指标和标志联系方式:
①许多统计指标的值直接从整体单元总结的数量标志值的数字表示的数量和体征指标从
②指标和数量之间的关系转变的迹象。 
 
 
统计人口是按照确定的目的和要求的东西,它是客观存在的,有很多个人的事情,一些常见的自然构成的整体。 
整体单位:个别单位构成的整体,它是人口的基本单位。 
单位标志:标志短,指的是整体人口的单位的性质和特点。 
标志分为品质标志和数量标志。 
 
 
一般,总体单位是存在彼此之间的联系,有没有一个整体单元,总体来说,并没有一个整体的正确,我将无法设置总体单位。

统计知识:

4. 统计基础知识

统计总体和总体单位

(1)统计总体:根据一定的目的和要求,统计所需要研究的客观事物的全体,称为统计总体,简称总体。
  统计总体形成的三个条件:
  第一,客观性;总体和总体单位必须是客观存在的,可以观察和计量的;
  第二,同质性;组成总体的所有个体必须是在某些性质上是相同的;
  第三.差异性;构成总体的各单位除了同质性一面还必须有差异性一面,否则就是需要统计研究了。
  统计总体按总体单位是否有限分为两种:有限总体和无限总体。一个统计总体所包括的单位数如果是有限的,称为有限总体。如果是无限的,称为无限总体。
  (2)总体单位:组成总体的每一个事物,称为总体单位,简称个体。
  统计总体和总体单位是多种多样的。且统计总体与总体单位不是固定不变的,总体与总体单体具有相对性,随着研究任务的改变而改变。这与研究目的和要求有关。
  例如:要了解某一地区国有工业企业的生产经营情况(研究目的),总体是该地区的全部国有工业企业,每一个国有工业企业是总体单位。要了解某一国有企业职工工资情况(研究目的范围变小),总体是该企业所有职工,总体单位是每一位职工。比如,我们在网上看到,某地区电力系统职工的查表员工年薪达到12万,我们可以研究一下该电力企业职工的工资情况,总体就是该电力企业的所有职工,总体单位就是每一位职工。

标志与指标
  (1)标志:是说明总体单位特征的名称。
  标志按其  品质标志:表明总体单位的属性特征,不能用数量表示。主要用作分组的依据。
  表现形式有 数量标志:表明总体单位的数量特征,可以用数量表示。可进行计算。
  (2)指标:两种理解和使用方法。
  一种是认为统计指标是反映总体现象数量特征的概念。适用于统计理论与统计设计。
  另一种认为统计指标是反映总体现象数量特征的概念和具体数值。适用于实际统计工作。
  (3)指标与标志的区别:
  ①指标是说明总体特征的,而标志是说明单体单位特征的;
  ②标志有不能用数值表示的品质标志和能用数值表示的数量标志两种,而指标都必须是能用数值表示的;
  (4)指标与标志的联系:
  ①有许多统计指标的数值是直接从总体单位的数量标志值汇总而来的;
  ②指标与数量标志之间存在着转化的关系。





统计总体:就是根据一定的目的和要求所确定的研究事物的全体,它是由客观存在的、具有某种共同性质的许多个别事物构成的整体。
总体单位:是指构成总体的个体单位,它是总体的基本单位。
单位标志:简称标志,是指总体总体中各单位所具有的属性和特征。
标志:分为品质标志和数量标志。


总体 和总体单位是互为存在条件的连接在一起的,没有总体单位,总体也不存在,没有总体,也就无法确i定总体单位。

5. 统计基础知识

【综合能源消费量】指报告期内工业企业在工业生产活动中实际消费的各种能源的总和净值。计算综合能源消费量时,需要先将使用的各种能源折算成标准燃料后再进行计算。根据生产活动的性质,综合能源消费量在不同的企业有不同的计算方法。根据P201和P201-1表计算综合能源消费量方法如下:
综合能源消费量=工业生产消费的能源合计(P201表)-加工转换产出能源合计 (P201-1表) -回收利用能源合计(P201-1表)。
《能源统计报表制度》中需要填报综合能源消费量的报表是P201表。

【终端能源消费量】是全国能源平衡表和地区能源平衡表中使用的概念,能源消费分两个部分,即加工转换消费和终端消费。终端能源消费,是在能源核算时,为反映能源的实际消费情况而设置的一个综合指标,它是指没有经过加工转换的一次能源或经过加工转换后的二次能源直接用作原料、材料、燃料、动力以及工艺性消费的数量,不包括用于加工转换的能源。

【能源库存量】本制度中所涉及的能源库存量是指企业能源库存量,它是企业在报告期的某时间点所拥有的各种能源数量。根据企业的生产经营活动性质,企业库存量分为生产企业产成品库存、经销企业(批发、零售企业)用于经营销售的库存、使用企业用于消费的库存。
1.库存量的核算原则:
(1)时点性原则。库存量是指企业在报告期的某时间点所拥有的各种能源数量,所以必须按照制度所规定的时间点盘点库存,不得提前或推后。
(2)实际数量原则。企业在库存盘点后,可能出现帐面数字与实际库存数量不一致的现象,在这种情况下,应以盘点数量为准来调整帐面数字,差额作盘盈或盘亏处理。
(3)库存量的核算,以验收合格、办理完入库手续为准,未经验收或不合格的,不能计入库存。
(4)能源生产企业产成品库存和能源经销企业(批发、零售企业)用于经营销售的库存按照能源的所有权原则统计,能源使用企业用于消费的库存按照能源的使用权原则统计;(建筑业库存按照“谁管理、谁统计”的原则统计)。
2.能源生产企业产成品库存:指煤矿、油田、洗煤厂、炼油厂、炼焦厂等一次能源和二次能源生产企业,在报告期某一时点产成品仓库(或储存场地)中尚未销售的能源产品数量。按照产成品库存的“所有权”核算原则,凡是企业有权销售的产品,不论存放在什么地方,均应统计。主要包括:
(1)本企业生产的,报告期内经检验合格入库的产品;
(2)库存产品虽有销售对象,但尚未发货的;
(3)已销售,但按提货制要求还没有办理完货款结算手续,按送货制要求还没有办理完承运手续的产品;
(4)尚未拨出的带料加工产品;
(5)产品入库后发现有质量问题,但未办理退库手续的产品;
(6)盘点中的帐外产品。
产成品库存不包括:
(1)未验收入库的产品;
(2)已销售并按规定办理完各种手续,但尚未提货、发货的产品;
(3)代外单位保管的产品;
(4)盘亏的产品。
《能源统计报表制度》中需要填报生产企业产成品库存的报表是P402表。
3.批发、零售企业用于经营销售的库存:指批发、零售贸易企业购进用于经营的、在报告期某一时点尚未销售的商品库存量,主要包括:
(1)购进的、经验收办理完入库手续的商品;
(2)寄存在外单位的商品;
(3)已销售,但按提货制要求还没有办理完货款结算手续,按送货制要求还没有办理完承运手续的商品;
(4)设在外地的仓库和中转仓库中的商品;
(5)盘点中的帐外产品。
批发、零售企业用于经营销售的库存不包括:
(1)尚未验收入库的商品
(2)已销售并按规定办理完各种手续,但尚未提货、发货的商品;
(3)代外单位保管的商品;
(4)盘亏的商品。
《能源统计报表制度》中需要填报批发、零售企业用于经营销售库存这一指标的报表是P403表。
4.能源使用企业用于消费的库存:指能源消费企业购进的在报告期某一时点尚未消费,在原材料、能源供应仓库(或场地)中实际结存的商品库存量。能源使用企业用于消费的库存与能源生产企业产成品库存是两个不同的指标。对于能源生产企业来说,要填报两个库存,即本企业所生产的、在报告期尚未销售的能源产品的产成品库存要填报在“工业企业生产、销售与库存报表”(B203表)或(P402表)之中,而在报告期用于本企业消费而尚未消费的能源库存要填报在“工业企业能源购进、消费与库存” (P201表)之中。企业用于消费的库存的统计范围主要是:
(1)凡是本单位有权支配的,不论来源(自行采购的、借用的、外单位拨来得等),也不论存放在什么地方(总库、分库、车间、工地、本单位之外的其他地方等),均应统计在本单位的库存量中;
(2)在统计时点上尚未投入消费的,包括车间、工地、班组从仓库已领取但尚未投入第一道生产工序的(应办理假退料手续);
(3)外单位来料加工或自外单位借入的,在报告期末尚未消费的;
(4)已决定外调(卖出、借出、捐赠等),但尚未办理出库手续的;
(5)委托外单位代保管的;
(6)不属于正常周转库存的超出积压或特准储备、战略储备;
(7)清点盘库时查出属于帐外的。
企业用于消费的库存不包括:
(1)已拨交外单位委托加工的;
(2)已外调(借出、捐赠等),已经办理出库手续的;
(3)供货单位错发到本单位的;
(4)代外单位保管的;
(5)已查实确属损失或丢失的;
(6)已付货款,但还在运输途中的;
(7)已运到本单位,但尚未办理或尚未办完验收入库手续的。

统计基础知识

6. 关于统计方面的知识?

  中位数(Median)统计学名词。
  将数据排序后,位置在最中间的数值。即将数据分成两部分,一部分大于该数值,一部分小于该数值。中位数的位置:当样本数为奇数时,中位数=(N+1)/2 ; 当样本数为偶数时,中位数为N/2与1+N/2的均值
  众数(Mode)统计学名词,在统计分布上具有明显集中趋势点的数值,代表数据的一般水平(众数可以不存在或多于一个)。
  修正定义:是一组数据中出现次数最多的那个数值,就是众数,有时众数在一组数中有好几个。用M表示。
  理性理解:简单的说,就是一组数据中占比例最多的那个数。
  用众数代表一组数据,可靠性较差,不过,众数不受极端数据的影响,并且求法简便。在一组数据中,如果个别数据有很大的变动,选择中位数表示这组数据的“集中趋势”就比较适合。
  条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些直条按一定的顺序排列起来。从条形统计图中很容易看出各种数量的多少。条形统计图一般简称条形图,也叫长条图或直条图。条形统计图是用条形的长短来代表数量的大小,便于比较。条形统计图又分为条形统计图和复式条形统计图,复式条形统计图由多种数据组成,用不同的颜色标出。
  频率分布直方图:在直角坐标系中,横轴表示样本数据,纵轴表示频率与组距的比值,将频率分布表中各组频率的大小用相应矩形面积的大小来表示,由此画成的统计图叫做频率分布直方图。(在图中,各个长方形的面积等于相应各组的频率的数值,所有小矩形面积和为1)
  把全体样本分成的组的个数称为 组数。每一组两个端点的差称为组距。落在不同小组中的数据个数为该组的 频数。各组的频数之和等于这组数据的总数。频数与数据总数的比为频率(总频率=各组频率之和,且它的值为1)。频率大小反映了各组频数在数据总数中所占的份量。

7. 关于统计方面的知识?

统计直方图
对某一物理量在相同条件下做n次重复测量,得到一系列测量值,找出它的最大值和最小值,然后确定一个区间,使其包含全部测量数据,将区间分成若干小区间,统计测量结果出现在各小区间的频数M,以测量数据为横坐标,以频数M为纵坐标,划出各小区间及其对应的频数高度,则可得到一个矩形图,即统计直方图。
http://baike.baidu.com/view/828090.html

条形统计图
条形统计图是用一个单位长度表示一定的数量,根据数量的多少画成长短不同的直条,然后把这些纸条按一定的顺序排列起来。从条形统计图中很容易看出各种数量的多少。
条形统计图分为:单式条形统计图和复式条形统计图,前者只表示1个项目的数据,后者可以同时表示多个项目的数据。
频数:一般我们称落在不同小组中的数据个数为该组的频数(frequency)]
频率:频数与数据总数的比为频率。频率*100%就是百分比。
http://baike.baidu.com/view/341367.html

折线统计图
折线统计图是用一个单位长度表示一定的数量,根据数量的多少描出各点,然后把各点用线段顺次连接起来。折线统计图不但可以表示出数量的多少,而且还能够清楚的表示出数量增减变化的情况。
http://baike.baidu.com/view/346269.html

至于,条形统计图或者折线统计图有什么不同
或者这个网址对你有用
http://blog.cersp.com/userlog17/35903/archives/2006/212516.shtml

关于统计方面的知识?

8. 统计学基础知识

统计学基本概念
  
 假设检验:根据一定假设条件由样本推断总体的方法。(小概率反证的思想,即在原假设成立的前提下,小概率事件在一次实验中不太可能发生,如果发生了,则认为原假设并不成立。)
  
 假阳性:又称第一类错误,原假设实际上是正确的,但我们做出的决定是拒绝原假设,拒绝实际上成立的,为 “弃真” 错误。
  
 可能产生的原因:1)样本极端数值;2)采用决策标准较宽松。
  
 假阴性:第二类错误,原假设实际上是不正确的,但我们却做出了接受原假设的决定。
  
 可能产生的原因:1)实验设计不灵敏;2)样本数据变异过大;3)处理效应本身较小。
  
 犯Ⅰ类错误得危害较大,由于报告了本来不存在的现象,则因此现象而衍生出的后续研究、应用的危害将是不可估量的。相对而言,Ⅱ类错误的危害则相对较小,因为研究者如果对自己的假设很有信心,可能会重新设计实验,再次来过,直到得到自己满意的结果(但是如果对本就错误的观点坚持的话,可能会演变成Ⅰ类错误)。
  
 置信水平:表示样本统计值的精确度,它是指样本统计值落在参数值某一正负区间内的概率。
  
 置信水平:是指总体参数值落在样本统计值某一区内的概率;
  
 置信区间:是指在某一置信水平下,样本统计值与总体参数值间误差范围。置信区间越大,置信水平越高。
                                          
 
  
 区别估算:
  
 显著性差异:
  
 p-value:假定值。
  
 平均值:反映数据集中趋势。
  
 中位数:
  
 p1/p25/p50/p75/p99:
  
 相关性:反映两个变量之间变化趋势的方向以及程度。
  
 三个相关性系数(pearson, spearman, kendall)
  
 因果性:原因和结果是揭示世界中普遍联系的事物具有先后相继、彼此制约的一对范畴。
  
 幸存者偏差:只能看到经过筛选而产生的结果,而没有意识到筛选的过程,因此忽略了被筛选掉的关键信息。 参考 
  
 大数定律:在随机事件的大量重复出现中,往往呈现几乎必然的规律,这个规律就是大数定律。
  
 80/20:重要的只占20%,其余80%是次要的。
  
 本文主要介绍:统计学基本概念、数据的收集、数据的描述、回归和分类、多元分析,其中回归和分类、多元分析是学习重点。统计学中的其它概念如:概率及分布、参数估计、假设检验属于经典统计的内容,在此文略去。
  
 统计学:收集、处理、分析、解释数据并从中得出结论的科学。
  
 数据分析的方法可分为描述统计和推断统计。
                                                                                  
 注意:分类变量如“行业”,其变量值可以为“零售业”、“旅游业”、“汽车制造业”;顺序变量如“产品等级”,其变量值可以位“一等品”、“二等品”、“次品”。分类变量与顺序变量均可称为定性变量、属性变量。
  
 2.数据的收集
                                          
 注意:    在抽查中可根据具体项目采取概率抽样和非概率抽样相结合的方式,收集数据也可以采用自填、电访、面访相结合的方式以节省成本。    在间接来源中,注意对二手数据评估,可以考虑:数据是谁收集的?为什么目的收集的?数据怎么收集的?什么时候收集的?避免对二手数据的错用、误用、滥用。
  
 3.数据的描述
  
 3.1数据的概括性度量
                                          
 注意:在excel 数据---“数据分析---描述统计 中能得到所有指标值。
  
 3.2数据的图表展示
                                          
 说明:不同的箱线图对应的分布如下
                                          
 注意事项:图表应简洁、合理的表达统计目的,不应在图形的修饰上花费太多时间。在绘制图形时,应避免一切不必要的装饰,注重图形所要表达的信息,图形产生的视觉效果应与数据所体现的事物特征一致,不得歪曲数据。
  
 统计表是用于展示数据的另一个基本工具,一般由表头、行标题、列标题和数字资料组成,必要时在统计表的下方添加数据来源、变量注释和说明等。统计表的横竖比例要适当,避免出现过高或过宽的情况;表头标题应满足3W原则(when、where、what),统计表中应注明单位,表的上下两条线一般用粗线,中间的其它线用细线;通常情况下,统计表左右两边不封口,列标题之间在必要时可用竖线分开,而行标题通常不必用横线分开;表中数据一般是右对齐,有小数点时小数点对齐,小数点位数统一,对于没有数字的单元,一般用“—”表示,表中不应出现空白单元格。
  
 4.回归与分类
  
 4.1回归:数值型变量(因)——数值型变量(自)
                                          
 
  
   线性回归属于经典统计学,模型能够写成公式,而其它几种方式属于现代方法,模型体现在算法之中,这些方法广泛应用于机器学习或数据挖掘之中。算法模型适用范围比经典的统计模型根据广泛。在处理巨大的数据集上,在无法假定任何分布背景的情况下,在面对众多竞争模型,算法模型较经典模型有着不可比拟的优越性。 
  
 4.2分类:分类变量(因)——数值型变量(自)
                                          
 
  
   说明:Logistic回归、线性判别分析(Fisher判别法)均属于经典统计的内容。支持向量机是基于数学模型但充分结合了计算机的算法。
  
 4.3分类:分类变量(因)——分类变量(自)
                                          
 
  
 参考:
  
  统计学基础知识 
    
 链接:https://www.jianshu.com/p/3f9c2e587d43
  
 来源: