词语释义

基本概念

人类对事物数量的认识形成的定义。汉语中的“统计”有合计、总计的意思。指对某一现象有关的数据的搜集、整理、计算、分析、解释、表述等的活动。

1. 指对某一现象有关的数据的搜集、整理、计算和分析等。

例:人口统计

统计?  2. 亦指总括地计算

例:把全国报来的数据统计一下

典故:明胡应麟《少室山房笔丛·经籍会通一》:“古今书籍,统计一代,前后之藏,往往无过十万;统计一朝,公私之蓄,往往不能十万。” 清宣鼎《夜雨秋灯录·银雁》:“ 佛奴 掘深窖藏之,统计约有二十馀万。”

外文词源

“统计”一词,英语为statistics,用作复数名词时,意思是统计资料,作单数名词时,指的是统计学。一般来说,统计这个词包括三个含义:统计工作、统计资料和统计学。这三者之间存在着密切的联系,统计资料是统计工作的成果,统计学来源于统计工作。原始的统计工作即人们收集数据的原始形态已经有几千年的历史,而它作为一门科学,还是从17世纪开始的。英语中统计学家和统计员是同一个(statistician),但统计学并不是直接产生于统计工作的经验总结。每一门科学都有其建立、发展和客观条件,统计科学则是统计工作经验、社会经济理论、计量经济方法融合、提炼、发展而来的一种边缘性学科。

三种涵义

在实际应用中,人们对统计一词的理解一般有三种涵义:统计工作、统计资料和统计科学:

统计  (1)统计工作。指利用科学的方法搜集、整理和分析和提供关于社会经济现象数量资料的工作的总称,是统计的基础。也称统计实践,或统计活动,是在一定统计理论指导下,采用科学的方法,搜集、整理、分析统计资料的一系列活动过程。它是随着人类社会的发展、治国和管理的需要而产生和发展起来的,至今已有四五千年的历史。现实生活中,统计工作作为一种认识社会经济现象总体和自然现象总体的实践过程,一般包括统计设计、统计调查、统计整理和统计分析四个环节。

(2)统计资料。指通过统计工作取得的、用来反映社会经济现象的数据资料的总称。统计工作所取得的各项数字资料及有关文字资料,一般反映在统计表、统计图、统计手册、统计年鉴、统计资料汇编和统计分析报告中。也称统计信息,是反映一定社会经济现象总体或自然现象总体的特征或规律的数字资料、文字资料、图表资料及其他相关资料的总称。它包括刚刚调查取得的原始资料和经过一定程度整理、加工的次级资料,其形式有:统计表、统计图、统计年鉴、统计公报、统计报告和其他有关统计信息的载体。

(3)统计科学。也称统计学,是统计工作经验的总结和理论概括,是系统化的知识体系。指研究如何搜集、整理和分析统计资料的理论与方法。统计工作、统计资料、统计科学三者之间的关系是:统计工作的成果是统计资料,统计资料和统计科学的基础是统计工作,统计科学既是统计工作经验的理论概括,又是指导统计工作的原理、原则和方法。

总体来说,“统计”一词的三方面涵义是紧密联系的,统计资料是统计工作的成果,统计工作与统计科学之间是实践与理论的关系。

基本方法

均值、中位数、众数、正态分布、抽样、标准差、概率论、检验、方差分析、卡方检验。

相关特征

数量性

社会经济统计的认识对象是社会经济现象的数量方面,包括现象的数量表现、现象之间的数量关系和质量互变的数量界限。

总体性

社会经济统计的认识对象是社会经济现象的总体的数量方面。国民经济总体的数量方面、社会总体的数量方面、地区国民经济和社会总体的数量方面、各企事业单位总体数量方面等等。

具体性

社会经济统计的认识对象是具体事物的数量方面,而不是抽象的量。这是统计与数学的区别。

社会性

社会经济现象是人类有意识的社会活动,是人类社会活动的条件、过程和结果,社会经济统计以社会经济现象作为研究对象,自然具有明显的社会性。

近期发展

近代统计学指的是18世纪末到19世纪末的描述统计学,其发展过程与概率论的广泛研究和应用密切相关,在统计分析中经常使用的一些基本方法和术语都始于这一个时期,例:最小平方法、正态分布曲线、误差计算等。

在近代统计发展的一百年中,也形成了许多学派,其中以数理统计学派和社会统计学派最为著名。数理统计学派的原创始人是比利时的A·凯特靳,其最大的贡献就是将法国的古典概率引入统计学,用纯数学的方法对社会现象进行研究;社会统计学派的首倡者是德国的K·克尼斯,他认为统计研究的对象是社会现象,研究方法为大量观察法。在近代统计学的发展过程中,这两学派的矛盾是比较大的。近代统计学指的是18世纪末到19世纪末的描述统计学,其发展过程与概率论的广泛研究和应用密切相关。目前在统计分析中经常使用的一些基本方法和术语都始于这一个时期,比如:最小平方法、正态分布曲线、误差计算等。

统计学概述

统计学是应用数学的一个分支,主要通过利用概率论建立数学模型,收集所观察系统的数据,进行量化的分析、总结,并进而进行推断和预测,为相关决策提供依据和参考。它被广泛的应用在各门学科之上,从物理和社会科学到人文科学,甚至被用来工商业及政府的情报决策之上。

统计学主要又分为描述统计学和推断统计学。给定一组数据,统计学可以摘要并且描述这份数据,这个用法称作为描述统计学。另外,观察者以数据的形态建立出一个用以解释其随机性和不确定性的数学模型,以之来推论研究中的步骤及母体,这种用法被称做推论统计学。这两种用法都可以被称作为应用统计学。另外也有一个叫做数理统计学的学科专门用来讨论这门科目背后的理论基础。

统计学的发展历程

统计学的英文statistics最早是源于现代拉丁文statisticum collegium (国会)以及意大利文 statista (国民或政治家)。德文Statistik,最早是由Gottfried Achenwall(1749)所使用,代表对国家的资料进行分析的学问,也就是“研究国家的科学”。在十九世纪统计学在广泛的数据以及资料中探究其意义,并且由John Sinclair引进到英语世界。

统计统计学是一门很古老的科学,一般认为其学理研究始于古希腊的亚里斯多德时代,迄今已有两千三百多年的历史。它起源于研究社会经济问题,在两千多年的发展过程中,统计学至少经历了“城邦政情”,“政治算数”和“统计分析科学”三个发展阶段。所谓“数理统计”并非独立于统计学的新学科,确切地说它是统计学在第三个发展阶段所形成的所有收集和分析数据的新方法的一个综合性名词。概率论是数理统计方法的理论基础,但是它不属于统计学的范畴,而属于数学的范畴。

统计学的发展过程的三个阶段

第一阶段称之为“城邦政情”(Matters of state)阶段

“城邦政情”阶段始于古希腊的亚里斯多德撰写“城邦政情”或“城邦纪要”。他一共撰写了一百五十馀种纪要,其内容包括各城邦的历史,行政,科学,艺术,人口,资源和财富等社会和经济情况的比较,分析,具有社会科学特点。“城邦政情”式的统计研究延续了一两千年,直至十七世纪中叶才逐渐被“政治算数”这个名词所替代,并且很快被演化为“统计学”(Statistics)。统计学依然保留了城邦(state)这个词根。

第二阶段称之为“政治算数”(Politcal arthmetic)阶段

与“城邦政情”阶段没有很明显的分界点,本质的差别也不大。

“政治算数”的特点是统计方法与数学计算和推理方法开始结合。分析社会经济问题的方式更加注重运用定量分析方法。

1690年英国威廉·配弟出版(政治算数)一书作为这个阶段的起始标志.

威廉·配弟用数字,重量和尺度将社会经济现象数量化的方法是近代统计学的重要特征。因此,威廉?配弟的(政治算数)被后来的学者评价为近代统计学的来源,威廉?配弟本人也被评价为近代统计学之父。

配弟在书中使用的数字有三类:

第一类是对社会经济现象进行统计调查和经验观察得到的数字.因为受历史条件的限制,书中通过严格的统计调查得到的数据少,根据经验得出的数字多;

第二类是运用某种数学方法推算出来的数字。其推算方法可分为三种:

“(1)以已知数或已知量为基础,循著某种具体关系进行推算的方法;

(2)通过运用数字的理论性推理来进行推算的方法;

(3)以平均数为基础进行推算的方法”;

第三类是为了进行理论性推理而采用的例示性的数字.配弟把这种运用数字和符号进行的推理称之为“代数的算法”。从配弟使用数据的方法看,“政治算数”阶段的统计学已经比较明显地体现了“收集和分析数据的科学和艺术”特点,统计实证方法和理论分析方法浑然一体,这种方法即使是现代统计学也依然继承。

第三阶段称之为“统计分析科学”(Science of statistical analysis)阶段

在“政治算数”阶段出现的统计与数学的结合趋势逐渐发展形成了“统计分析科学”。

十九世纪末,欧洲大学开设的“国情纪要”或“政治算数”等课程名称逐渐消失,代之而起的是“统计分析科学”课程.当时的“统计分析科学”课程的内容仍然是分析研究社会经济问题。

“统计分析科学”课程的出现是现代统计发展阶段的开端. 1908年,“学生”氏(William Sleey Gosset的笔名Student)发表了关于t分布的论文,这是一篇在统计学发展史上划时代的文章。它创立了小样本代替大样本的方法,开创了统计学的新纪元。

现代统计学的代表人物首推比利时统计学家奎特莱(Adolphe Quelet),他将统计分析科学广泛应用于社会科学,自然科学工程技术科学领域,因为他深信统计学是可以用于研究任何科学的一般研究方法.

现代统计学的理论基础概率论始于研究赌博的机遇问题,大约开始于1477年。数学家为了解释支配机遇的一般法则进行了长期的研究,逐渐形成了概率论理论框架。在概率论进一步发展的基础上,到十九世纪初,数学家们逐渐建立了观察误差理论,正态分布理论和最小平方法则。于是,现代统计方法便有了比较坚实的理论基础。

统计学的观念

为了将统计学应用到科学,工业以及社会问题上,由研究母体开始。这是一个国家的人民,石头中的水晶,或者是某家特定工厂所生产的商品。一个母体甚至可能由许多次同样的观察程序所组成;由这种资料蒐集所组成的母体称它叫时间序列。

为了实际的理由,选择研究母体的子集代替研究母体的每一笔资料,这个子集称做样本。以某种经验设计实验所蒐集的样本叫做资料。资料是统计分析的对象,并且被用做两种相关的用途:描述和推论。

描述统计学处理有关叙述的问题:资料是否可以被有效的摘要,不论是以数学或是图片表现,以用来代表母体的性质?基础的数学描述包括了平均数和标准差。图像的摘要则包含了许多种的表和图。

推论统计学被用来将资料中的数据模型化,计算它的机率并且做出对于母体的推论。这个推论可能以对/错问题的答案所呈现(假设检定),对于数字特征量的估计(估计),对于未来观察的预测,关联性的预测(相关性),或是将关系模型化(回归)。其他的模型化技术包括变异数分析(ANOVA),时间序列,以及资料采矿。

相关的观念特别值得被拿出来讨论。对于资料集合的统计分析可能显示两个变量(母体中的两种性质)倾向于一起变动,好像它们是相连的一样。举例来说,对于人收入和死亡年龄的研究期刊可能会发现穷人比起富人平均来说倾向拥有较短的生命。这两个变量被称做相关的。但是实际上,不能直接推论这两个变量中有因果关系;参见相关性推论因果关系(逻辑谬误)。

样本足以代表母体的,那么由样本所做的推论和结论可以被引申到整个母体之上。最大的问题在于决定样本是否足以代表整个母体。统计学提供了许多方法来估计和修正样本和蒐集资料过程中的随机性(误差),同上面所提到的透过经验所设计的实验。参见实验设计。

要了解随机性或是机率必须具备基本的数学观念。数理统计(通常又叫做统计理论)是应用数学的分支,它使用机率论来分析并且验证统计的理论基础。

任何统计方法是有效的只有当这个系统或是所讨论的母体满足方法论的基本假设。误用统计学可能会导致描述面或是推论面严重的错误,这个错误可能会影响社会政策,医疗实践以及桥梁或是核能发电计划结构的可靠性。

即使统计学被正确的应用,结果对于不是专家的人来说可能会难以陈述。举例来说,统计资料中显著的改变可能是由样本的随机变量所导致,但是这个显著性可能与大众的直觉相悖。人们需要一些统计的技巧(或怀疑)以面对每天日常生活中透过引用统计数据所获得的资讯。

统计方法

1)测量的尺度

统计学一共有四种测量的尺度或是四种测量的方式。这四种测量(名目,顺序,等距,等比)在统计过程中具有不等的实用性。等比尺度(Ratio measurements)拥有零值及资料间的距离是相等被定义的,等距尺度(Interval measurements)资料间的距离是相等被定义的但是它的零值并非绝对的无而是自行定义的(智力或温度的测量)。( Ordinal measurements)顺序尺度的意义并非表现在其值而是在其顺序之上。名目尺度(Nominal measurements)的测量值则不具量的意义。

2)统计技术

以下列出一些有名的统计检定方法以及可供验证实验数据的程序

费雪最小显著差异法(Fisher's Least Significant Difference test )

学生t检验(Student's t-test)

曼-惠特尼 U 检定(Mann-Whitney U)

回归分析(regression analysis)

相关性(correlation)

皮尔森积矩相关系数(Pearson product-moment correlation coefficient)

史匹曼等级相关系数(Spearman's rank correlation coefficient )

卡方分配(chi-square )

统计学历史中的学派

一、18-19世纪——统计学的创立和发展

德国的斯勒兹曾说过:“统计是动态的历史,历史是静态的统计。”可见统计学的产生与发展是和生产的发展、社会的进步紧密相联的。

(1)统计学的创立时期

统计学的萌芽产生在欧洲。17世纪中叶至18世纪中叶是统计学的创立时期。在这一时期,统计学理论初步形成了一定的学术派别,主要有国势学派和政治算术学派。

1、国势学派

国势学派又称记述学派,产生于17世纪的德国。由于该学派主要以文字记述国家的显著事项,故称记述学派。其主要代表人物是海尔曼·康令和阿亨华尔。康令第一个在德国黑尔姆斯太特大学以“国势学”为题讲授政治活动家应具备的知识。阿亨华尔在格丁根大学开设“国家学”课程,其主要著作是《近代欧洲各国国势学纲要》,书中讲述“一国或多数国家的显著事项”,主要用对比分析的方法研究了解国家组织、领土、人口、资源财富和国情国力,比较了各国实力的强弱,为德国的君主政体服务。因在外文中“国势”与“统计”词义相通,后来正式命名为“统计学”。该学派在进行国势比较分析中,偏重事物性质的解释,而不注重数量对比和数量计算,但却为统计学的发展奠定了经济理论基础。但随着资本主义市场经济的发展,对事物量的计算和分析显得越来越重要,该学派后来发生了分裂,分化为图表学派和比较学派。

2、政治算术学派

政治算术学派产生于19世纪中叶的英国,创始人是威廉·配第(1623-1687),其代表作是他于1676年完成的《政治算术》一书。这里的“政治”是指政治经济学,“算术”是指统计方法。在这部书中,他利用实际资料,运用数字、重量和尺度等统计方法对英国、法国和荷兰三国的国情国力,作了系统的数量对比分析,从而为统计学的形成和发展奠定了方法论基础。因此马克思说:“威廉·佩第——政治经济学之父,在某种程度上也是统计学的创始人。”

政治算术学派的另一个代表人物是约翰·格朗特(1620-1674)。他以1604年伦敦教会每周一次发表的“死亡公报”为研究资料,在 1662年发表了《关于死亡公报的自然和政治观察》的论著。书中分析了60年来伦敦居民死亡的原因及人口变动的关系,首次提出通过大量观察,可以发现新生儿性别比例具有稳定性和不同死因的比例等人口规律;并且第一次编制了“生命表”,对死亡率与人口寿命作了分析,从而引起了普遍的关注。他的研究清楚地表明了统计学作为国家管理工具的重要作用。

(2)统计学的发展时期

18世纪末至19世纪末是统计学的发展时期。在这时期,各种学派的学术观点已经形成,并且形成了两主要学派,即数理统计学派和社会统计学派。

1、数理统计学派

在18世纪,由于概率理论日益成熟,为统计学的发展奠定了基础。19世纪中叶,把概率论引进统计学而形成数理学派。其奠基人是比利时的阿道夫·凯特勒(1796-1874),其主要著作有:《论人类》、《概率论书简》、《社会制度》和《社会物理学》等。他主张用研究自然科学的方法研究社会现象,正式把古典概率论引进统计学,使统计学进入一个新的发展阶段。由于历史的局限性,凯特勒在研究过程中混淆了自然现象和本质区别,对犯罪、道德等社会问题,用研究自然现象的观点和方法作出一些机械的、庸俗化的解释。但是,他把概率论引入统计学,使统计学在“政治算术”所建立的“算术”方法的基础上,在准确化道路上大大跨进了一步,为数理统计学的形成与发展奠定了基础。

2、社会统计学派

社会统计学派产生于19世纪后半叶,创始人是德国经济学家、统计学家克尼斯(1821-1889),主要代表人物主要有恩格尔(1821- 1896)、梅尔(1841-1925)等人。他们融合了国势学派与政治算术学派的观点,沿着凯特勒的“基本统计理论”向前发展,但在学科性质上认为统计学是一门社会科学,是研究社会现象变动原因和规律性的实质性科学,以此同数理统计学派通用方法相对立。社会统计学派在研究对象上认为统计学是研究体而不是个别现象,而且认为由于社会现象的复杂性和整体性,必须地总体进行大量观察和分析,研究其内在联系,才能揭示现象内在规律。这是社会统计学派的“实质性科学”的显著特点。

社会经济的发展,要求统计学提供更多的统计方法;社会科学本身也不断地向细分化和定量化发展,也要求统计学能提供更有效的调查整理、分析资料的方法。因此,社会统计学派也日益重视方法论的研究,出现了从实质性方法论转化的趋势。但是,社会统计学派仍然强调在统计研究中必须以事物的质为前提和认识事物质的重要性,这同数理统计学派的计量不计质的方法论性质是有本质区别的。

二、20世纪——迅速发展的统计学

20世纪初以来,科学技术迅猛发展,社会发生了巨大变化,统计学进入了快速发展时期。归纳起来有以下几个方面。

1、由记述统计向推断统计发展。记述统计是对所搜集的大量数据资料进行加工整理、综合概括,通过图示、列表和数字,编制次数分布表、绘制直方图、计算各种特征数等,对资料进行分析和描述。而推断统计,则是在搜集、整理观测的样本数据基础上,对有关总体作出推断。其特点是根据带随机性的观测样本数据以及问题的条件和假定(模型),而对未知事物作出的,以概率形式表述的推断。西方国家所指的科学统计方法,主要就是指推断统计来说的。

2、由社会、经济统计向多分支学科发展。在20世纪以前,统计学的领域主要是人口统计、生命统计、社会统计和经济统计。随着社会、经济和科学技术的发展,到今天,统计的范畴已覆盖了社会生活的一切领域,几乎无所不包,成为通用的方法论科学。它被广泛用于研究社会和自然界的各个方面,并发展成为有着许多分支学科的科学。

3、统计预测和决策科学的发展。传统的统计是对已经发生和正在发生的事物进行统计,提供统计资料和数据。20世纪30年代以来,特别是第二次世界大战以来,由于经济、社会、军事等方面的客观需要,统计预测和统计决策科学有了很大发展,使统计走出了传统的领域而被赋予新的意义和使命。

4、信息论、控制论、系统论与统计学的相互渗透和结合,使统计科学进一步得到发展和日趋完善。信息论、控制论、系统论在许多基本概念、基本思想、基本方法等方面有着共同之处,三者从不同角度、侧面提出了解决共同问题的方法和原则。三论的创立和发展,彻底改变了世界的科学图景和科学家的思维方式,也使统计科学和统计工作从中吸取了营养,拓宽了视野,丰富了内容,出现了新的发展趋势。

5、计算技术和一系列新技术、新方法在统计领域不断得到开发和应用。近几十年间,计算机技术不断发展,使统计数据的搜集、处理、分析、存贮、传递、印制等过程日益现代化,提高了统计工作的效能。计算机技术的发展,日益扩大了传统的和先进的统计技术的应用领域,促使统计科学和统计工作发生了革命性的变化。而今,计算机科学已经成为统计科学不可分割组成部分。随着科学技术的发展,统计理论和实践深度和广度方面也不断发展。

6.统计在现代化管理和社会生活中的地位日益重要。统计在现代化国家管理和企业管理中的地位,在社会生活中的地位,越来越重要了。人们的日常生活和一切社会生活都离不开统计。英国统计学家哈斯利特说:“统计方法的应用是这样普遍,在生活和习惯中,统计的影响是这样巨大,以致统计的重要性无论怎样强调也不过分。”甚至有的科学有还叫做“统计时代”。显然,20世纪统计科学的发展及其未来,已经被赋予了划时代的意义。

统计学现状

在科学技术飞速发展的今天,统计学广泛吸收和融合相关学科的新理论,不断开发应用新技术和新方法,深化和丰富了统计学传统领域的理论与方法,并拓展了新的领域。统计学已展现出强有力的生命力。在国家,社会主义市场经济体制的逐步建立,实践发展的需要对统计学提出了新的更多、更高的要求。随着社会主义市场经济的成长和不断完善,统计学的潜在功能将得到更充分更完满的开掘。

第一,对系统性及系统复杂性的认识为统计学的未来发展增加了新的思路。由于社会实践广度和深度迅速发展,以及科学技术的高度发展,人们对客观世界的系统性及系统的复杂性认识也更加全面和深入。随着科学融合趋势的兴起,统计学的研究触角已经向新的领域延伸,新兴起了探索性数据的统计方法的研究。研究的领域向复杂客观现象扩展。21世纪统计学研究的重点将由确定性现象和随机现象转移到对复杂现象的研究。模糊现象、突变现象及混沌现象等新的领域。可以这样说,复杂现象的研究给统计开辟了新的研究领域。

第二,定性与定量相结合的综合集成法将为统计分析方法的发展提供新的思想。定性与定量相结合的综合集成方法是钱学森教授于1990年提出的。这一方法的实质就是将科学理论、经验知识和专家判断相结合,提出经验性的假设,再用经验数据和资料以及模型对它的确实性进行检测,经过定量计算及反复对比,最后形成结论。它是研究复杂系统的有效手段,而且在问题的研究过程中处处渗透着统计思想,为统计分析方法的发展提供了新的思维方式。

第三,统计科学与其他科学渗透将为统计学的应用开辟新的领域。现代科学发展已经出现了整体化趋势,各门学科不断融合,已经形成一个相互联系的统一整体。由于事物之间具有的相互联系性,各学科之间研究方法的渗透和转移已成为现代科学发展的一大趋势。许多学科取得的新的进展为其他学科发展提供了全新的发展机遇。模糊论、突变论及其他新的边缘学科的出现为统计学的进一步发展提供了新的科学方法和思想。将一些尖端科学成果引入统计学,使统计学与其交互发展将成为未来统计学发展的趋势。统计学也将会有一个令人振奋的前景。已经有一些先驱者开始将控制论、信息论、系统论以及图论、混沌理论、模糊理论等方法和理论引入统计学,这些新的理论和方法的渗透必将会给统计学的发展产生深远的影响。

统计学产生于应用,在应用过程中发展壮大。随着经济社会的发展、各学科相互融合趋势的发展和计算机技术的迅速发展,统计学的应用领域、统计理论与分析方法也将不断发展,在所有领域展现它的生命力和重要作用。

学科分支

一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。

1.统计学的分支学科有:

统计学史

宏观经济统计学文化与体育统计学

社会福利与社会保障统计学

环境统计学

理论统计学微观经济,统计学卫生统计学自然资源统计学国际比较统计学
统计调查分析理论管理统计学司法统计学国际统计学国际标准分类统计学
统计监督理论科学技术统计学生活质量统计学国际核算体系与方法论体系国际标准分类统计学
统计预测理论描述统计学环境与生态统计学社会统计学生态平衡,统计学
统计逻辑学经济统计学统计学教育统计学工程统计学
水文统计学水文统计学社会经济统计学生物统计学心理统计学
统计物理学统计语言学化学统计学数理统计学化学统计学
推断统计学农村经济调查生活质量统计学商务统计学档案统计学
生活质量统计学人口统计学统计法学

2.延伸学科

有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:

人口统计资料采矿(应用统计学以及图形从资料中获取知识)电机统计化学与程序分析(所有有关化学的资料分析与化工科学)
经济统计学生物统计统计物理学社会统计(包括所有的社会科学﹚
商用统计农业科学心理统计学文献统计分析
教育统计学运动统计学,特别是,棒球,以及,曲棍球

统计对于商业以及工业是一个基本的关键,被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。

一些学科大量地利用了应用统计学,以至它们自己已经各自独立成为一门学科。

1.统计学的分支学科有:

统计学史

宏观经济统计学文化与体育统计学

社会福利与社会保障统计学

环境统计学

理论统计学微观经济统计学卫生统计学自然资源统计学国际比较统计学
统计调查分析理论管理统计学司法统计学国际统计学国际标准分类统计学
统计监督理论科学技术统计学生活质量统计学国际核算体系与方法论体系国际标准分类统计学
统计预测理论描述统计学环境与生态统计学社会统计学生态平衡统计学
统计逻辑学经济统计学统计学教育统计学工程统计学
水文统计学水文统计学社会经济统计学生物统计学心理统计学
统计物理学统计语言学化学统计学数理统计学化学统计学
推断统计学农村经济调查生活质量统计学商务统计学档案统计学
生活质量统计学人口统计学统计法学

2.延伸学科

有些科学广泛的应用统计的方法使得他们拥有各自的统计术语,这些学科包括:

人口统计资料采矿(应用统计学以及图形从资料中获取知识)电机统计化学与程序分析(所有有关化学的资料分析与化工科学)
经济统计学生物统计统计物理学社会统计(包括所有的社会科学﹚
商用统计农业科学心理统计学文献统计分析
教育统计学运动统计学,特别是棒球以及曲棍球

统计对于商业以及工业是一个基本的关键,被用来了解与测量系统变异性,程序控制,对资料作出结论,并且完成资料取向的决策。

分析方法

1.连续性资料

1.1 两组独立样本比较

1.1.1 资料符合正态分布,且两组方差齐性,直接采用t检验。

1.1.2 资料不符合正态分布,(1)可进行数据转换,如对数转换等,使之服从正态分布,然后对转换后的数据采用t检验;(2)采用非参数检验,如Wilcoxon检验。

1.1.3 资料方差不齐,(1)采用Satterthwate 的t’检验;(2)采用非参数检验,如Wilcoxon检验。

1.2 两组配对样本的比较

1.2.1 两组差值服从正态分布,采用配对t检验。

1.2.2 两组差值不服从正态分布,采用wilcoxon的符号配对秩和检验。

1.3 多组完全随机样本比较

1.3.1资料符合正态分布,且各组方差齐性,直接采用完全随机的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.3.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Kruscal-Wallis法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用成组的Wilcoxon检验。

1.4 多组随机区组样本比较

1.4.1资料符合正态分布,且各组方差齐性,直接采用随机区组的方差分析。如果检验结果为有统计学意义,则进一步作两两比较,两两比较的方法有LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。

1.4.2资料不符合正态分布,或各组方差不齐,则采用非参数检验的Fridman检验法。如果检验结果为有统计学意义,则进一步作两两比较,一般采用Bonferroni法校正P值,然后用符号配对的Wilcoxon检验。

注意问题

(1) 一般来说,如果是大样本,比如各组例数大于50,可以不作正态性检验,直接采用t检验或方差分析。因为统计学上有中心极限定理,假定大样本是服从正态分布的。

(2) 当进行多组比较时,最容易犯的错误是仅比较其中的两组,而不顾其他组,这样作容易增大犯假阳性错误的概率。正确的做法应该是,先作总的各组间的比较,如果总的来说差别有统计学意义,然后才能作其中任意两组的比较,这些两两比较有特定的统计方法,如上面提到的LSD检验,Bonferroni法,tukey法,Scheffe法,SNK法等。**绝不能对其中的两组直接采用t检验,这样即使得出结果也未必正确**

(3) 关于常用的设计方法:多组资料尽管最终分析都是采用方差分析,但不同设计会有差别。常用的设计如完全随即设计,随机区组设计,析因设计,裂区设计,嵌套设计等。

2.分类资料

2.1 四格表资料

2.1.1 例数大于40,且所有理论数大于5,则用普通的Pearson 检验。

2.1.2 例数大于40,所有理论数大于1,且至少一个理论数小于5,则用校正的 检验或Fisher’s确切概率法检验。

2.1.3 例数小于40,或有理论数小于2,则用Fisher’s确切概率法检验。

2.2 2×C表或R×2表资料的统计分析

2.2.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。

2.2.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效,则可用行平均分差检验或成组的Wilcoxon秩和检验。

2.2.3 列变量为效应指标,且为二分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.3 R×C表资料的统计分析

2.3.1 列变量&行变量均为无序分类变量,则(1)例数大于40,且理论数小于5的格子数目<总格子数目的25%,则用普通的Pearson 检验。(2)例数小于40,或理论数小于5的格子数目>总格子数目的25%,则用Fisher’s确切概率法检验。(3)如果要作相关性分析,可采用Pearson相关系数。

2.3.2列变量为效应指标,且为有序多分类变量,行变量为分组变量,用普通的Pearson 检验只说明组间构成比不同,如要说明疗效或强弱程度的不同,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。

2.3.3 列变量为效应指标,且为无序多分类变量,行变量为有序多分类变量,则可采用普通的Pearson 检验比较各组之间有无差别,如果有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。

2.3.4 列变量&行变量均为有序多分类变量,(1)如要做组间差别分析,则可用行平均分差检验或成组的Wilcoxon秩和检验或Ridit分析。如果总的来说有差别,还可进一步作两两比较,以说明是否任意两组之间的差别都有统计学意义。(2)如果要做两变量之间的相关性,可采用Spearson相关分析。

配对分类

2.4.1 四格表配对资料,(1)b+c>40,则用McNemar配对 检验。(2)b+c<40,则用校正的配对 检验。

2.4.1 C×C资料,(1)配对比较:用McNemar配对 检验。(2)一致性检验,用Kappa检验。

相关组织

统计的组织必须贯彻集中统一的原则,在全国范围内建立集中统一的统计系统,执行统一的方针政策和统计调查计划,贯彻统一的统计制度和统计标准,使用统一的统计报表和数字管理制度,以及协调统计、会计、业务核算制度和核算标准及分工等。国家集中统一的统计系统有各级部门的综合统计系统、各级业务部门的专业统计系统、以及城乡基层组织企业单位的统计组织所组成。

统计分析综合统计系统

各级政府部门的综合统计系统是由国家统计局和地方各级统计机构所组成,是国家统计组织的主系统。其主要职责:

1. 制定统计调查计划,部署和检查全国或者行政区域内的统计工作;

2. 组织国家统计调查、地方统计调查。搜集、整理、提供全国或行政区域内的统计资料;

3. 对国民经济和社会发展情况进行统计分析,实行统计监督;依照国务院的规定组织国民经济核算;

4. 管理和协调各部门制定的统计调查表和统计标准。

专业统计系统

专业统计系统是由中央及地方各级业务部门的统计机构所组成,是国家专业统计组织的子系统。其主要职责:

1.组织、协调部门各职能机构的统计工作,完成国家统计调查和地方统计调查任务,制定和实施部门的统计调查表,搜集、整理、提供统计资料;

2.对部门和管辖系统内企业事业组织的计划执行情况,进行统计分析,实行统计监督;

3.组织、协调部管辖系统内企业事业组织的统计工作,管理部门的统计调查表。

基层单位的统计组织

基层单位的统计组织包括乡镇统计组织或统计专业人员,企业事业单位的统计组织或统计负责人。其主要职责:

1.组织、协调单位的统计工作,完成国家统计调查、部门统计调查和地方统计调查任务,搜集、整理、提供统计资料;

2.对单位的计划执行情况进行统计分析,实行统计监督;

3.管理单位的统计调查表,建立健全统计台账制度,并会同有关机构或者人员建立健全原始记录制度。

产生发展

历史沿革

夏禹时代(公元前22世纪)分为九州,有人口约1352万,可见人口统计的久远。《书经·禹贡篇》记述了九州的基本土地情况,被西方经济学家推崇为“统计学最早的萌芽”。西周建立了较为系统的统计报告制度。秦时《商君书》中提出“强国知十三数”,其中包括粮食储备、各国人数、农业生产资料及自然资源等等。

公元前27世纪,埃及为了建造金字塔和大型农业灌溉系统,曾进行过全国人口和财产调查。公元前15世纪,犹太人为了战争的需要进行了男丁的调查。

统计公元前约6世纪,罗马帝国规定每5年进行一次人口、土地、牲畜和家奴的调查,并以财产总额作为划分贫富等级和征丁课税的依据。

15至18世纪,欧洲出现了许多以报导国情为内容的统计著作。

在19世纪30年代后,出现了所谓“统计狂热时代”。

1,关于单词statistics

起源于国情调查,最早意为国情学。

十 七世纪,在英格兰人们对“政治算术”感兴趣。1662年,John Graunt发表了他第一本也是唯一一本手稿,《natural and politics observations upon the bills of mortality》, 分析了生男孩和女孩的比例,发展了现在保险公司所用的那种类型的死亡率表。

英文的statistics大约在十八世纪中叶由德国学者 Gottfried Achenwall所创造,是由状态status和德文的政治算术联合推导得出的,第一次由John Sinclair所使用,即1797年出现在Encyclopaedia Britannica。(早期还有一个单词publicitics和statistics竞争“统计”这一含义,如果得胜,现在就开始流行 publicitical learning了)。

2,关于高斯分布或正态分布

1733年,德-莫佛(De Moivre)在给友人分发的一篇文章中给出了正态曲线(这一历史开始被人们忽略)

1783年,拉普拉斯建议正态曲线方程适合于表示误差分布的概率。

1809年,高斯发表了他的关于天体运行论的伟大著作,在这一著作的第二卷第三节中,他导出正态曲线适宜于表示误差规律,同时承认拉普拉斯较早的推导。

正态分布在十九世纪前叶因高斯的工作而加以推广,所以通常称作高斯分布。卡尔-皮尔逊指出德-莫佛是正态曲线的创始人,第一个称它为正态分布,但人们仍习惯称之高斯分布。

3,关于最小二乘法

1805年,Legendre提出最小二乘法,Gauss声称自己在1794年用过,并在1809年基于误差的高斯分布假设,给出了严格推导。

4,其它

在十九世纪中叶,三个不同领域产生的重要发展都是基于随机性是自然界固有的这个前提上的。

阿道夫·凯特莱特(A. Quetlet,1869)利用概率性的概念来描述社会学和生物学现象(正态曲线从观察误差推广到各种数据)

孟德尔(G.Mendel,1870)通过简单的随机性结构公式化了他的遗传法则

玻尔兹曼(Boltzmann,1866)对理论物理中最重要的基本命题之一的热力学第二定律给出了一个统计学的解释。

1859 年,达尔文发表了《物种起源》,达尔文的工作对他的表兄弟高尔登爵士有深远影响,高尔登比达尔文更有数学素养,他开始利用概率工具分析生物现象,对生物计 量学的基础做出了重要贡献(可以称他为生物信息学之父吧),高尔登爵士是第一个使用相关和回归这两个重要概念的人,他还是中位数和百分位数这种概念的创始 人。

受高尔登工作影响,在伦敦的大学学院工作的卡尔-皮尔逊开始把数学和概率论应用于达尔文进化论,从而开创了现代统计时代,赢得了统计之父的称号,1901年Biometrika第一期出版(卡-皮尔逊是创始人之一)。

5,关于总体和样本

在早期文献中可找到由某个总体中抽样的明确例子,然而从总体中只能取得样本的认识常常是缺乏的。 ----K.皮尔逊时代

到十九世纪末,对样本和总体的区别已普遍知道,然而这种区分并不一定总被坚持。----1910年Yule在自己的教科书中指出。

在 1900年代的早期,区分变的更清楚,并在1922年被Fisher特别强调。----Fisher在1922年发表的一篇重要论文中《On the mathematical foundation of theoretical statistics》,说明了总体和样本的联系和区别,以及其他概念,奠定了“理论统计学”的基础。

6,期望、标准差和方差

期望是一个比概率更原始的概念,在十七世纪帕斯卡和费马时代,期望概念已被公认了。K.皮尔逊最早定义了标准差的概念。1918年,Fisher引入方差的概念。

力学中的矩和统计学中的中数两者之间的相似性已被概率领域的早期工作者注意到,而K.皮尔逊在1893年第一次在统计意义下使用“矩”。

7,卡方统计量

卡方统计量,是卡-皮尔逊提出用于检验已知数据是否来自某一特定的随机模型,或已知数据是否与已给定的假设一致。卡方检验被誉为自1900年以来在科学技术所有分支中20个尖端发明之一,甚至敌人Fisher都对此有极高评价。

8,矩估计与最大似然

卡-皮尔逊提出了使用矩来估计参数的方法。

Fisher则在1912年到1922年间提出了最大似然估计方法,基于直觉,提出了估计的一致性、有效性和充分性的概念。

9,概率的公理化

1933年,前苏联数学家柯尔莫格洛夫(Kolmogorov)发表了《概率论的基本概念》,奠定了概率论的严格数学基础。

10,贝叶斯定理

贝叶斯对统计学几乎没有什么贡献,然而贝叶斯的一篇文章成为贝叶斯学派统计学的思想模式的焦点,这一篇文章发表于1763年,由贝叶斯的朋友、著名人寿保险原理的开拓者Richard Price在贝叶斯死后提出来的----贝叶斯定理。

概率思想的两种方法,(1)作为一个物理系统内在的一种物理特性,(2)对某一陈述相信程度的度量。 在1950年代后期止,多数统计学家采取第一种观点,即概率的相对频数解释,这一时期贝叶斯定理仅应用在概率能在频数框架内解释的场合。贝叶斯统计学派著 作的一个浪潮始于1960年。自此,赞成和反对贝叶斯学派统计的两方以皮尔逊和费舍尔所特有的激情和狂怒进行申辩和争辩。

在1960年以前,几乎所有的统计书刊都避免使用贝叶斯学派方法,Fisher坚持避免使用贝叶斯定理,并在他的最后一本书中再一次坚决的拒绝了它。卡尔-皮尔逊偶然使用,总的来说是避免的。奈曼和E.S.皮尔逊在他们有关假设检验的文章中坚决反对使用。

相关职能

统计统计要达到认识社会的目的,不仅需要科学的方法,而且需要强有力的组织领导。因此统计兼有信息、咨询、监督三种职能。

信息职能是统计部门根据科学的统计指标体系和统计调查方法,灵敏、系统的采集、处理、传输、贮存和提供大量的以数据描述为基本特征的社会经济信息。

咨询职能指利用已经掌握的丰富的统计信息资源,运用科学的分析方法和先进的技术手段,深入开展综合分析和专题研究,为科学决策和管理提供各种可供选择的咨询建议与对策方案。

监督职能指根据统计调查和分析,及时、准确地从总体上反映经济、社会和科技的运行状态,并对其实行全面、系统的定量检查、监测和预警,以促使国民经济按照客观规律的要求,持续、稳定、协调地发展。

这三种职能是相互联系、相辅相成的。统计信息职能是保证咨询和监督职能有效发挥的基础;统计咨询职能是统计薪资职能的延续和深化;而统计监督职能则是信息、咨询职能基础上进一步拓展并促进统计信息和咨询职能的优化。

相关网站

搜数网,中国资讯行于2006年推出,是以统计数据为核心的数据垂直搜索网站,商业数据逾200,000,000条,囊括4000多本年鉴,涵盖760,000张统计表格。时间跨度自1949年至今,覆盖全国31个省级行政区域并深入254个地级、市级、县级行政区域,同时包括部分台港澳以及国际部分地区统计资料。数据内容涉及54个行业大类。

相关新闻

词条信息

  • 浏览次数: 1274 次

  • 更新时间: 2015-01-08