搜档网
当前位置:搜档网 › 统计学里“P”的故事

统计学里“P”的故事

统计学里“P”的故事
统计学里“P”的故事

统计学里“P”的故事:蚊子、皇帝的新衣和不育的风流才子来源:《自然》

作者:Regina Nuzzo 时间:2014-05-27 16:59:11

【摘要】衡量统计真实性的“黄金标准”——P值,并非众多科学家想象的那样可靠。

衡量统计真实性的“黄金标准”——P值,并非众多科学家想象的那样可靠。

2010年某个瞬间,马特·莫德尔(Matt Motyl)离享受科学荣誉仅有一步之遥。那时,他发现政治极端主义者看到的世界是确实是非黑即白的。

实验结果“非常清楚”。莫德尔这样回忆道。他是夏洛茨维尔市弗吉尼亚大学的心理学博士生。他所做的一项涉及近2000人的研究中的数据似乎表明,与左翼或右翼人士相比,政治中立派能更准确地辨别不同色度的灰色。他说:“实验的假设很有趣,而且数据也能够有力支持实验假设。”用来衡量统计显著性的常用指标是P值。该实验中的P值为0.01,通常人们会认为这说明实验结果“非常显著”。莫德尔十分有把握能把自己的论文发表在高影响因子的刊物上。

但是,现实无情地粉碎了幻想。由于担心实验结果陷入再现性争论,莫德尔和他的导

师布莱恩?诺塞克(Brian Nosek)决定重复实验。添加了新的数据之后,P值变成了0.59,这个数字远未达到学界一般能接受的显著性水平0.05。莫德尔观察到的心理学效应没有了,他年少成名的梦也被打碎了。

其实,不是莫德尔的数据或分析出了什么问题,而是P值这个指标出了问题。从本质上讲,这个指标出人意料的不稳定,它并不是大多数科学家想象的那样可靠和客观。“P值没有起到人们期望的作用,因为它压根就不可能起到这个作用。”伊利诺伊州芝加哥市罗斯福大学的经济学家斯蒂芬?兹利亚克(Stephen Ziliak)这样说,他经常批评统计学的应用方式。

出于对实验可重复性的担忧,P值的问题让很多科学家特别发愁。2005年,加州斯坦福大学的流行病学家约翰?埃迪尼斯(John Ioanniadis)指出,大多数公开发表的科学发现都是有问题的。此后,一连串备受瞩目的、有可重复性问题的研究迫使科学家重新思考该如何评估研究结果。

与此同时,统计学家也在寻找更好的分析数据的方法,以避免科学家错失重要信息,或在假阳性结果上浪费精力。“当你的统计思想发生改变之后,突然,重要的东西也完全变了。”斯坦福大学物理学家、统计学家史蒂文·古德曼(Steven Goodman)说:“规则并不是天注定的,它是由我们所采用的统计方法决定的。”

对P值的误用

人们一直都对P值批评不断。90年前P值诞生以来,被比作过蚊子(因为这东西烦人又挥之不去)、皇帝的新衣(因为P值的方法中到处都是显而易见却被所有人无视的问题)以及“不育的风流才子”手中的工具——这位“才子”强抢了科学佳人,却让科学佳人后继无人。一位研究人员表示,应该把“统计推论和假设检验”这个方法改个名字,叫做“统计假设和推论检验”(statistical hypothesis inference testing),大概因为这个名字的首字母缩写更符合它的气质。

讽刺之处在于,20世纪20年代,英国统计学家罗纳德·费希尔(Ronald Fisher)首次采用P值方法时,并没有打算把它作为决定性的检验方法。他本来只是用P值作为一种判断数据在传统意义上是否显著的非正式方法,也就是说,用来判断数据证据是否值得进行深入研究。P值方法的思路是先进行一项实验,然后观察实验结果是否符合随机结果的特征。研究人员首先提出一个他们想要推翻的“零假设”(null hypothesis),比如,两组数据没有相关性或两组数据没有显著差别。接下来,他们会故意唱反调,假设零假设是成立的,然后计算实际观察结果与零假设相吻合的概率。这个概率就是P值。费希尔说,P值越小,研究人员成功证明这个零假设不成立的可能性就越大。

将数据和背景知识相结合得出科学结论的过程是流动的、非数值化的。尽管P值的精确性显而易见,费希尔还是希望它只是这个过程的一部分。但是,科学家很快就开始利用P 值来保证循证决策的严谨与客观。这一运动是20世纪20年代末,由费希尔的死对头、波兰数学家耶日·内曼(Jerzy Neyman)和英国统计学家埃贡·皮尔森(Egon Pearson)一手推动的。他们采用了一种新的数据分析框架,该框架中包括统计效力、假阳性、假阴性和很多其他如今在统计学概论课上耳熟能详的概念。他俩直接无视了P值这个指标。

双方争执不断,内曼批评费希尔的某些工作从数学上讲比“毫无用处”还糟糕,而费希尔对内曼的方法给出的评价是“无比幼稚”、“在西方学界中简直骇人听闻”。但是,就在双方争执不下时,其他研究人员的耐心渐渐耗尽了。他们开始给进行研究的科学家们编写统计学指南。但是其中很多作者并非统计学家,他们对两种方法都缺乏透彻的理解。结果就是他们把费希尔粗略的P值计算法硬塞进了内曼和皮尔森二人建立的规则严密的统计系统中,创造出了一种混合的方法,然后就出现了像“P值为0.05,即可将统计结果视为显著”这样的规则。古德曼说:“统计学家从没打算以现在的方式使用P值。”

“P值至上”带来的恶果

这样做的后果之一就是人们对P值的意义充满困惑。我们回过头来看一下莫德尔关于政治激进者的研究。大多数科学家看到实验最初统计结果的P值为0.01,就会认为莫德尔的结论不成立的概率只有1%。但他们错了。P值无法告诉研究人员这样的信息。P值能做的,就是在特定的零假设条件下对数据特征进行总结分析。研究人员不能利用P值通过反向推导对事实作出判断。要对事实作出判断,还需要更多信息,也就是现实世界中该效应客观存在的概率。忽视了这一点,就好像一个人清晨醒来觉得有点头痛,然后就断定自己得了某种罕见的脑瘤。这当然不是不可能,只是这事儿摊到你头上的概率太小,所以你得先拿出更多证据推翻例如过敏反应这样更为常见的原因。结论越是令人难以置信(比如心灵感应、外星人、顺势疗法),这种惊人的发现是假阳性的可能性就越大,不管你的P值有多小。

这些都是比较难懂的概念,但是一些统计学家试图用它们来解释经验法则的失灵(见

下图)。根据应用最广泛的一种计算方法,如果假设为该现象存在,那么当P值为0.01时,该现象实际并不存在的概率至少为11%;而当P值为0.05时,这一概率则会上升到29%。因此,莫德尔的发现是假阳性的概率超过10%。同样,结果可重复的概率也不是大多数人所想的99%,而是73%左右。而再得到一个极为显著的结果的概率只有50%。换言之,莫德尔的实验结果不可重复的概率高得惊人,就跟抛硬币猜正面向上,而落下来是反面朝上的概率差不多。

图中的三个例子证明,即使计算得出的P值非常小(具有统计显著性),实验结果也可能具有极高的不可重复率。

批评者也感慨P值会让研究人员思维混乱。最重要的一个例子是,P值容易使研究者

错误的估计现象的真实影响。比如去年,一项覆盖超过19000人的研究显示,在网上结识的夫妻比在现实生活中结识的夫妻离婚的可能性更低(P<0.002),而获得婚姻满足感的可能性则更高(P<0.001)。(点击这里看详情)。这一现象也许挺让人印象深刻,但这种现象其实非常不明显。网上结识的夫妇离婚率为5.96%,而现实生活中结识的夫妻离婚率为7.67%,根据7分幸福感评分表测试中,网上结识的夫妻幸福感为5.64分,而现实生活中结石的夫妻幸福感为5.48分。澳大利亚墨尔本市拉筹伯大学的荣誉心理学家杰夫·卡明(Geoff Cumming)认为:“为了追求很小的P值而忽略背后更大的问题这一现象是“诱人的显著性”的牺牲品。”但是,显著性并不意味着实际中确实存在相关性。他说:“我们应该问的是,‘某种现象出现的概率有多大?’而不是‘有没有某种现象?’”

大概,最糟糕的错误是某种自欺欺人的行为,宾夕法尼亚大学的心理学家尤里·西蒙逊(Uri Simonsohn)及其同事给这种行为起名为“P值操纵”(P-hacking)。这种行为也被称为数据挖掘、数据窥探、数据钓鱼、追逐显著性或者双重计算。西蒙逊解释道:“P值操纵就是不断地把数据量加倍,直到获得自己想要的结果。”这种行为甚至是下意识的。这可能是在线城市词典中收录的第一个统计学词条,该词条的例句是:“这一发现似乎是通过P值操纵做出来的。作者去掉了其中一种条件下的数据,使总体的P值小于0.05。”或者“她是个P值操纵者,总是一边收集数据一边看数据好不好。”

这种行为的结果是,把本应带着质疑眼光审视的探索性研究的结果变得看似确定无疑实际上却难以重复。西蒙逊的计算机模拟实验表明,只需改变研究中的若干数据分析方法,就能使假阳性的概率提高到60%。如今的研究都希望能从杂乱的数据中发现并不十分明显的现象。在这种背景下,尤其容易出现P值操纵。尽管难以估计这种做法有多普遍,但西

蒙逊认为这一问题应该已经很严重了。在一项分析研究中,他发现有迹象表明,很多公开发表的心理学论文中,P值都出人意料地分布在0.05左右——就像研究人员通过P值操纵不断尝试,直到得到理想的P值

解决之道

尽管对P值提出批评的大有人在,但统计方法的变革仍然进展缓慢。“费希尔、内曼和皮尔森提出他们的理论后,统计学的基本框架实质上没有发生任何改变。”古德曼说。1982年,明尼阿波利斯市明尼苏达大学心理学家约翰·坎贝尔(John Campell)曾经抱怨过这个问题,当时他还是《应用心理学杂志》的编辑。他说:“要把作者的注意力从P值上转移走几乎是不可能的,P值小数点后面的零越多,人们就越抓着P值不愿放手。”1989年,马萨诸塞州波士顿大学的肯尼斯·罗斯曼(Kenneth Rothman)创办了《流行病学》这本杂志,当时他尽力劝阻作者不要使用P值。但是在2001年他离开了杂志社后,这本杂志中又经常出现P值了。

埃尼迪斯最近正在PubMed数据库中搜寻数据,用来研究不同领域的学者是如何使用P值和其他统计学证据的。“只需要粗略浏览几篇最近发表的论文,你就会发现P值仍然是非常非常流行的方法。”

古德曼认为,这种根深蒂固的研究文化需要彻底的改革——人们必须改变统计学的教授方式、数据分析方式以及结果呈现和解释的方式;而好在研究人员已经开始意识到自己的问题了。“已公开发表的众多科学发现都不成立,这给人们敲了个警钟。”埃尼迪斯等研究

者的研究揭示了理论统计学的批评观点与统计学应用上的难题之间的联系。古德曼说:“统计学家预言会出现的问题正是我们当前遇到的问题,只是我们还没有找到全部的解决办法。”

统计学家提出了几个或许可行的方法。比如卡明认为,为了避免掉进思考结果是否显著这个陷阱,研究人员应该在文章中提供效应量和置信区间的相关数据。这些数据可以反映P值无法反映的信息,也就是效应的规模及其相对重要性。

很多统计学家还呼吁用基于贝叶斯法则的方法替代P值。这一法则诞生于18世纪,其思想是把概率视为某种结果的似然性而非出现的频率。这其中蕴含了某种主观因素,而这也是统计学前沿学者想极力避免的。但是,贝叶斯分析框架能够使观察者相对容易地将自己所知道的内容融入结论,以及计算出现新数据后概率如何变化。

其他人则赞成一种更普遍的方法,即鼓励研究人员对同一套数据用多种方法进行分析。卢森堡市公共卫生研究中心的统计学家史蒂芬·森(Stephen Senn)把这个方法比作没法从墙角里绕出来的扫地机器人。任何数据分析方法最终都会有行不通的时候,这时就需要用常识将分析拖回正轨。他认为倘若用不同的方法得到了不同的结论,“就表明研究者应该继续开动脑筋,努力找到原因”,而这能让我们更好地理解背后的真相。

西蒙逊认为科学家为自己辩解最有利的武器就是承认一切。他鼓励作者在论文中写上这样一段话:“论文中列出了研究中我们确定样本大小的方法、所有舍弃的数据(如果有的话)以及研究中用到的所有操作和测量方法。”通过这种方式表明文章没有进行“P值操纵”。他希望通过披露这些信息,能够阻止P值操纵行为,或者至少能提醒读者注意论文中的疑

点,并自行做出判断。

纽约市哥伦比亚大学政治学家、统计学家安德鲁·格尔曼(Andrew Gelman)表示,目前另一个受到关注的类似方法是两阶段分析法,也叫做“先预定后重复法”(preregistered replication)。这种方法中,探索与验证分析通过不同的方式进行,而且要在论文中清楚地标示出来。例如,研究人员首先做两个探索性的小研究,用来发现可能比较有趣的现象,而又不需要太担心假阳性结论;而不是一下做4个单独的小研究,然后在同一篇论文中写出所有的结果。然后,在上述研究结果的基础上,作者再决定用什么方法来验证他的发现,并在Open Science Framework这样的数据库中向公众提前披露自己的研究意向。然后,他们再进行重复实验,并将结果之前与探索性研究的结果一同发表。格尔曼表示这种方法使研究分析更加自由和灵活,同时也能使研究者保持严谨,并降低公开发表的假阳性结果的数量。

古德曼还表示,进一步来说,研究人员需要意识到传统统计学方法的局限性。他们应该在研究中融入对假设似然性和研究局限性的科学判断,而这些内容通常情况下会被放到讨论部分——包括相同或类似实验的结果、研究人员提出的可能的机制以及临床认识等等。马里兰州巴尔的摩市约翰霍普金斯大学布隆伯格公共卫生学院的统计学家理查德·罗耶儿(Richard Royall)认为,科学家应该在实验结束之后思考三个问题:“支持数据是什么?”、“我应该相信什么样的数据?”以及“下一步应该怎么做?”单一方法无法回答上述全部问题。古德曼说:“数字仅仅是科学讨论的开始,而不是结束。”

数学小故事集合1

数学小知识集合 1.符号“+”“-”是五百年前一位德国人最先使用的。当时他们并不表示“加上”“减去”。知道三百多年前才正式用来表示“加上”“减去”。 2.“七巧板”是我国古代的一种拼板玩具,有七个块可以拼成一个大正方形的薄板组成,拼出来的图案变化万千。后来传到国外叫做“唐图”。“七巧板”流传到今天,成为人们喜爱的一种智力玩具。 3.传说早在四五千年前,我们的祖先就用一种滴水的器具来计时,名叫刻漏。 4.乘号“×”是三百多年前一位英国数学家最先使用的。因为乘法是一种特殊的加法,所以他把加号斜过来表示。 5.公元前46年,罗马统帅儒略·恺撒指定历法。由于他出生在7月,为了表示他的伟大,决定将7月改为“儒略月”,连同所有的单月都规定为31天,双月为30天。这样一年多出一天,2月是古罗马处死犯人的月份,为了减少处死的人数,将2月减少1天,为29天。 6.小方是一个木匠,但他很傲慢,有一天,师傅问他:“桌子有4个角,我砍去一个,还剩几个?”小芳说4-1=3,三个。师傅告诉他,有5个 7、数字趣联 宋代大诗人苏东坡年轻时与几个学友进京考试.他们到达试院时为时已晚.考官说:"我出一联,你们若对得上,我就让你们进考场."考官的上联是:一叶孤舟,坐了二三个学子,启用四桨五帆,经过六滩七湾,历尽八颠九簸,可叹十分来迟. 苏东坡对出的下联是:十年寒窗,进了九八家书院,抛却七情六欲,苦读五经四书,考了三番两次,今日一定要中. 考官与苏东坡都将一至十这十个数字嵌入对联中,将读书人的艰辛与刻苦情况描写得淋漓尽致. 8、大约1500年前,欧洲的数学家们是不知道用“0”的。他们使用罗马数字。罗马数字是用几个表示数的符号,按照一定规则,把它们组合起来表示不同的数目。在这种数字的运用里,不需要“0”这个数字。 而在当时,罗马帝国有一位学者从印度记数法里发现了“0”这个符号。他发现,有了“0”,进行数学运算方便极了,他非常高兴,还把印度人使用“0”的方法向大家做了介绍。过了一段时间,这件事被当时的罗马教皇知道了。当时是欧洲的中世纪,教会的势力非常大,罗马教皇的权利更是远远超过皇帝。教皇非常恼怒,他斥责说,神圣的数是上帝创造的,在上帝创造的数里没有“0”这个怪物,如今谁要把它给引进来,谁就是亵渎上帝!于是,教皇就下令,把这位学者抓了起来,并对他施加了酷刑,用夹子把他的十个手指头紧紧夹注,使他两手残废,让他再也不能握笔写字。就这样,“0”被那个愚昧、残忍的罗马教皇明令禁止了。 但是,虽然“0”被禁止使用,然而罗马的数学家们还是不管禁令,在数学的研究中仍然秘密地使用“0”,仍然用“0”做出了很多数学上的贡献。后来“0”终于在欧洲被广泛使用,而罗马数字却逐渐被淘汰了。二十一世纪从哪年开始? 世纪是计算年代的单位,一百年为一个世纪. 第一世纪的起始年和末尾年,分别是公元1年和公元100年.常见的错误是有人把起始年当作是公元零年,这显然不符合逻辑和我们的习惯,因为在一般情况下,序数的计算是从“1”开始的,而不是从“0”开始的。而正是这个理解上的错误,所以才导致了世纪末尾年为公元99年的错误认识,这也是错把1999年当作是二十世纪末尾年,错把2000年当作是二十一世纪起始年的原因.因为公元计数是序数,所以应该从“1”开始,21世纪的第一年是2001年.

趣味数学故事大全

趣味数学故事大全 路遇哪吒:八戒正往前走,忽听背后有人叫他:“老猪,好自在啊!”八戒回头一看,是托塔天王的三太子哪吒。 八戒摇晃着脑袋说:“这不是那个三头六臂的妖精吗?” 哪吒听八戒叫他妖精,勃然大怒,大喝一声:“变!”随即变做三头六臂,6只手分别拿着6件兵器:斩妖剑、砍妖刀、缚妖索、降妖杵、绣球儿、火轮儿,恶狠狠地朝八戒打来。 八戒不敢怠慢,舞动钉耙迎了上去,两人“叮叮当当”地打了起来。过了一阵子哪吒见没占到便宜,又喊了一声:“换!”6只手拿着的兵器立刻交换了一下位置。就这样哪吒不断变换着兵器的拿法,可把八戒打晕了。 八戒连连摆手说:“不打啦,不打啦,我说你这6只手一共有多少种不同的拿法?” “720种!”哪吒神气活现。 “吹牛!”八戒把大嘴一撇说,“有个二三十种我还信,720种?你别骗我啦!” 哪吒让5只手依次拿着斩妖剑、砍妖刀、缚妖索、降妖杵、绣球儿,对八戒说:“你看,我5只手拿的兵器固定不变,这时我第6只手只有拿火轮儿这一种拿法。” 八戒点点头说:“嗯,不错,就一种拿法。” 哪吒又让4只手依次拿着斩妖剑、砍妖刀、缚妖索、降妖杵,这时第5、6只手可以轮换拿绣球儿、火轮儿,共有两种拿法。 哪吒再让3只手依次拿着斩妖剑、砍妖刀、缚妖索,而另3只手变换出以下6种拿法: 降妖杵、绣球儿、火轮儿; 降妖杵、火轮儿、绣球儿; 绣球儿、降妖杵、火轮儿; 绣球儿、火轮儿、降妖杵; 火轮儿、绣球儿、降妖杵; 火轮儿、降妖杵、绣球儿。

八戒摸摸脑袋说:“这要是6只手都随便拿可怎么个排法呀?还不排晕喽!” 哪吒笑骂着:“真是个呆子!你观察一下下面的3个数:1=1,2=1×2,6=1×2×3。由此推想:如果固定两只手,而剩下的4只手随意拿,可有1×2×3×4×=24种拿法。而6只手都随意拿呢?有1×2×3×4×5×6=720种不同拿法。” 八戒向哪吒一拱手:“你的变化真多,我服了。” 大约1500年前,欧洲的数学家们是不知道用“0”的。他们使用罗马数字。罗马数字是用几个表示数的符号,按照一定规则,把它们组合起来表示不同的数目。在这种数字的运用里,不需要“0”这个数字。 而在当时,罗马帝国有一位学者从印度记数法里发现了“0”这个符号。他发现,有了“0”,进行数学运算方便极了,他非常高兴,还把印度人使用“0”的方法向大家做了介绍。过了一段时间,这件事被当时的罗马教皇知道了。当时是欧洲的中世纪,教会的势力非常大,罗马教皇的权利更是远远超过皇帝。教皇非常恼怒,他斥责说,神圣的数是上帝创造的,在上帝创造的数里没有“0”这个怪物,如今谁要把它给引进来,谁就是亵渎上帝!于是,教皇就下令,把这位学者抓了起来,并对他施加了酷刑,用夹子把他的十个手指头紧紧夹注,使他两手残废,让他再也不能握笔写字。就这样,“0”被那个愚昧、残忍的罗马教皇明令禁止了。 但是,虽然“0”被禁止使用,然而罗马的数学家们还是不管禁令,在数学的研究中仍然秘密地使用“0”,仍然用“0”做出了很多数学上的贡献。后来“0”终于在欧洲被广泛使用,而罗马数字却逐渐被淘汰了。 小朋友你们可知道数学天才高斯小时候的故事呢? 高斯念小学的时候,有一次在老师教完加法后,因为老师想要休息,所以便出了一道题目要同学们算算看,题目是: 1+2+3+ ..... +97+98+99+100 = ? 老师心里正想,这下子小朋友一定要算到下课了吧!正要借口出去时,却被高斯叫住了!!原来呀,高斯已经算出来了,小朋友你可知道他是如何算的吗? 高斯告诉大家他是如何算出的:把 1加至 100 与 100 加至 1 排成两排相加,也就是说:1+2+3+4+ ..... +96+97+98+99+100 100+99+98+97+96+ ..... +4+3+2+1 =101+101+101+ ..... +101+101+101+101 共有一百个101相加,但算式重复了两次,所以把10100 除以 2便得到答案等于 <5050> 从此以后高斯小学的学习过程早已经超越了其它的同学,也因此奠定了他以后的数学基础,更让他成为——数学天才! 在日常生活中,数学无处不在,比如说:买菜、卖菜、算多少钱……

小学生数学故事:两个统计小故事

小学生数学故事:两个统计小故事 死记硬背是一种传统的教学方式,在我国有悠久的历史。但随着素质教育的开展,死记硬背被作为一种僵化的、阻碍学生能力发展的教学方式,渐渐为人们所摒弃;而另一方面,老师们又为提高学生的语文素养煞费苦心。其实,只要应用得当,“死记硬背”与提高学生素质并不矛盾。相反,它恰是提高学生语文水平的重要前提和基础。两个统计小故事 这两个故事都发生在二战期间,并且都是盟军方面机智的统计学家,数学在二战期间充当了十分重要的角色,今天说的是统计。 第一个故事发生在英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期地对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。 为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是求助于统计学家。统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。工作完成了,然后统计学家很肯定地说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。 “教书先生”恐怕是市井百姓最为熟悉的一种称呼,从最初的

门馆、私塾到晚清的学堂,“教书先生”那一行当怎么说也算是让国人景仰甚或敬畏的一种社会职业。只是更早的“先生”概念并非源于教书,最初出现的“先生”一词也并非有传授知识那般的含义。《孟子》中的“先生何为出此言也?”;《论语》中的“有酒食,先生馔”;《国策》中的“先生坐,何至于此?”等等,均指“先生”为父兄或有学问、有德行的长辈。其实《国策》中本身就有“先生长者,有德之称”的说法。可见“先生”之原意非真正的“教师”之意,倒是与当今“先生”的称呼更接近。看来,“先生”之本源含义在于礼貌和尊称,并非具学问者的专称。称“老师”为“先生”的记载,首见于《礼记?曲礼》,有“从于先生,不越礼而与人言”,其中之“先生”意为“年长、资深之传授知识者”,与教师、老师之意基本一致。 单靠“死”记还不行,还得“活”用,姑且称之为“先死后活”吧。让学生把一周看到或听到的新鲜事记下来,摒弃那些假话套话 空话,写出自己的真情实感,篇幅可长可短,并要求运用积累的成语、名言警句等,定期检查点评,选择优秀篇目在班里朗读或展出。这样,即巩固了所学的材料,又锻炼了学生的写作能力,同时还培养了学生的观察能力、思维能力等等,达到“一石多鸟”的效果。第二个故事与德国坦克有关。我们知道德国的坦克战在二战前期占了很多便宜,直到后来,苏联的坦克才能和德国坦克一拼高下,坦克数量作为德军的主要作战力量的数据是盟军非常希望获得的情报,有很多盟军特工的任务

统计学案例

统计学案例 总量指标与相对指标 案例1:指出下面得统计分析报告摘要错在哪里?并改正: 1、本厂按计划规定,第一季度得单位产品成本应比去年同期降低10%,实际执行结果就是,单位产品成本较去年同期降低8%,仅完成产品成本计划得80%(即8%÷10%=80%)。 2、本厂得劳动生产率(按全部职工计算)计划在去年得基础上提高8%,计划执行结果仅提高4%,劳动生产率得计划任务仅实现一半(即4%÷8%=50%)。 3、该车间今年1月份生产老产品得同时,新产品首次小批投产,出现了2件废品(按计算,车间废品率为1、2%)。2月份老产品下马,新产品大批投产,全部制品1000件,其中废品8件,废品量就是1月份得4倍,因此产品质量下降了。 4、在组织生产中,本厂先进小组向另一组提出高产优质得挑战竞赛。本月先进小组得产量 超过了另一小组得1倍,但就是在两组废品总量中该组却占了60%,所以在产品质量方面,先进小组明显地落后了。 案例11 案例2:根据下表资料分析哪个企业对社会贡献更大? 平均指标与变异指标 案例3、以组平均数补充说明总平均数 根据上表资料分析哪个村成绩更好?为什么? 案例4:某单位有10个人,其中1人月工资为10万元,9人每人月工资为1000元。该单位职工月平均工资为10900元。即:

)(1090010 9 1000100000元=?+ 您认为这个平均数有代表性吗?如果缺乏代表性应如何改正? 案例5:以下就是各单位统计分析报告得摘录 1、 本局所属30个工厂,本月完成生产计划得情况就是不一致得。完成计划90%得有3个, 完成96%得有5个,完成102%得有10个,完成110%得有8个,完成120%得有4个。平均全局生产计划完成程度为104、33%。 即: 30 4 %1208%11010%1025%963%90?+?+?+?+?=104、33% 2、 本厂开展增产节约运动以后,产品成本月月下降,取得显著得成绩,根据财务部门得报 告,1 月份开支总成本15000元,平均单位产品成本为15元,2月份开支总成本25000元,平均单位产品成本下降为10元,3月份开支总成本45000元,平均单位产品成本仅 8元。这样,第一季度平均单位产品成本只为11元( 。 元)113 8 1015=++ 以上报告所用平均指标就是否恰当?如果不恰当应如何改正? 案例6、变异指标与平均指标得结合运用 案例7、录取中有无歧视? 某高校只有两个系---------财经系(文科)与工程系(理科)。该校报考及录取得总体情况如表2、1所示 如果我们只瞧该校男女生录取得比率,即男生为3500/8000=44%,女生为2000/8000=33%。这时我们不免会问,就是男同学得成绩比女同学好,还就是在录取中存在着性别得歧视? 继续收集数据并得到两个系各自录取得男女生数据,如表2、2所示。 表2、2两个系得报考及录取情况 有了各系得录取数据,不难瞧到工程系录取得人数比较多,男女生录取得比率都就是

浅析统计学的起源

浅析统计学的起源 摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源 引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。 任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。 在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故

其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。 古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。 在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史 应该说在我们给出的这些例子中,古人所使用的推断方法在形式上是属于推断统计学的,但这些方法没有给出有关推断结果的不确

生活中的统计学小例子

生活中的统计学小例子 1、鞋子的尺码,因为成年女子鞋码以37为多数,所以无论生产与配货时,都要多一些。 2、某区域里人的工资与消费水平有关,因为这个区域以3500元/月的人数最多,所以消费水平就要以他们为主。 3、卫生间台面与身高有关,因为单位里男子的身高以172cm为最多,人数占85%,所以台面高度设计就要以他们的身高为参考。 4、某学校某班开联欢会,买水果的数量与同学们的口味有关,因为大家都喜欢吃香蕉,所以就要多买点。 5、菜摊上买菜不许挑,价格与人们的接受心理有关,因为每十个西红柿中有二个烂的是人们的心理接受极限,所以搭配时就不能超过这一比例。 6、买车险与车出险概率有关,因为车辆的刮碰情况出现的多,所以车损险就必须买。 7、碰运气与中奖有关,因为中奖是一个小概率事件,所以我们不能寄希望于中奖来改变自己的生活。

8、人气与点击率有关,因为写网络小说的点击率要达到1000以上,才能成功,所以选一家大的阅读网络就很重要。 9、打字时,因为左手使用频率要比右手高,所以打字的速度往往决定于左手。 10、因为生活中不如意事常十居八九,所以乐观就很重要,常体会那如意之一二,忘了那十之八九,幸福就会不期而至。 篇二 由于战争,德国有一个时期物资特别紧缺,对面包实行配给制:政府把面粉发给指定的面包房,面包师傅烤好了面包再发给居民。有一个统计学家,怀疑他所在区域的面包师傅私扣面粉,于是就天天称自己的面包。几个月以后,他去找面包师傅,说:“政府规定配给的面包是400克,因为模具和其他因素,你做的面包可能是398、399克,也可能是401、402克,但是按照统计学的正态分布原理,这么多天的面包重量平均应该等于400克,可是你给我的面包平均重量是398克。我有理由怀疑是你使用较小的模具,私吞了面粉。”面包师傅承认确实私吞了面粉,并再三道歉保证马上更换正常的模具。又过了几个月,统计学家又去找这个面包师傅,说:“虽然这几个月你给我的面包都在400克以

数学趣味小故事20字

数学趣味小故事20字 数学家同女朋友在公园漫步。女朋友问他:"我满脸雀斑,你真的不介意?" 数学家温柔地回答:"绝对不!我生来最爱跟小数点打交道。" ------------------------ 爱的圆圈 一对青年男女坐在沙滩上。男青年在地上划个圆圈说道:"我对你的爱,就像这 圆圈一样,永远没有终点。" 女青年也用手指在地上划个圆,然后说:"我对你的爱,永远没有起点"。 ------------------------ 抽象 我的朋友的一个朋友一次在餐馆里喝多了几杯。营业时间已经过去快一个钟头了。 服务员来提醒能够走人了。当时,那位大侠说了一句很震动人的话。 他是这么说的。"你别惹我,不然我一拳把你打得很抽象。" ------------------------ 消防 一天,数学家觉得自己已受够了数学,于是他跑到消防队去宣布他想当消防员。消防队长说:"您看上去不错,不过我得先给您一个测试。" 消防队长带数学家到消防队后院小巷,巷子里有一个货栈,一只消防栓和一卷软管。消防队长问:"假设货栈起火,您怎么办?"数学家回答:"我把消防栓接到软管上,打开水龙,把火浇灭。"

消防队长说:"完全准确!最后一个问题:假设您走进小巷,而货栈没有起火,您怎么办?"数学家疑惑地思索了半天,终于答道:"我就把货栈点着。" 消防队长大叫起来:"什么?太可怕了!您为什么要把货栈点着?" 数学家回答:"这样我就把问题化简为一个我已经解决过的问题了。" ------------------------ 数学家的幽默 一名统计学家遇到一位数学家,统计学家调侃数学家说道: 你们不是说若X=Y且Y=Z,则X=Z吗!那么想必你若是喜欢一个女孩,那么那个女孩喜欢的男生你也会喜欢罗!?" 数学家想了一下反问道: 那么你把左手放到一锅一百度的开水中,右手放到一锅零度的冰水里想来也没事吧!因为它们平均不过是五十度而已!" ------------------------ 测谎器 爸爸有一个测谎器,他问儿子:"你今天数学成绩如何呢?" 儿子答道:"90分。"测谎器响了。 儿子又改说:"70分。"测谎器还是响了。 爸爸很生气地叫道:"我以前都是90分以上。"这时,测谎器没有响却翻倒了。 ------------------------ 关心 教授是个和善而幽默的老头,班上有个高大强壮的体育生。每次上课当教授的声

统计学不得不说的二三事

统计学不得不说的二三事 毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI 杂志上,乱用统计学的现象多如牛毛。还有很多医疗同行,对于统计甚为迷恋,能统计的也统计,不能统计创造条件也要统计,看见P小于0.05比亲爹还亲爹。话说,统计是门很有神奇的学科,在讲之前我又要开始讲几个冷笑话,看懂了的可以举手。 话说:你知道吗,这个世界上绝大多数人拥有的腿的数量高于平均值?(第一遍没有看懂的小伙伴可以去面壁) 再讲一个:你知道一个普通的民众有多笨吗?世界上一半的人都比他更聪明。(其实这是不对的,世界上一多半的人都比他更聪明。因为人类的智能有上限,愚蠢却没有下限,所以不是一个完美的正态分布。) 不过瘾,再讲一个:曼德勃罗有一次说,他出生在波兰,但在法国上的学,所以平均而言他是个德国人。(所以,我出生在广东,但在东北上过学,所以平均而言我是个湖北人……) 好冷好冷,我们还是来讲点正事,分享几则统计小故事。1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B的参考范围上限作为诊断界值,

得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A 和B的诊断价值。文章的结论到底是想说明A优秀还是B 优秀呢?Reject!这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A 的,其理由就是因为B的曲线下面积大于A。路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,

统计学实训资料例子

关于大学生上网情况的调查报告 调查过程 为了了解现代大学生的上网情况,本人策划并在全校针对大学生上网情况进行了调查。调查时间是从6月21号到6月25号。21号上午制定了调查方案, 21号下午将调查需要的表格进行打印,由于制作样本框需要了解有多少寝室,所以我到生活老师那对寝室进行了了解。最后制作出样本框并抽出了25个寝室进行调查。依照策划我22、23号分别对抽到的寝室进行了调查,并对资料进行了整理。24号回到教室对调查的资料涉及的数据进行了计算。25号写出本次调查的报告。 成果展示及分析 通过这次调查我了解了农校大一、大二在校大学的上网情况。并得到了一些相关数据。数据如下: 上网花费/月(元)(一) 由以上数据可得: 平均数X=46.9 标准差=19.96 平均误差=1.44 极限误差=2.88 平均数区间44.02

平均数X=704 标准差=179 平均误差=12.88 极限误差=25.76 平均数区间678.24

几则很有趣的医学统计学故事

几则很有趣的医学统计学故事 医学统计学是一门很奇妙的科学。要说它简单吧,其实也挺简单的,常见的统计方法也就十余种,在教科书上都能找到,只要熟练掌握了,虽不敢夸下海口说可以“以秋风扫落叶的气概横扫四海之内的杂志”,但足以轻车熟路地应付99%的科学研究。要说它复杂吧,也挺复杂的,毫不夸张地说,绝大部分国内期刊,甚至在很多低分SCI杂志上,乱用统计学的现象多如牛毛。 很多同行在学习医学统计学时,都在抱怨自己很难走出“一学就会,一会就用,一用就错,一错就懵”的怪圈。究其原因,主要是部分同行学习医学统计学时都抱着一副“依葫芦画瓢”的态度,试图“套用统计学方法”来解决自己面临的问题,而不去仔细思考统计学方法的来龙去脉。本文拟谈几则与医学统计学相关的故事,希望能帮助大家从宏观上正确认识医学统计学这门科学。 1、两个指标诊断疾病的问题 路人甲做了一个研究,旨在比较两个指标(A和B)对肝癌的诊断价值。路人甲以A和B 的参考范围上限作为诊断界值,得出了A和B在该界值下对应的诊断敏感性和特异性。结果表明,A的诊断敏感性为0.80,特异性为0.90;B的诊断敏感性为0.85,特异性为0.87。路人甲很快撰写论文报道了自己的研究成果,指出B诊断肝癌的敏感性高于A,而特异性低于A。 路人乙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:就敏感性而言,B高于A;就特异性而言,A高于B。诊断敏感性和特异性与所采用的界值密切相关,作者得出的敏感性和特异性仅仅代表了一个诊断界点下面的诊断效能,无法从全局上反映A和B的诊断价值。文章的结论到底是想说明A优秀还是B优秀呢?Reject! 这个故事说明:统计指标选错了,统计出来的东西往往难以“自圆其说”。 稿件被退了,路人甲有些许郁闷。经过认真学习科研设计与统计学知识后,路人甲终于明白了一个问题:两个指标诊断性能的比较是不能比较敏感性和特异性的,而应该比较ROC的曲线下面积,因为曲线下面积才是衡量整体诊断效率的最佳指标。路人甲很快绘制了ROC 曲线,统计结果表明,A的曲线下面积为0.80,B的曲线下面积为0.82。路人甲欣喜若狂,赶紧动笔写论文,并且理直气壮地给文章定了一个结论:B的诊断效率是优于A的,其理由就是因为B的曲线下面积大于A。 路人丙是这篇文章的审稿人,当他看见这个结论后,脸色铁青,毫不犹豫地在审稿意见中写道:从表面上看,B的曲线下面积高于A,但是导致这种差异的原因有两种,一种是抽样误差,一种是试验效应,即B确实是高于A的。你怎么能确定这不是抽样误差呢?在统计学上,要确定0.82是否高于0.80,就一定要经过统计学检验的。Reject! 这个故事说明:在医学科研中,没有经过统计学检验的结论多半是不科学的。

统计学的故事

统计学的故事 纪宏袁卫文 2004年1月

第一回人类发现①了统计统计改变了世界若想了解上帝在想什么,我们就必须学统计,因为统计学就是在量测他的旨意。 ——南丁格尔 列位,一般故事或小说的开头总是写的比较虚,没有什么干货,只是交代一些背景。平均说来,到了第三回主要人物才出现,到了第五回矛盾冲突才展开。本文也决不敢例外。 大千世界,芸芸众生,悠悠上下五千年,坐地日行八万里。这个世界所在的宇宙真奇妙,时间上没头没尾,空间上没边没沿。世界上的万物真复杂,自然界和人类社会好像都受到某种力量和规律的支配,可怜的是我们还无法确切地认识、把握这些力量和规律,偶然事件常常捉弄我们的命运。这个世界上的人们真倔,非要把这个很难描述的世界,包括客观世界和我们的主观世界整明白不可,大到宇宙空间,小到基因和纳米,探索者前仆后继,没完没了。 任何值得一提的文明都探索过真理,冥思苦想的人们尽管不能完全确切的,但总是试图解释复杂多变的自然现象和人类自身。 在很早很早以前,人们认为自然是神秘、无序,甚至是恐怖的。而人类自身也有很多谜题,例如,人类为何定居在这个地球上,人生的目的是什么,人类的终极归宿何在,等等。这些问题的答案一般是由宗教领袖给出的。 过了很多很多年,智者、思想家和勇敢的科学先驱们,或统称为人民,逐渐摒弃了上帝按其意愿创造了人和物质世界的信仰。他们发现人类有智慧,用思维,佐以观察或实验,就能够发现各种谜一样的自然活动和人们自己。他们用思维与似乎瞬息万变的现象抗争,并将理性之光洒于其上。先驱的态度是理性的、批判的和反宗教的。由于他们的态度较好,终于得出了这样一些结论:自然和人类社会是有序的,按完美的设计而恒定地运行着,从星体的运动到树叶的颤动,从人们的行为到人们的观念,所有感官能感知的东西都能用一种精确、和谐而理想的 ①我们实在想不通,用“发现”和“发明”哪个词更符合实际。

统计学小故事(一)素材尕多烈

人教版小学数学第六册第三单元 《复式统计表》课后连接1 统计学小故事(一) 养猴人心中暗笑:“朝四暮三和朝三暮四,不是都等于七吗?这畜牲就是不如人聪明。”猴子们窃窃私语:“朝四暮三和朝三暮四,虽然吃到肚子里都等于七,但朝四暮三更符合早吃饱、晚吃少的科学道理,不信去问问费雪。人虽然比我们聪明,但没学过统计的人,智商还真不如我们高”。 ——新编《齐物论》 统计学小故事(二) 这两个故事都发生在二战期间,并且都是盟军方面机智的统计学家,数学在二战期间充当了十分重要的角色,今天说的是统计。 第一个故事发生在英国,二战前期德国势头很猛,英国从敦刻尔克撤回到本岛,德国每天不定期地对英国狂轰乱炸,后来英国空军发展起来,双方空战不断。

为了能够提高飞机的防护能力,英国的飞机设计师们决定给飞机增加护甲,但是设计师们并不清楚应该在什么地方增加护甲,于是求助于统计学家。统计学家将每架中弹之后仍然安全返航的飞机的中弹部位描绘在一张图上,然后将所有中弹飞机的图都叠放在一起,这样就形成了浓密不同的弹孔分布。工作完成了,然后统计学家很肯定地说没有弹孔的地方就是应该增加护甲的地方,因为这个部位中弹的飞机都没能幸免于难。 第二个故事与德国坦克有关。我们知道德国的坦克战在二战前期占了很多便宜,直到后来,苏联的坦克才能和德国坦克一拼高下,坦克数量作为德军的主要作战力量的数据是盟军非常希望获得的情报,有很多盟军特工的任务就是窃取德军坦克总量情报。然而根据战后所获得的数据,真正可靠的情报不是来源于盟军特工,而是统计学家。 统计学家做了什么事情呢?这和德军制造坦克的惯例有关,德军坦克在出厂之后按生产的先后顺序编号,1,2,…,N,这是一个十分古板的传统,正是因为这个传统,德军送给了盟军统计学家需要的数据。盟军在战争中缴获了德军的一些坦克并且获取了这些坦克的编号,现在统计学家需要在这些编号的基础上估计N,也就是德军的坦克总量,而这通过一定的统计工具就可以实现。

统计学的魅力

统计学的魅力 ——2013-2014学年暑期《女士品茶》读书心得体会放假期间,阅读了老师推荐的美国统计学家萨尔斯伯格所写的《女士品茶》这本书,一开始看到书名时,我以为这是一本与女性或者茶有关的书籍,正纳闷为什么这样一本书会和统计学有关时,我开始阅读如此一本“统计学”书籍,但是,当开始慢慢展开阅读后,我发现这是在英国剑桥一个夏日的午后,一群人坐在一起品茶,而其中一位女士提出把茶加进奶里,或把奶加进茶里,不同的做法,会使茶的味道品起来不同。这样的“胡言乱语”让一个身材矮小、戴着厚眼镜、下巴上蓄着的短尖髯开始变灰的先生即休·史密斯起了兴趣,并设计了一系列的实验来验证这一说法。而实验的结果是那位女士竟然正确地分辨出了每一杯茶!就是这样的一个小故事,带领我们一起走进了统计学的世界。 《女士品茶》一书不像我想象中那样枯燥繁琐,让人提不起兴趣,相反的,它的书名新颖独到,内容新意盎然。正如萨尔斯伯格所说:“我所选择贯穿20世纪统计学复杂理论的主线是与别人不同的。我希望读了本书后能有所启发,去进一步了解统计革命的内涵。”。通过一些趣味盎然的统计发展故事,这本书的确给那些不懂或只是略懂数学的人带去了对统计学的兴趣。一改过去统计学只有越难才越有价值的观念。作为一本讲统计学的书,平均数、标准差、估计值、概率、正态概率分布随机变量等等一系列的概念和术语,自是绵亘不绝,但是不同于其他书的是,这些概念和术语的背后,是一个个统计大师鲜活的形象、是一段段他们探索创新,历尽坎坷的人生故事。故事中穿插着大师们睿智的珍言、友谊的情怀、幽默的细节、个性的遭际,像一个个人生的小舞台剧,富含着哲理和知识。让人感觉到,大师之所以为大师是因为即使是生活的问题,在他们眼中也是有研究的意义的。 例如“可爱的戈赛特先生”中,戈赛特先生给我留下了深刻的映象。戈塞特先生是爱尔兰都柏林吉尼斯酿造公司的负责大伦敦区业务的主管,在进入公司之初他是牛津大学的新秀,拥有化学和数学两个学位,当时公司雇佣他是因为他的化学专长,在该公司看来,作为一个酿酒企业,数学对于他们来说是没有作用的,但是戈塞特对公司做出的第一个贡献就是以数学家的身份完成的。因为酿酒是需要进行麦芽浆发酵的,在发酵的时候就需要测量用酵母的量,这时就需要用到数

对於统计学的看法与小故事范例

對於統計學的看法與小故事範例 班級:閩廣3 學號:A4522594 姓名:林敏 指導老師:陶聖

目錄 1、我對於統計學的初步認識?????????? 3 2、小故事之一???????????????? 4 3、小故事之二???????????????? 6 4、小故事之三???????????????? 7 5、小故事之四???????????????? 8 6、小故事之五???????????????? 9 7、學習心得????????????????? 11

我對於統計學的初步認識 統計學是在資料分析的基礎上,自17世紀中葉產生並逐步發展起來的一門學科。它是研究如何測定、收集、整理、歸納和分析反映資料資料,以便給出正確訊息的科學。谷歌給出的解釋太書面太拗口太籠統不好記憶與理解。在我看來,統計學如字面所說,是一門有關“統計”的學科,是一種讓問題更快找到答案的輔助方法,運用的好可以輕鬆的事半功倍。當然這只是我初步的淺薄認識。 目前統計廣泛地應用在各門學科,從自然科學、社會科學到人文學科,甚至被用來工商業及政府的情報決策之上。並且與資訊、計算等領域密切結合,是資料科學(Data Science)中的重要主軸之一。而關於統計學的歷史,我從網絡資料上了解到統計手法最早可以追溯至公元前5世紀。最早的統計著作來自公元9世紀的《密碼破譯》,由阿拉伯人肯迪編著。在書中,肯迪詳細記錄了如何使用統計資料和頻率分析進行密碼破譯。根據沙烏地阿拉伯工程師易卜拉欣·阿凱笛(Ibrahim Al-Kadi)的說法,統計學和密碼學分析便如此一同誕生了。 統計方法則包括實驗法、觀察法和實驗觀察法。統計研究中的共同目標是分析因果關係,具體來講就是從預估資料變化中得出結論,或是研究自變量與因變量之間的關係。方法概括起來很簡單,運用起來卻很靈活,書本知識的更好掌握需要更多的實踐。老師給我們上課理論知識會貫徹在實踐中來說,讓我們受益匪淺。 統計學的範疇和延伸學科都很廣,在這裏就不一一舉例了。條形統計圖是最容易使用、最容易理解的圖表了,它可以用手或電腦繪製而成。[13]不巧的是,許多人忽視其中的偏差、誤差,因為他們不留意。因此,雖然圖表品質低劣,但人們常常願意去相信。統計資料時常被濫用,對結果的解釋時常有利於演講者。[10]對統計的懷疑與誤導可被稱為:「世上有三種謊言:謊言,該死的謊言,統計數字」。許多對統計的濫用可能出於無意,也可能出於故意。老師在上課時特意強調了這個問題,統計學運用的好,得出的研究成果讓人受益匪淺;但倘若有心引誘,亂出題,採取不嚴謹的態度,樣本的可靠性可以被偏差破壞,得出的結果也將會南轅北轍。 统计学是一个枯燥的专业,我们要和大量的数据打交道,堆积如山的各式表格看了都让人害怕,更别说还要去整理和分析这一堆堆冷冰冰的数字了,不过,统计学又是一个有趣的专业,毕竟它是和生活紧密联系在一起的。

浅析统计学的起源

浅析统计学的起源

浅析统计学的起源 摘要从逻辑和历史两个角度对推断统计学的起源进行了尝试性的索关键词:统计史;起源 引言:史学研究历来受思想家们的重视,说史学研究应成为任何学科永恒的研究主题丝毫也不过分,因为早在两千多年前,中国古代伟大的思想家孔子,在论语中就曾留下了温故而知新的至理名言,而16世纪著名的英国哲学家培根也曾说过,读史使人明智。如果套用统计学里的一句专业术语,那就是历史具有遍历性。。 任何历史研究都必须首先限定其研究的时间范畴,对于推断统计史而言,一个首要问题就是:推断统计学的历史应该从哪里开始?为说明这个问题,我们首先探究一下统计学是什么。按一般统计学教材或百科全书上的定义:统计学是一门关于如何有效地收集、整理、表述、分析和解释数据的学科。其中的数据即为统计学的研究对象,因此统计学也被认为是一门从数据中获得有用信息的数据分析学科。需要强调的是,统计学研究的数据一定要具有随机性,也就是说可以通过某种概率分布规律来描述数据的分布状态,这一点也是统计学有别于其他处理数据学科的最重要特征。 在上述统计学的定义下,统计学又可划分为描述统计与推断统计。描述统计是一种通过图形、列表、数量化度量等方法描述样本数据基本特征的统计方法,其作用是对样本数据进行初步精炼,虽然在很多情况下样本数据的特征可用来推断总体的特征,但这需要给出推断

的误差精度,由于描述统计中不包含任何关于误差精度的陈述,故其结论也就仅局限于样本数据,与总体无关,从而也不存在推断问题。不过统计学的终极目的是希望通过样本来获取总体信息,故推断统计,即利用样本信息以及其它信息,获取有关样本所处总体信息的推断理论,就成为描述统计进一步发展的必然产物。下面我们引述有关文献给出的几个相当久远的例子加以说明。 古印度部落国王图潘纳为了炫耀自己的数学能力,他告诉自己的马车夫纳拉一个被放逐的国王,说他猜测出了一颗巨大果树两个枝干上的树叶与果实的数量,纳拉经过一夜的计算,吃惊地发现图潘纳的猜测非常接近实际的真实数量。这个故事来源于印度史诗摩诃婆罗多它最迟完成于公元400年。相当多的现代学者们认为,图潘纳是通过计算某一个典型小枝上树叶与果实的数量后,将其乘以整个果树上小枝的个数得到他的猜测的。 在伯罗奔尼撒战争中,古希腊的雅典人曾采取过架云梯突破敌人城墙的方法。由于建造适当高度的云梯就必须知道敌方城墙的高度,为此雅典人采取了如下方法来估算城墙高度:首先派一些士兵同时数前方敌城裸露部分城墙所砌砖的层数。虽然有一部分士兵的计数会发生错误,但大多数的计数结果应该是正确的,特别是出现最频繁的层数与那部分无法看见的城墙的层数会足够接近。然后通过猜测出来的城砖厚度乘以最频繁的层数估算出城墙的高度。这个故事来源于古希腊历史学家修西得底斯所著的伯罗奔尼撒战争史 应该说在我们给出的这些例子中,古人所使用的推断方法在形

数学故事之--生活中的统计学陷阱

生活中的统计学陷阱 在你听到一种统计关系时,可得慎重一些,千万不要轻率地对事件发生的因果关系做出判定,因为事情并不那么简单。 让我们来看几个不可轻率做出结论的例子。 ①统计资料表明,大多数汽车事故出在中等速度的行驶中,极少的事故是出在大于150公里/小时的行驶速度上。这是否就意味着高速行驶比较安全呢? 正确答案:绝不是这样。统计关系往往不能表明因果关系。由于多数人是以中等速度开车,所以多数事故是出在中等速度的行驶中。 ②有一个调查研究说脚大孩子的拼音比脚小的孩子好。这是否是说一个人脚的大小是他拼音能力的度量? 正确答案:不是的。这个研究对象是一群年龄不等的孩子。它的结果实际上是因为年龄较大的孩子脚大些,他们当然比年龄小的孩子拼得好些。 ③常常听说,汽车事故多数发生在离家不远的地方,这是否就意味着在离家很远的公路上行车要比在城里安全些呢? 正确答案:不是,统计只不过反映了人们往接是在离家不远的地方开车,而很少在远处的公路上开车。 ④有一项研究表明某一个国家的人民,喝牛奶和死于癌症的比例都很高。这是否说明是牛奶引起癌症呢? 正确答案:不对!原因是这个国家老年人的比例也很高。由于癌

症通常是年龄大的人易得,正是这个因素提高了这个国家癌症死亡者的比例。 上述例子表明,统计学论述在涉及因果关系时很容易造成误读。现代的广告,尤其是很多电视的商业广告正是以这种统计误读为根基的。 很多人以为自己是数学天才,直到遇见了极限 反比例函数是大家接触最早和最熟悉的函数之一,它的函数解析式是y=k/x (k为常数,k≠0)。我们利用反比例函数的解析式,就可以画出它的图像,如下图所示:

统计学中几个典型案例分析

第28卷第3期20199 河南教育学院学报!自然科学版) Journal of Henan Institute of Education(Natural Science Edition) Vol.28No.3 Sep.2019 dot:10.3969/j.issn.1007-0834.2019.03.011 统计学中几个典型案例分析 刘倩 (西安电子科技大学数学与统计学院,陕西西安710071) 摘要:在统计概率课程的教学中,转变教师的教育观念、更新教学内容已经成为当前提高课程教学质量的关键.在教学中教师应该注重理论知识与实际结合,通过引入大量的生动案例,培养学生统计思维的能力,并创造实践环境、夯实学生的基础知识,激发学生的学习兴趣? 关键词:统计思—;案例教学;统计建模 中图分类号:G642.0;0212,1文献标志码:A文章编号:1007-0834(2019)03-0049-05 0引言 统计是研究如何有效地收集、整理和分析带有随机性的数据以及由数据分析结果做出决策,为人们制定决策提供依据.日常生活中随处可见随机现象,概率就是研究随机现象统计规律的学科,它为人们认识客观世界提供了重要的思维模式和解决问题的方法,同时也为统计学的发展提供了坚实的理论基础.正如英国著名社会改革家、统计学家乔治威尔斯所说:“统计思维总有一天会像读和写一样成为一个有效率公民的必备能力.”然而,统计与概率知识被学生难以驾驭,这主要是由以下3个方面造成的. 1)传统的统计与概率教学体系是把统计与概率作为应用数学的一个分支,注重讲授统计、概率的基本原理及计算方法,忽视学生对方法产生背景和思想的理解,因此,传统的课堂教学模式人为地割裂了数学理论、教学方法与现实世界的联系,最终使得学生不能灵活运用所学知识分析解决具体问题. 2)由于统计与概率的内容从小学到初、高中均有涉及,学生从经历简单的数据统计过程,即从学习收集、整理和描述数据的方法到逐渐体会到抽样的必要性,从能够根据数据分析的结果做出简单的判断与预测到掌握用样本估计总体的思想,并进一步学习描述数据的方法和体会概率的意义.学生在教师引导下,已经逐步从“经历”过渡到“从事”某些简单统计活动.然而,已有的一些先入为主的概念和方法使得学生误以为大学阶段的统计知识不过如此,思想上不重视.但事实上,大学阶段除了要求学生掌握统计推断的一般理论和方法,厘清统计学中主要概念和方法产生的直观背景和实际意义,引导学生用数学的语言描述和研究随机现象外,更注重培养学生对数据的理解和分析能力,使其具备一定的综合应用所学知识分析和解决一些实际问题的能力,并为后续课程奠定基础. 3)教学过程中多以概率论为教学重点,而真正在实际中有重要应用价值的数理统计部分往往被轻视,使得学生在学完整门课程后仅仅记住了几个抽象的分布和定理,把统计学片面地理解为简单的加减乘除计算公式,甚至连最基本的数据处理分析方法和软件都不会应用. 随着西方统计学教学方法的逐步渗透,我国现代统计学教学体系也在不断进行改革,在教学中也越来越注重统计思想的传授、统计方法的实际应用.“如何将统计思想更好地传授给学生”已成为统计学教学面临的一个难题.我们必须遵从人类思维模式的发展规律,将形象思维与逻辑思维相结合,在情感、态度与价值观层面上,注重贴近生活,注重解决实际问题.笔者认为统计教学必须通过案例进行,通过案例建立学生的统计直觉,体会统计思维与确定性思维的差异,并建议通过计算机模拟帮助学生理解统计思想和原理,从而增强学生用统计思想和方法提出问题、分析问题和解决问题的能力,而不应把统计问题简单处理成数字运算.此 收稿日期#2019-04-03 基金项目:西安电子科技大学高等教育教学改革研究项目“大学助推中学教改、吸引高考优质生源的途径探索” 作者简介:刘倩(1979―),女,陕西西安人,西安电子科技大学数学与统计学院副教授,博士,主要研究方向:数理统计.

相关主题