B王珍魏蓓蕾秦玉波 - 图文

发布时间 : 星期六 文章B王珍魏蓓蕾秦玉波 - 图文更新完毕开始阅读

双色球的秘密

摘要

针对探索双色球中奖号码的规律要求,文章建立了三个模型用以解决该类问题。在一定期数的范围内,通过对中奖数据的整理、分析,从而根据中奖数据的规律,并解决相应问题。

对于问题(1),我们运用Excel软件和Matlab软件,其主要思想是:在Excel表格中,将查找的一定期数范围的一、二等奖获奖号码导入并整理,再运用Matlab软件,依据题中所给的三种杀号技巧,依次对整理好的数据作出编程,得出杀错号的期望值依次为2.2847;1.0657;1.3065;并作出评述。由中奖号码的连号折线示意图得出二连号、三连号概率分别为52.3%和3.2%(见附录1)。

对于问题(2),我们对数据进行统计、描述和分析,其主要思想是:在奖池资金满足题意的条件下,一等奖奖金总额分为两部分。运用Excel软件通过数据的查找和计算可得出低等奖金总额和奖池金额。所以第一部分奖金总额:(投注资金总额*49%-低等奖金总额)*70%+奖池金额(5千万元),其中单注封顶为500万元,投注资金总额为2*投注数=3亿,得出低等奖金总额和奖池金额,得出第一部分奖金总额;第二部分奖金总额:加奖金额(500万元),其中单注封顶为500万元;二等奖奖金总额:(投注资金总额*49%-低等奖金总额)*30%,投注资金总额为2*投注数=3亿。运用Matlab软件,将一、二等奖单注金额数据导入并建立矩阵,整理,根据描述数组频数直方图命令(hist),绘出一、二等奖单注金额数据的频数直方图,估计图像基本符合正态分布,中由命令normplot(x)得到数据点大致在一条直线,验证出一、二等奖单注金额确实符合正态分布;再进行正态总体参数计,由命令[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha),得一等奖期望值为6.0417e+006:二等奖期望值为5.001e+005,最后对总体均值的t检验得出95%置信区间分别为: 1.0e+006 *[5.6572,6.4262]1.0e+005 *[4.4055 , 5.5948]。

对于问题(3), 我们对数据进行统计、描述和分析,其主要思想是:与问题二中求解期望与置信区间的方法相同,在Matlab软件中,通过相关命令,分析一、二等奖金单注期望奖金分布情况,在此基础上预测未来一二等奖单注期望奖金值为7.2278e+006:

对于问题(4),我们建立回归预测模型,其主要思想是:在一定期数内,通过比较奖池资金与彩民投注数数据变化示意图(见附录4),得证奖池资金的多少会影响彩民投注热情,但影响不大。利用回归预测模型,对未来奖池奖金作出预测函数,求得为y=0.4780x1+4.5457x2+9.7885x3-0.2944x4(x1、x2、x3、x4分别表示一等奖奖金、二等奖奖金、低等奖奖金、总投注数),根据预测函数求得2011年6、7月的奖池金额为722290000元,根据预测函数,计算得出奖池金额清空的概率为4%。

关键词:中奖号码;高等奖奖金额;数据统计法;单注奖金期望;置信区间;非线性回归预测模型

1.问题的重述

1.1. 背景:

“双色球”以中奖面广,头奖金额高吸引了很多彩民,是目前市场最热门的

福利彩票之一,更有彩民在近期刷新中国彩票史上单人中奖奖金额的最高纪录。与此同时,“双色球”杀号技巧也受到很多彩民的关注,其中题目中列举出的四种杀号技巧在网上广为流传。因此,分析“双色球”中奖情况也就变得非常有意义。

1.2.基本情况:

双色球玩法说明:双色球投注区分为红球号码区和蓝球号码区,红球号码范围为01~33,蓝球号码范围为01~16。双色球每期从33个红球中开出6个号码,从16个蓝球中开出1个号码作为中奖号码,顺序不限;“双色球”奖级设置分为高等奖和低等奖。 一等奖和二等奖为高等奖,三至六等奖为低等奖。高等奖采用浮动设奖,低等奖采用固定设奖。当期奖金减去当期低等奖奖金为当期高等奖奖金。双色球设奖及中奖说明——见附录 1.3.需要解决的问题:

1)分析中奖号码变化规律,对四种杀号技巧作出评述,并计算相关问题。 2)根据一、二等奖金计算方法及限定条件,求此时单注一、二等奖金的期望值和95%置信区间。

3)根据模型,分析一、二等奖金单注期望奖金分布情况,并作实证分析,从而预测未来一、二等奖金单注期望奖金。

4)根据模型,由奖池资金金额对彩民投注热情的影响;分析未来奖池资金变化;并计算奖池资金清空的概率。

2.问题的分析

由题意可知,目的是搜集并整理相关数据,建立模型,解决中奖号码、资金的期望值和概率,从而对未来奖金进行预测。问题一中,采用数据统计与分析方法。将查找的一定期数范围的一、二等奖获奖号码导入Excel中并整理,再利用Matlab软件按照题中前三种杀号技巧对其进行编程,求出杀错号的期望从而检验三种杀号技巧的正确性。再根据中奖连号图示,求解相关概率。问题二,采用数据的统计、描述和分析方法。根据题意,高等奖金总额与投注资金总额、低等奖金总额有关,通过改变Excel表中数据的四则运算及格式的调整,从而计算一等奖第一部分奖金总额为:(投注资金总额*49%-低等奖金总额)*70%+奖池金额, 其中单注封顶为500万元;计算一等奖第二部分奖金总额为:加奖金额(已知)其中单注封顶为500万元;计算二等奖奖金总额为:(投注资金总额*49%-低等奖金总额)*30%;进而求解出一、二等奖单注奖金。在求解一、二等奖单注奖金的期望和95%置信区间时,需要运用Matlab软件进行求解。第一步:先将一、二等奖单注金额数据导入程序,根据命令hist绘出频数直方图,估计图像基本符合正态分布;第二步:根据命令normplot(x),得到数据点大致在一条直线上,从而得证数据符合正态分布;第三步:对数据进行正态总体参数估计,由命令[muhat,sigmahat,muci,sigmaci]=normfit(X,alpha),得出期望值,第四步:对总体均值的t检验得出置信区间完全包括均值。问题三中,主要采用数据的统计、描述和分析方法。与问题中二求解期望与置信区间的方法相同,验证一二等奖单注奖金期望在95%的置信区间内,从而预测未来期望奖金数值仍保持在元数据的极小范围内。问题四中,在一定期数内,通过比较奖池资金与彩民投注数数据变化示意图,得出奖池资金的多少对彩民投注热情的影响。可设奖池奖金与一等奖奖金、二等奖奖金、低等奖奖金、总投注数有关,从而利用非线性回归模型,得

出相关结果。

3.模型的假设与符号说明

3.1模型的假设

①所搜集数据真实有效,具有一般性; ②“双色球”整个流程公平、公正; ③中奖号码全部给予兑现;

④奖池资金与总投注额客观有效; 3.2符号说明

X1:一等奖奖金; X2:二等奖奖金; X3:低等奖奖金; X4:总投注数;

R2:“判定系数”;

5.模型的建立与求解

5.1问题1 模型的建立

为了分析双色球中奖号码的变化规律, 并对“双色球杀号技巧”作出评述,我们随即搜集了期号从1010060至1011006共一百期的中奖号码,用Matlab软件,通过编写程序来得出方法一、二、三各自杀错号的期望来验证方法一二三是否可取。(具体程序见附录1:程序1、程序2、程序3) 对方法四由附录1图表

双色球_折线图:连号组数 统计范围:

期 至

中可分别计算出正好出现一个二连号和至少出现一个三连号的概率

模型的求解

由方法一程序,求出杀错号的期望值:p =2.2847,与题目中给的0~2个不太吻合,此方法不可行。

由方法二程序,求出杀错号的期望值:p =1.0657,在题目中给的0~2个范围内,此方法可行

由方法三程序,求出杀错号的期望值:p =1.3065,在题目中给的0~2个范围内,此方法可行。

方法四中,求得中奖号码出现二连号的概率为66.7%>50%;经统计得出现三连号的概率是3%较小,可杀去。所以此方法可行。

正好出现一个二连号的概率是52.3%;经计算得至少出现一个三连号的概率是3.2%。

5.2问题2 模型的建立

我们搜集10060至11006期的中奖相关数据集,并且按照第二题中的要求用Excel软件分别求出来各期与一等奖奖金和二等奖奖金。用数据的统计描述与分析的方法对一、二等奖奖金进行分析。步骤如下:

输入数据;

作频数直方图; 分布的正态性检验; 参数估计; 假设检验.

从而得出一、二等奖单注期望奖金和95%的置信区间。(数据来源及具体步骤见附录2)

以下我们用矩阵A和B分别表示一等奖与二等奖的奖金金额。 模型的求解

一等奖奖金:检验结果:1布尔变量h =0,表示不拒绝原假设,说明均值是合理的。

2 . 95%的置信区间为1.0e+006 *[5.6572,6.4262],它完全包含均值,

且精度很高。

3. sig=1,远超过0.5,不能拒绝原假设。

所以,可以认为一等奖的奖金金额的均值为6.0417e+006

二等奖奖金:检验结果:1布尔变量h =0,表示不拒绝原假设,说明均值是合理的。

2 . 95%的置信区间为1.0e+005 *[4.4055 , 5.5948],它完全包含均

值,且精度很高。

3. sig=0.9999,远超过0.5,不能拒绝原假设。

所以,可以认为一等奖的奖金金额的均值为5.0001e+005 5.3问题3 模型的建立

我们搜集10060至11006期的中奖相关数据集,并且按照第二题中的要求用Excel软件分别求出来各期与一等奖奖金和二等奖奖金。用数据的统计描述与分析的方法对一、二等奖奖金进行分析。步骤如下:

输入数据;

作频数直方图; 分布的正态性检验; 参数估计; 假设检验.

模型的求解

检验结果:1布尔变量h =0,表示不拒绝原假设,说明均值是合理的。

2 . 95%的置信区间为1.0e+006 *[6.8435,7.6120],它完全包含

7.2278e+006,且精度很高。

3. sig=0.9998,远超过0.5,不能拒绝原假设。

所以,可以认为一等奖的奖金金额的均值为7.2278e+006。

联系合同范文客服:xxxxx#qq.com(#替换为@)