实验二:森林更新调查
姓名:马芳芳专业班级:09级林学1班学号:20091935 一、实验目的与意义
通过实验掌握森林更新调查的基本内容和基本方法。
森林更新调查工作是同其它林业专业调查工作同时进行的,调查对象是林冠下天然更新、无立木林地中的采伐迹地和火烧迹地、宜林荒山荒地和宜林水湿地。主要目的是查清各类更新的现状,对更新的质量和数量情况掌握基本材料,并对各林型、采伐迹地、火烧迹地进行评估预测,为营林生产和营林设计提供参考依据。此外,通过森林更新调查,还可以判断更新方法的正确与否,同时为后来的林分更新提供理论依据和建议。适宜的更新方法,既是培育下一代新的质量高、生态环境好的林分的重要措施,也是降低育林成本与获得较高经济效益的重要手段。
意义在于能够及时进行森林更新,是维持和扩大森林资源的主要途径,也是调整现有森林、实现永续经营的基础,森林主伐的依据。
二、实验工具
罗盘仪、手持GPS1、工具包2个、记录板2个、标杆2个、粉笔一盒、红油漆一盒、小铲1个、围尺2个、测高器1个、皮尺30米2个、皮尺20米2个、钢卷尺2个、生长锥2个、千分尺1个、计算器2个、手提电脑1个、铅笔、笔记本4个、4K方格纸8张
三、实验人员
刘亚、刘畅、马芳芳、孙天平、刘思汝、浦梅、朱安明、赵伯国
四、实验原理:
森林更新是森林主伐以后,为了保证木材的不断再生产和防护效能的继续发挥,在其迹地上借助于自然力或人力迅速地恢复森林的过程。按更新方法,可分为伐前更新、伐后更新和伐中更新;按树种起源,可分为有性更新和无性更新;按实施方法,可分为天然更新和人工更新。及时进行森林更新,是维持和扩大森林资源的主要途径,也是调整现有森林、实现永续经营的基础,在林冠下或采伐迹地、火烧迹地、林中空地上利用人力或自然力重新形成森林的过程。及时进行森林更新,是维持和扩大森林资源的主要途径,也是调整现有森林、森林永续经营的基础,森林主伐的依据。更新方式分天然更新、人工更新和人工促进天然更新等三种类型。
天然更新,在没有人力参与下或通过一定的主伐方式,利用天然下种或伐根萌芽、地下茎萌芽、根系萌蘖等方式形成新林的过程。
人工更新,用人工植苗、直播、插条或移植地下茎等方式恢复森林的过程(见栽植造林、播种造林、分殖造林)。在雨量充沛、人力不足的地方,如中国的长江上游、西南高山、亚热带山地的某些地区,可用飞机播种更新。
人工促进天然更新采用某些单项措施以弥补天然更新过程的不足,如人工补播补植,以弥补天然种苗的分布不匀;进行部分块状或带状松土,或火烧清理,除去过厚的枯枝落叶层或茂密的草类、灌木,以改善种子发芽和幼苗幼树生长发育的条件等。
更新的实施:世界上少林国家多采用人工更新,多林国家除仍用天然更新外,不断增加人工更新的比重。中国森林更新的方针是“以人工更新为主,人工更新和天然更新相结合”,
根据森林类型特点、迹地类别、自然条件和经济条件,采用适宜的主伐方式和更新方式:皆伐迹地和火烧迹地以人工更新为主,但天然更新力强、由阳性树种组成的森林,皆伐后可实行天然更新。渐伐和择伐迹地以天然更新为主,天然更新种苗数量不足或分布不匀处辅以人工促进更新。采用人工更新的迹地,一般栽植针叶树,适当保留天然更新的阔叶树幼苗幼树,日后可形成混交林。森林采伐后,宜于当年更新或次年更新,其面积与采伐面积相等;3年以后,人工更新的苗木成活保存率宜在85%以上,尽可能多地保留前更幼树(采伐前长成的幼树);天然更新不好的迹地,要用人工促进更新,在采伐当年或次年进行人工补植、补播;在更新过程中,实行山林封禁,防止人、畜入山破坏。
按照中国森林采伐更新管理办法(1987年9月10日公布)的规定,更新跟上采伐的标准为:在采伐后的当年或者次年内必须完成更新造林任务。更新质量必须达到以下标准:①人工更新,当年成活率不低于85%,3年后保存率应当不低于80%;②人工促进天然更新,补植、补播后的成活率和保存率达到人工更新的标准;天然下种前整地的,达到所规定的天然更新标准;③天然更新,每公顷皆伐迹地应当保留健壮目的树种幼树不少于3000株或者幼苗不少于6000株,更新均匀度应当不低于60%。择伐、渐伐迹地的更新质量,达到规程所规定的择伐、二次渐伐与三次渐伐的林地所应达到的要求。
五、实验过程:
1、标准地设置
利用罗盘仪、标杆、皮尺确定20m×30m标准地(如标准地内株数小于50株,则要增大面积),利用调查区域的坡度校正标准地面积。用油漆标注标准地边界并在四角设置固定标志物。将标准地内立木编号。
2、标准地调查
(1)立地条件调查
调查标准地的海拔高度、坡度、坡向、坡位、坡形、土壤剖面(土壤各层的深度 A.腐殖质B.土壤C母质层)
(2)划定样方
利用皮尺在标准地内划10m*10m样方四个,5m*5m的样方三个,1m*1m的样方五个。(3)立木每木检尺调查与统计
胸径、树高(毎五株实测一株)、冠幅(东西*南北)、活枝高。调查参数的统计分析(平均值、标准差、变异系数)。径阶归类并计算径阶平均值,分析林分直径分布规律。按照树高、胸径不超过2倍标准差选择平均木,干形通直,冠形饱满。
(4)林相调查、郁闭度调查
林分纵向剖面图(10米长、5米宽范围内的树高、干径、冠长、冠宽);沿标准地对角线抬头观察,见光为0,不见光为1,按照成数确定郁闭度。
(5)植被调查
在这三种样方中分别调查乔木、灌木和草本更新,分别测定丛数、丛高、盖度、总盖度,株高,胸径、多度、生物多样性指数等。
(6)土壤剖面调查
土壤各层深度、母质层深度(A层:腐殖质层B层:土壤层C层:母质层)
3、森林天然下种更新调查
场部后赤松麻栎混交林、麻栎林。10m10m样方,3-5个;立地条件调查;上层乔木调查(树高、胸径、冠幅、郁闭度、混交比);下层更新幼树调查(年龄、树高、地径或胸径、冠幅、冠长、生长势、自然整枝、自然稀疏);植被调查;树龄调查。
4、刺槐萌芽更新调查
黄尖山1、2代刺槐林;20m*30m标准地,立地条件、植被、每木检尺调查;干形、郁闭度;树龄。
六、结果分析
1、森林天然下种更新调查
选择厂部后赤松林、麻栎林进行调查。
选取20m*30m标准地一块,对标准地内乔木进行每木检尺。在标准地内选取10m*10m样方3-5个调查其下层幼树的更新(年龄、树高、地径或胸径、冠幅、冠长、生长势、自然整枝、自然稀疏)等。
调查数据如下:
表1 标准地概况
标准地坐标北纬东经海拔/m
西北角36.331123 117.11082 785.30(+-6.2)
东北角36.33116 117.111117 784.10(+-6.2)
东南角36.331017 117.111138 778.20(+-5.3)
西南角36.33062 117.110847 776.70(+-6.6)
表2 上层乔木每木检尺调查表
林班号:33 小
班
号
:1 坡度:27°
坡向:
阳坡
坡位:
上
调查小
组:一班
二组
调查日期:2012年10
月9号
调查人员:刘亚、刘畅、马芳芳、孙天平、朱安明、刘思汝、浦梅、赵伯国
编号树种树高/m 胸径
/cm 活枝下高/m
死枝下高
/m
冠幅
东西
/m
南北
/m
林
木
分
级
1 赤松10.00 21.1 4.5 4.
2 5.1 6.2 5
2 赤松 4.70 16 3.
3 2.1 3.7 4.2 3
3 赤松7.00 24.
4 3.
5 2.4 5.3 4.4 6
4 赤松9.80 21 4.6 3.9 4 6.3 5
5 赤松9.60 18.
6 4.3 3.
7 4.9 3.9 5
6 赤松11.50 35.2 5.2 4.9 7.9 7.
7 3
7 赤松12.50 32.2 2.9 2.9 8.6 7 5
8 赤松7.50 18.4 4.2 2.5 5.3 5.1 5
9 赤松 5.50 16.9 2.9 2.4 4.3 3.6 4
10 赤松9.00 22.8 4.5 5.5 4.1 6.1 4
11 刺槐13.20 35 4.5 无 6.9 8.7 5
12 赤松 6.70 20.6 4.5 2.9 3 5.3 5
13 赤松 5.50 9.5 2.1 2.1 2.3 3.2 3
14 赤松 4.60 8.8 2.8 1.7 2.7 2.8 2
15 赤松 5.20 5.9 2.6 1.7 2.2 2.4 3
16 赤松 4.70 8.5 1.7 1.5 2.1 2.9 4
17 赤松8.70 11.4 2.6 2.6 1.7 2.6 4
18 赤松8.90 20.9 4.7 3.5 5 4.3 5
19 赤松7.70 11.3 4.6 2.7 3.8 4 6
20 赤松10.10 30.4 4.5 无8 8.3 6
21 赤松10.30 20.7 4.5 4.3 5.4 4.8 5
22 赤松 6.80 14.1 4.7 4.7 2.8 3.1 4
23 赤松7.40 15.1 5.1 3.3 3.2 4 4
24 赤松9.80 15.4 2.5 1.5 4.8 4.5 4
25 赤松8.20 25.7 5.1 2.7 5.2 5.7 5
26 赤松9.80 19 5 4.7 4.4 4.8 5
27 赤松7.90 15.7 3.8 4.7 4.8 6.6 4
28 赤松8.30 17.9 4.6 5.1 4.7 5.1 3
29 赤松7.60 15.1 3.9 4.5 4.1 4.7 4
30 赤松 6.20 12.4 4.5 3.1 3 2.6 5
31 赤松8.30 30.5 4.9 4.6 6 4.8 4
32 赤松9.20 19.6 6.5 5.1 5.5 5.1 5
33 赤松7.20 14.6 4 3.1 4.4 5.9 4
34 赤松8.80 25.6 3.7 3.3 5.3 4.1 6
35 赤松7.70 17.5 4 2.9 5.2 5 5
36 赤松8.70 28.9 4.1 3.9 7.2 8.1 4
37 赤松8.30 23.4 4.4 2.7 5.1 4.8 4
38 赤松7.50 12.7 6.2 2.4 4.4 5.1 5
39 赤松7.60 18.6 4.1 2.7 3.9 4.7 4
平均
值8.15 19.2
7 4.11 3.31 4.62 4.94
4.
41
标准
差 2.01 7.27 1.03 1.13 1.62 1.59 0.
94
变异
系数0.2460 0.37
76 0.2507 0.3401
0.35
01
0.322
2
0.
21
27
离散
程度 1.1915
从表2中可以直观看到:胸径变异系数最大,达0.37,树高、林木分级和活枝下高的变异系数较小,约为2-3。胸径的变化幅度大,经分析在于小径阶赤松数目较多并且极度被抑制生长。
表3 赤松林径阶分布规律
径阶
/cm 6 10 14 18 22 26 30 34 株数 1 5 8 9 7 3 3 3
图1 赤松人工林径阶分布图
从表3和图1看到:14径阶和18径阶的树木数目最多,而且总体胸径偏向小径阶方向。
表4 赤松林上层乔木更新调查表
样方
1
编号树种
年
龄/
年树高/m 胸径/地径/cm
冠幅
生长势备注
东西南北
1 刺槐 1 0.5 0.3 0.3
2 0.
3 6
2 君迁子7 2.7 1.9 1.9 2.4 6
3 君迁子11 5.2 8 5.
4 7.4 6
4 臭椿 2 0.
5 0.3 0.48 0.52 6
5 黄连木
6 0.45 0.
7 0.41 0.5
8 6
6 黄连木
7 2.1 0.
8 0.8 0.
9 5
7 黄连木 3 0.24 0.2 0.2 0.25 4
8 黄连木 4 0.25 0.2 0.15 0.15 4
9 君迁子 5 0.89 1.1 0.93 0.63 5
10 君迁子 4 0.54 0.6 0.36 0.38 6
11 赤松30 7.7 11.3 3.8 4 4 样方
2
编号树种
年
龄/
年树高/m 胸径/地径/cm
冠幅生长势备注
东西南北
1 君迁子 6 0.45 0.6 0.24 0.35 5
2 君迁子 6 0.6 1.1 0.95 0.85 5
3 君迁子11 2.25 1.9 2.27 1.97 6
4 黄连木8 1.3 1.4 0.6 0.
5 6
5 黄连木12 1.54 0.
6 0.69 0.5
7 6
6 黄连木8 2.6 1.4 1.25 1.1 6
7 黄连木9 1.7 0.8 0.7 0.8 5
8 黄连木10 1.34 1.1 0.53 0.56 6
9 黄连木 5 0.7 0.4 0.7 0.55 4
10 黄连木 6 1.15 0.7 0.25 0.3 6
11 黄连木 5 0.48 0.6 0.34 0.36 6
12 黄连木7 1.1 0.7 0.5 0.5 5
13 黄连木9 1.2 0.6 0.7 0.75 6
14 黄连木7 0.69 1.4 0.3 0.32 4
15 刺槐 4 0.35 0.4 0.23 0.2 5
16 黄连木 6 0.9 0.4 0.2 0.25 3
17 黄连木 4 0.42 0.5 0.21 0.2 5
18 赤松25 6.2 12.4 3.4 2.3 3 样方
3
编号树种
年
龄/
年树高/m 胸径/地径/cm
冠幅生长势备注
东西南北
1 黄连木8 1.1
2 1.1 0.52 0.56 6
2 君迁子
3 0.2 0.3 0.2 0.2 5
3 君迁子 3 0.8 1.1 0.8 0.75 6
4 君迁子 3 0.4
5 0.
6 0.34 0.32 6
5 君迁子 3 0.41 0.
6 0.3
7 0.55 6
6 刺槐9 0.
7 0.
8 1.5 1.8 5 萌蘖
7 黄连木8 1.3 1.2 0.8 0.6 5
8 刺槐 4 1.1 0.6 0.6 0.5 6 萌蘖
9 黄连木 4 0.49 0.7 0.24 0.28 6
10 黄连木 4 0.47 0.7 0.41 0.52 6
11 君迁子 4 0.49 0.8 0.29 0.36 6
12 赤松20 5.2 5.9 1.6 1.8 4
13 赤松26 4.7 8.5 2.4 2.6 5
14 赤松26 4.6 8.8 2.7 2.8 1
15 赤松28 5.5 9.5 2.3 3.2 5
样方
4
编号树种
年
龄/
年树高/m 胸径/地径/cm
冠幅生长势备注
东西南北
1 黄连木 3 0.47 0.6 0.35 0.34 6
2 君迁子9 4.
3 5.8 3.6 4.2 6
3 黄连木8 1.27 1.
4 0.78 0.92 6
4 黄连木
5 1.1 0.
6 0.5 0.45 6
5 君迁子 4 0.45 0.5 0.4 0.4 5
6 黄连木 3 0.54 0.
7 0.3 0.36 6
7 君迁子 4 0.4 0.8 0.4 0.5 6
8 黄连木8 1.4 0.7 0.7 0.5 6
表5 赤松林下层灌木更新调查表
样方号编号树种树高(m)胸径(cm)冠幅(m)冠长生长势
一 1 扁担杆 1.1 0.8 1.5 1.9 6
二 1 荆条0.75 0.4 0.7 0.6 6
三 1 扁担杆0.65 0.5 0.8 0.75 5
2 绣线菊0.85 1 0.5 0.
3 4
从表 5 得到以下信息:扁担杆数量最多,是林下常见的灌木更新种,性强健,耐寒,耐干旱,耐瘠薄。喜光,也略耐阴。对土壤要求不严,在富有腐殖质的土壤中生长旺盛。其次是绣线菊和荆条,其中绣线菊喜光也稍耐荫,抗寒,抗旱,喜温暖湿润的气候和深厚肥沃的土壤。萌蘖力和萌芽力均强,耐修剪。荆条常生于山地阳坡上,形成灌丛,资源极丰富,且荆条性强健,耐寒、耐旱,亦能耐瘠薄的土壤;喜阳光充足,多自然生长于山地阳坡的干燥地带,形成灌丛,或与酸枣等混生为群落,或在盐碱砂荒地与蒿类自然混生。其根茎萌发力强,耐修剪。
表6赤松林下草本调查表调查表
样方号编号名称丛数丛高cm 盖度总盖度多度
一1 羊胡子 6 10 0.5
0.9
很多2 未知草1 13 13 0.4 多
二1 羊胡子8 10 0.6
0.8
很多2 野菊花 6 45 0.2 多
三1 未知草1 6 20 0.2
0.9
多
2 野菊花 1 25 0.05 个别
3 羊胡子11 10 0.55 多
4 鬼针草 3 50 0.1 稀少
四1 地肤9 60 0.15
1
尚多
2 未知草1 2 20 0.05 个别
3 鬼针草9 50 0.2 尚多
4 羊胡子13 10 0.6 多
五1 未知草4 1 25 0.2
0.8
个别
2 未知草5 2 55 0.1 个别
3 委陵菜 1 5 0.1 个别
4 鬼针草7 50 0.1 少
5 羊胡子 5 10 0.3 少
从表6可见:赤松人工林林下草本种类多,数量也大,其中主要以羊胡子、野菊花、鬼针草居多。羊胡子草易于生于岩壁上野菊花生于山坡草地、灌丛、河边水湿地,海滨盐渍地及田边、路旁,岩石上;鬼针草生长在路边,荒地,水沟边等处,果实还会粘在人们的衣服上。
2、刺槐萌芽更新调查
选取黄尖山1、2代刺槐林为调查对象,设20m*30m标准地,对标准地内的乔木进行每木检尺调查,并测其干形、郁闭度、树龄等。同时调查标准地的立地条件、植被。调查结果如下:
表7标准地概况:
备注海拔880.8m
经纬度N36.33°
E117.14°
表8 刺槐一代林每木检尺记录表(20m*30m)
树高/m 枝下高
/m
胸径/cm
冠幅东
西
冠幅南
北
平均值11.75909091 5.30454
5455
15.5295
4545
4.22045
4545
4.11818
1818
标准差 1.92635554 1.74488
6822
6.86692
7127
1.99599
3609
1.65350
547
变异系数0.163818407
0.32894
1817
0.44218
4683
0.47293
3327
0.40151
3469
表9刺槐二代林每木检尺调查表
树高/m 胸径/cm 枝下高/m 冠幅东西冠幅南北
平均值12.23 12.98 4.72 3.42 3.30 标准差 2.30 2.95 2.00 1.19 1.19
变异系数0.1878 0.2271 0.4247 0.3476 0.3597
从表8和表9可见:从从平均值上看,刺槐一代林的胸径、冠幅和枝下高优于二代林相应调查因子,而树高低于二代林,从变异系数来看,一代林的数据中只有树高的变异系数小于二代林,其余的像胸径、枝下高和冠幅的数据都比二代林大。也就是说,一代林的各个调查因子不仅在数值上与二代林不相伯仲,两者不好比较,造成这种现象的原因可能事实如此,但也有可能是测量时的随机误差,甚至是错误导致的。
图2 刺槐二代林径阶分布图
从图看出,刺槐一代林胸径主要分布在8-20径阶,长势明显好于二代林,刺槐二代林胸径主要集中在6-16径阶,相比于一代林,二代林生长状况不佳。
综合以上各个表格数据,树高、胸径等指标方面,一代林比二代林长势更好。树形方面,一代林较弯曲,二代林较通直。
七、实验总结
刺槐种子天然更新,由于种子发芽和幼苗的形成受温度、水分及地被物等多项因子的影响,更新是困难的,种子天然更新难以成林。刺槐侧根系有很强的根萦能力,萌生大量的根萦苗,形成新林。根萦更新是刺槐天然更新的主要方式,可形成优良的林分,并扩展其分布范围。在刺槐林的采伐迹地上,可用伐桩萌发,进行萌芽更新。但萌芽林木易衰老,质量较劣,不如将伐桩剥皮,抑制其萌发,进行根萦更新,恢复森林,提高林分质量。
影响赤松更新幼树数量的因素很多,不同因素与赤松更新的关系不同,其作用大小和作用特点不同。林分郁闭度、植被总盖度、裸岩面积百分比、坡度4个因子均与赤松幼树数
量呈负相关。每公顷林木梅典几土层厚度2乍因于与赤松幼树数量呈正相关。6个因子对赤松幼树数量的作用顺序为灌、草层总盖度>郁闭度>土层厚度>坡度>每公顷林木株数>裸岩面积百分比。林分郁闭度、灌、草层总盖度二者与赤松幼树数量相关最密切,是影响赤松幼树数量最重要的因子。各个因子对赤松幼树数量的作用可分为直接作用和间接作用。不同因子其直接作用和间接作用不同。林分郁闭度、灌、草层总盖度、裸岩面积百分比、每公顷林木株数4个因子以直接作用为主,坡度、上层厚度以间接作用为主。郁闭度、灌、草层总盖度、坡度对赤松幼树数量的直接作用和间接作用均为负效应,土层厚度对赤松幼树数量的直接作用和间接作用均为正效应。每公顷林木株数对赤松幼树数量的直接作用和间接作用二者性质相反。通径分析不仅能表明自变量与因变量的因果关系,而且还能表明不同自变量之间的
因果关系,从而深刻地揭示变量之间相互作用的规律。
此外,通过这次外业调查实习,我们了解到森林更新森林更新是森林持续发展与持续利用的基础。
同时我们认识到,森林采伐与更新是林业生产中不可分割的两个方面,是密切结合的。林木成熟后,应该进行采伐利用,充分满足国家建设的需要。森林采伐后,为了再生产,就需要及时进行森林更新,使更新跟上采伐,为再生产创造条件,只有这样永续不断地进行林业生产,充分发挥人的主观能动性,使利用森林和恢复、改造森林相结合,才能保证有林可伐,生产更多更好的木材,从而推动林业不断地向前发展。因此,需要全面地看问题,不能强调一方,忽视另一方。为解决中国森林资源少、国家建设对木材需要量大的矛盾,除应重视选
择主伐方式外,还应采取积极措施,在当前力争使更新跟上或超过采伐的速度,不断地扩大森林资源。
运 筹 学 实 验 报 告 学院:经济管理学院 专业班级:工商11-2班 姓名:石慧婕 学号:311110010207
实验一线性规划 一实验目的 学习WinQSB软件的基本操作,利用Linear Programming功能求解线性规划问题。掌握线性规划的基本理论与求解方法,重点在于单纯形法的应用以及灵敏度分析方法。 二、实验内容 安装WinQSB软件,了解WinQSB软件在Windows环境下的文件管理操作,熟悉软件界面内容,掌握操作命令。利用Linear Programming功能建立线性模型,输入模型,求解模型,并对求解结果进行简单分析。 三实验步骤 1.将WinQSB文件复制到本地硬盘;在WinQSB文件夹中双击setup.exe。 2.指定安装WinQSB软件的目标目录(默认为C:\ WinQSB)。 3.安装过程需要输入用户名和单位名称(任意输入),安装完毕之后,WinQSB菜单自动生成在系统程序中。 4.熟悉WinQSB软件子菜单内容及其功能,掌握操作命令。 5.求解线性规划问题。启动程序开始→程序→WinQSB→Linear and Integer Programming。 某工厂要用三种原材料C、P、H混合调配出三种不同规格的产品A、B、D。已知产品的规格要求,产品单价,每天能供应的原材料数量及原材料单价分别见下表1和2。该厂应如何安排生产,使利润收入为最大? 表1 产品名称规格要求单价(元/kg) A 原材料C不少于50% 原材料P不超过25% 50 B 原材料C不少于25% 原材料P不超过50% 35 D 不限25 表2 原材料名称每天最多供应量(kg)单价(元/kg)
《数据挖掘》Weka实验报告 姓名_学号_ 指导教师 开课学期2015 至2016 学年 2 学期完成日期2015年6月12日
1.实验目的 基于https://www.sodocs.net/doc/461636135.html,/ml/datasets/Breast+Cancer+WiscOnsin+%28Ori- ginal%29的数据,使用数据挖掘中的分类算法,运用Weka平台的基本功能对数据集进行分类,对算法结果进行性能比较,画出性能比较图,另外针对不同数量的训练集进行对比实验,并画出性能比较图训练并测试。 2.实验环境 实验采用Weka平台,数据使用来自https://www.sodocs.net/doc/461636135.html,/ml/Datasets/Br- east+Cancer+WiscOnsin+%28Original%29,主要使用其中的Breast Cancer Wisc- onsin (Original) Data Set数据。Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使用Java写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。 3.实验步骤 3.1数据预处理 本实验是针对威斯康辛州(原始)的乳腺癌数据集进行分类,该表含有Sample code number(样本代码),Clump Thickness(丛厚度),Uniformity of Cell Size (均匀的细胞大小),Uniformity of Cell Shape (均匀的细胞形状),Marginal Adhesion(边际粘连),Single Epithelial Cell Size(单一的上皮细胞大小),Bare Nuclei(裸核),Bland Chromatin(平淡的染色质),Normal Nucleoli(正常的核仁),Mitoses(有丝分裂),Class(分类),其中第二项到第十项取值均为1-10,分类中2代表良性,4代表恶性。通过实验,希望能找出患乳腺癌客户各指标的分布情况。 该数据的数据属性如下: 1. Sample code number(numeric),样本代码; 2. Clump Thickness(numeric),丛厚度;
运筹学实验报告 实验目的:了解及掌握运筹学一些常用软件,如excel,WinQsb 实验步骤: 1用Excel求解数学规划 例:求max=2x1+x2+x3 4x1+2x2+2x2≥4 2x1+4x2≤20 4x1+8x2+2x3≤4 步骤: 1.输入模型数据 2.在E3单元格输入公式“=SUMPRODUCT($B$2:$D$2,B3:D3)”,并拖动复制E3的公式到E4-E6:
3.从“工具”菜单中选择“规划求解”,将弹出的“规划求解参数”窗口中的目标单元格设为$E$3,可变单元格设为$B$2:$D$2,目标为求最大值:4.添加约束:由于本例的约束条件类型分别为<=、>=和=,因此要分3次设置,每次设置完毕后都要单击“添加”按钮,如下图。添加完成后选择“确定”返回。 5.单击“选项”按钮,将“规划求解选项”窗口中的“采用线性模型”和“假定非负”两项选中后点“确定”返回,设置好参数的界面如下图: =1,x2 =0,x3 =0,max Z=2。6.单击“求解”按钮,得到问题的最优解为:x 1
2.winQSB求解线性规划及整数规划 [例]求解线性规划问题: Minz=2x1—x2+2x3 2x1+2x2+x3=4 3x1+x2+x4=6 第1步:生成表格 选择“程序,生成对话框: 第2步:输入数据 单击“OK”,生成表格并输入数据如下
第3步:求解 决策变量(Decision Variable):x1,x2,x3 最优解:x1=2,x2=0,x3=0 目标系数:c1=2,c2= -1,c3=2 最优值:4;其中x1贡献4、x2,x3贡献0; 检验数(Reduced Cost):0,0,1.75。 目标系数的允许减量(Allowable Min.c[j])和允许增量(Allowable Max.c[j]):目标系数在此范围变量时,最优基不变。 约束条件(Constraint):C1、C2; 左端(Left Hand Side):4,6右端(Right Hand Side):4,6 松驰变量或剩余变量(Slack or Surplus):该值等于约束左端与约束右端之差。为0表示资源已达到限制值,大于0表示未达到限制值。 影子价格(Shadow Price):-1.25,1.5,即为对偶问题的最优解。 约束右端的允许减量(Allowable Min.RHS)和允许增量(Allowable Max.RHS):表示约束右端在此范围变化,最优基不变。 3.winQSB解运输问题
数据挖掘实验报告(一) 数据预处理 姓名:李圣杰 班级:计算机1304 学号:1311610602
一、实验目的 1.学习均值平滑,中值平滑,边界值平滑的基本原理 2.掌握链表的使用方法 3.掌握文件读取的方法 二、实验设备 PC一台,dev-c++5.11 三、实验内容 数据平滑 假定用于分析的数据包含属性age。数据元组中age的值如下(按递增序):13, 15, 16, 16, 19, 20, 20, 21, 22, 22, 25, 25, 25, 25, 30, 33, 33, 35, 35, 35, 35, 36, 40, 45, 46, 52, 70。使用你所熟悉的程序设计语言进行编程,实现如下功能(要求程序具有通用性): (a) 使用按箱平均值平滑法对以上数据进行平滑,箱的深度为3。 (b) 使用按箱中值平滑法对以上数据进行平滑,箱的深度为3。 (c) 使用按箱边界值平滑法对以上数据进行平滑,箱的深度为3。 四、实验原理 使用c语言,对数据文件进行读取,存入带头节点的指针链表中,同时计数,均值求三个数的平均值,中值求中间的一个数的值,边界值将中间的数转换为离边界较近的边界值 五、实验步骤 代码 #include
运筹学实验报告(一) 实验要求:学会在Excel 软件中求解。 实验目的:通过小型线性规划模型的计算机求解方法。 熟练掌握并理解所学方法。 实验内容: 题目: 某昼夜服务的公交线路每天各时间区段内所需司机和乘务人员数如下; 设司机和乘务人员分别在各时间区段一开始上班,并连续工作八小时,问该公交线 路至少配备多少名司机和乘 务人员。列出这个问题的线 性规划模型。 解:设Xj 表示在第j 时间区段开始上班的司机和乘务人员数 班次 时间 所需人数 1 6:00-10:00 60 2 10:00-14:00 70 3 14:00-18:00 60 4 18:00-22:00 50 5 22:00-2:00 20 6 2:00-6:00 30
。 6-10 10-14 14-18 18-22 22-2 2-6 1 X1--- X1 2 X2--- X2 3 X3--- X3 4 X4--- X4 5 X5--- X5 6 X6 X6--- 60 70 60 50 20 30 所需人 数 Min z=x1+x2+x3+x4+x5+x6 St: x1+x6>=60 X1+x2>=70 X2+x3>=60 X3+x4>=50 X4+x5>=20 X5+x6>=30 Xj>=0,xj为整数, j=1,2,3,4,5,6
过程: 工作表[Book1]Sheet1 报告的建立: 2011-9-28 19:45:01 目标单元格(最小值) 单元格名字初值终值 $B$1 min 0 150 可变单元格 单元格名字初值终值 $B$3 x 0 45 $C$3 x 0 25 $D$3 x 0 35 $E$3 x 0 15 $F$3 x 0 15 $G$3 x 0 15 结果:最优解X=(45,25,35,15,15,15)T 目标函数值z=150 小结:1.计算机计算给规划问题的解答带来方便,让解答变得简洁;
大数据理论与技术读书报告 -----K最近邻分类算法 指导老师: 陈莉 学生姓名: 李阳帆 学号: 201531467 专业: 计算机技术 日期 :2016年8月31日
摘要 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地提取出有价值的知识模式,以满足人们不同应用的需要。K 近邻算法(KNN)是基于统计的分类方法,是大数据理论与分析的分类算法中比较常用的一种方法。该算法具有直观、无需先验统计知识、无师学习等特点,目前已经成为数据挖掘技术的理论和应用研究方法之一。本文主要研究了K 近邻分类算法,首先简要地介绍了数据挖掘中的各种分类算法,详细地阐述了K 近邻算法的基本原理和应用领域,最后在matlab环境里仿真实现,并对实验结果进行分析,提出了改进的方法。 关键词:K 近邻,聚类算法,权重,复杂度,准确度
1.引言 (1) 2.研究目的与意义 (1) 3.算法思想 (2) 4.算法实现 (2) 4.1 参数设置 (2) 4.2数据集 (2) 4.3实验步骤 (3) 4.4实验结果与分析 (3) 5.总结与反思 (4) 附件1 (6)
1.引言 随着数据库技术的飞速发展,人工智能领域的一个分支—— 机器学习的研究自 20 世纪 50 年代开始以来也取得了很大进展。用数据库管理系统来存储数据,用机器学习的方法来分析数据,挖掘大量数据背后的知识,这两者的结合促成了数据库中的知识发现(Knowledge Discovery in Databases,简记 KDD)的产生,也称作数据挖掘(Data Ming,简记 DM)。 数据挖掘是信息技术自然演化的结果。信息技术的发展大致可以描述为如下的过程:初期的是简单的数据收集和数据库的构造;后来发展到对数据的管理,包括:数据存储、检索以及数据库事务处理;再后来发展到对数据的分析和理解, 这时候出现了数据仓库技术和数据挖掘技术。数据挖掘是涉及数据库和人工智能等学科的一门当前相当活跃的研究领域。 数据挖掘是机器学习领域内广泛研究的知识领域,是将人工智能技术和数据库技术紧密结合,让计算机帮助人们从庞大的数据中智能地、自动地抽取出有价值的知识模式,以满足人们不同应用的需要[1]。目前,数据挖掘已经成为一个具有迫切实现需要的很有前途的热点研究课题。 2.研究目的与意义 近邻方法是在一组历史数据记录中寻找一个或者若干个与当前记录最相似的历史纪录的已知特征值来预测当前记录的未知或遗失特征值[14]。近邻方法是数据挖掘分类算法中比较常用的一种方法。K 近邻算法(简称 KNN)是基于统计的分类方法[15]。KNN 分类算法根据待识样本在特征空间中 K 个最近邻样本中的多数样本的类别来进行分类,因此具有直观、无需先验统计知识、无师学习等特点,从而成为非参数分类的一种重要方法。 大多数分类方法是基于向量空间模型的。当前在分类方法中,对任意两个向量: x= ) ,..., , ( 2 1x x x n和) ,..., , (' ' 2 ' 1 'x x x x n 存在 3 种最通用的距离度量:欧氏距离、余弦距 离[16]和内积[17]。有两种常用的分类策略:一种是计算待分类向量到所有训练集中的向量间的距离:如 K 近邻选择K个距离最小的向量然后进行综合,以决定其类别。另一种是用训练集中的向量构成类别向量,仅计算待分类向量到所有类别向量的距离,选择一个距离最小的类别向量决定类别的归属。很明显,距离计算在分类中起关键作用。由于以上 3 种距离度量不涉及向量的特征之间的关系,这使得距离的计算不精确,从而影响分类的效果。
专业:J信息1101 学号:4111118002 姓名:彭倩 社会调查实验报告 在这次社会调查实验中,我了解到CATI,即计算机辅助电话访问(Computer Assisted Telephone Interview),是将近年高速发展的通讯技术及计算机信息处理技术应用于传统的电话访问所得到的产物,问世以来得到越来越广泛的应用。它是在加深对中国调查业的理解和对国外同类软件研究的基础上,自主开发了这套符合中国国情的系统。 CATI是具有高技术含量、高专业性和高实用性的电话调研产品。自20世纪70年代诞生以来,计算机辅助电话调查以其可控性高、时效性强等特点越来越为研究者所接受。在信息挂帅的今天,CATI系统更被视为收集资料、分析数据的利器,在商业、学术以及政府调研行为中得到了广泛应用。 从社会调查实验中,我们也可以了解到CATI项目整体业务流程如下:
通过利用CATI系统,我知道了计算机辅助电话访问就是用计算机为媒介设计问卷,用电话向被调查者进行访问。从而让计算机代替了问卷、答案纸和铅笔。通过计算机拨打所要的号码,电话接通之后,调查员就读出计算机屏幕上显示出的问答题并直接将被调查者的回答(用号码表示)用键盘记入计算机的记忆库之中。计算机会系统地指引整个业务流程。问卷可以直接在计算机中设计、调试,抽样过程可以大大简化,配额也完全由计算机系统自动控制,问卷执行时所有的问卷内部的流程和逻辑都有计算机内部控制,并且计算机会检查答案的适当性和一致性。 从中我感受到计算机收集数据的过程是自然的、平稳的,而且访问时间大大缩减,数据质量得到了加强,数据的录入等过程也不再需要,编码也可以统一的自动实现。由于回答是直接输入计算机的,关于数据收集和结果的阶段性的和最新的报告几乎可以立刻就得到。同时CATI可以提供更高效更全面透明的监控方式,所有的话务监控、通话录音、监听、监看都在一个独立的计算机上执行,大大减低了对访问过程的产生干扰的可能性。采用这种访问调查方式,具有调查内容客观真实、保密性强、访问效率高等特点。 在这次社会调查中,我深刻的感受到CATI在社会调查访问中具有强大的功能。 1、实效快。省去了传统调查所必须的印刷问卷、上门入户或邮寄问卷、审核问卷、数据录入等环节,在短时间内即可完成调查,访问结束后几十分钟内即可汇总数据,周期较短。
2012——2013学年第一学期 实验报告 课程名称:运筹学 实验项目:求解线性规划问题 实验类别:综合性□设计性□√验证性□专业班级: 姓名:学号: 实验地点: 实验时间: 指导教师:成绩:
一.实验目的 1、熟悉LINGO 软件的使用方法、功能; 2、学会用LINGO 软件求解一般的线性规划问题。 二.实验内容 1、某班有男同学30人,女同学20人,星期天准备去植树。根据经验,一天中,男同学平均每人挖坑20个,或栽树30棵,或给25棵树浇水,女同学平均每人挖坑10个,或栽树20棵,或给15棵树浇水。问应怎样安排,才能使植树(包括挖坑、栽树、浇水)最多。建立该问题的数学模型,并求其解。 2、求解线性规划: 12 1212212max 2251228..010 ,z x x x x x x s t x x x =++≥??+≤??≤≤???为整数 3、在高校篮球联赛中,我校男子篮球队要从8名队员中选择平均身高最高的出场 ⑴ 中锋最多只能上场一个。 ⑵ 至少有一名后卫 。 ⑶ 如果1号队员和4号队员都上场,则6号队员不能出场 ⑷ 2号队员和6号队员必须保留一个不出场。 问应当选择哪5名队员上场,才能使出场队员平均身高最高? 试写出上述问题的数学模型,并求解。 三. 模型建立 1建立模型为:设需要男生挖坑x1人,栽树x2人,浇水x3人,女生挖坑x4人,栽树x5人,浇水x6人,则建立的数学模型为:
14 12345614252536max 2010302020103020302025150,1,2,3,4,5,6=+++=??++=??+=+??+=+??>==?且为整数 i z x x x x x x x x x x x x x x x x x i 2.建立模型为:设j x =1表示第j 号队员上场,j x =0第j 号队员不上场,j=1,2,3,4,5,6,7,8. 12345678) 126781462612345678max 1/5(1.92 1.90 1.88 1.86 1.85 1.83 1.80 1.781121501,1,2,3,4,5,6,7,8. =++++++++<=??++>=??++<=?+<=??+++++++=?===?j j z x x x x x x x x x x x x x x x x x x x x x x x x x x x orx j 四. 模型求解(含经调试后正确的源程序) 1、(1)编写程序如下 model : max =20*x1+10*x4; x1+x2+x3=30; x4+x5+x6=20; 20*x1+10*x4-30*x2-20*x5=0; 30*x2+20*x5-25*x3-15*x6=0; @gin(x1); @gin(x2); @gin(x3); @gin(x4); @gin(x5); @gin(x6); end (2)编写程序如下: model : max =x1+2*x2; 2*x1+5*x2>12; x1+2*x2<8; x2<10; @gin(x1);
数据挖掘实验报告(二)关联规则挖掘 姓名:李圣杰 班级:计算机1304 学号:1311610602
一、实验目的 1. 1.掌握关联规则挖掘的Apriori算法; 2.将Apriori算法用具体的编程语言实现。 二、实验设备 PC一台,dev-c++5.11 三、实验内容 根据下列的Apriori算法进行编程:
四、实验步骤 1.编制程序。 2.调试程序。可采用下面的数据库D作为原始数据调试程序,得到的候选1项集、2项集、3项集分别为C1、C2、C3,得到的频繁1项集、2项集、3项集分别为L1、L2、L3。
代码 #include 实验报告 实验思考题: 1、某调查员欲从某大学所有学生中抽样调查学生平均生活费支出情况,假设该调查员已经 完成了抽样,并获得样本情况(见样本文件),请根据此样本分别按性别、家庭所在地分层,并计算各层的样本量、平均生活费支出、生活费支出的方差及标准差。 (1)先对数据按照家庭所在地进行排序:【数据】→【排序】,选择“家庭所在地”(2)再对数据进行分类汇总:【数据】→【分类汇总】,“分类字段”选择“家庭所在地”,“汇总方式”选择“平均值”,“选定汇总项”选择“平均月生活费”,在对话框下方选择“汇总结果显示在数据下方”;再做两次分类汇总,“汇总方式”分别选择“计数”和“标准偏差”。最后得到表1-1所示结果: 表1-1 家庭所在地平均月生活费 大型城市平均值614.5348837 大型城市计数86 大型城市标准偏差300.0849173 乡镇地区平均值529.4117647 乡镇地区计数68 乡镇地区标准偏差219.0950339 中小城市平均值618.6440678 中小城市计数118 中小城市标准偏差202.5264159 总计平均值595.0367647 总计数272 总计标准偏差243.4439223 (3)在SPSS软件中得出的计算结果: 选择————,然后在出现的对话框中 分别在“Dependent list”框中选入“家庭所在地”,在“Independent List”框中选入“平均月生活费”,得到如表1-2所示结果: 表1-2 Report 平均月生活费 家庭所在地Mean N Std. Deviation 大型城市614.5386300.085 乡镇地区529.4168219.095 中小城市618.64118202.526 Total595.04272243.444 选择——,在出现的对话框中选择“function”选择估计量,得到如图1-2所示结果: 图1-1 图1-2 一、实验目的 使用数据挖掘中的分类算法,对数据集进行分类训练并测试。应用不同的分类算法,比较他们之间的不同。与此同时了解Weka平台的基本功能与使用方法。 二、实验环境 实验采用Weka 平台,数据使用Weka安装目录下data文件夹下的默认数据集iris.arff。 Weka是怀卡托智能分析系统的缩写,该系统由新西兰怀卡托大学开发。Weka使用Java 写成的,并且限制在GNU通用公共证书的条件下发布。它可以运行于几乎所有操作平台,是一款免费的,非商业化的机器学习以及数据挖掘软件。Weka提供了一个统一界面,可结合预处理以及后处理方法,将许多不同的学习算法应用于任何所给的数据集,并评估由不同的学习方案所得出的结果。 三、数据预处理 Weka平台支持ARFF格式和CSV格式的数据。由于本次使用平台自带的ARFF格式数据,所以不存在格式转换的过程。实验所用的ARFF格式数据集如图1所示 图1 ARFF格式数据集(iris.arff) 对于iris数据集,它包含了150个实例(每个分类包含50个实例),共有sepal length、sepal width、petal length、petal width和class五种属性。期中前四种属性为数值类型,class属性为分类属性,表示实例所对应的的类别。该数据集中的全部实例共可分为三类:Iris Setosa、Iris Versicolour和Iris Virginica。 实验数据集中所有的数据都是实验所需的,因此不存在属性筛选的问题。若所采用的数据集中存在大量的与实验无关的属性,则需要使用weka平台的Filter(过滤器)实现属性的筛选。 实验所需的训练集和测试集均为iris.arff。 四、实验过程及结果 应用iris数据集,分别采用LibSVM、C4.5决策树分类器和朴素贝叶斯分类器进行测试和评价,分别在训练数据上训练出分类模型,找出各个模型最优的参数值,并对三个模型进行全面评价比较,得到一个最好的分类模型以及该模型所有设置的最优参数。最后使用这些参数以及训练集和校验集数据一起构造出一个最优分类器,并利用该分类器对测试数据进行预测。 1、LibSVM分类 Weka 平台内部没有集成libSVM分类器,要使用该分类器,需要下载libsvm.jar并导入到Weka中。 用“Explorer”打开数据集“iris.arff”,并在Explorer中将功能面板切换到“Classify”。点“Choose”按钮选择“functions(weka.classifiers.functions.LibSVM)”,选择LibSVM分类算法。 在Test Options 面板中选择Cross-Validatioin folds=10,即十折交叉验证。然后点击“start”按钮: 3.3 3.3 经调查研究发现,家庭书刊消费受家庭收入及户主受教育年数的影响,表3.6为对某地区部分家庭抽样调查得到的样本数据。 表3.6 家庭书刊消费、家庭收入及户主受教育年数数据 (1)作家庭书刊消费(Y )对家庭月平均收入(X )和户主受教育年数(T )的多元线性回归: 1 2 3 i i i i u Y X T βββ=+++ 利用样本数据估计模型的参数,对模型加以检验,分析所估计模型的经济意义和作用。 步骤: 1.打开EViews6,点“File ”→“New ”→“Workfile ”。选择 “Unstructured/Unda=ted ”在Observations 后输入18,点击ok 。 2. 在命令行输入:DATA Y X T,回车。将数据复制粘贴到Group中的表格中。 3. 建立数据关系图为初步观察数据的关系,在命令行输入命令:sort Y,从而实现数据Y的递增排序。 4. 在数据表“group”中点“view/graph/line”,最后点击确定,出现序列Y、X、T 的线性图。 5. OLS 估计参数,点击主界面菜单Quick\Estimate Equation ,弹出对话框,如下图。在其中输入Y c X T ,点确定即可得到回归结果。 ()()()()()() 2 2 50.01620.0864552.3703 49.46026 0.02936 5.20217 t= 1.011244 2.944186 10.067020.951235 =0.944732 F=146.2974 ?i i i X T Y R R =-++-= 经济意义:家庭月平均收入每增加1元,家庭书刊消费将增加0.08645 元。户主受教育年数每 运筹学实践报告指派问题 第一部分问题背景 泰泽公司(Tazer)是一家制药公司。它进入医药市场已经有12年的历史了,并且推出了6种新药。这6种新药中5种是市场上已经存在药物的同类产品,所以销售的情况并不是很乐观。然而,主治高血压的第6种药物却获得了巨大的成功。由于泰泽公司拥有生产治疗高血压药物的专利权,所以公司并没有遇到什么竞争对手。仅仅从第6种药物中所获得的利润就可以使泰泽公司正常运营下去。 在过去的12年中,泰泽公司不断地进行适量的研究和发展工作,但是却并没有发现有哪一种药物能够获得像高血压药物一样的成功。一个原因是公司没有大量投资进行创新研究开发的动力。公司依赖高血压药物,觉得没有必要花费大量的资源寻找新药物的突破。 但是现在泰泽公司不得不面对竞争的压力了。高血压药物的专利保护期还有5年1。泰泽公司知道只要专利期限一到,大量药品制造公司就会像秃鹰一样涌进市场。历史数据表明普通药物会降低品牌药物75%的销售量。 今年泰泽公司投入大量的资金进行研究和开发工作以求能够取得突破,给公司带来像高血压药物一样的巨大成功。泰泽公司相信如果现在就开始进行大量的研究和开发工作,在高血压药物专利到期之后能够发明一种成功药物的概率是很高的。作为泰泽公司研究和开发的负责人,你将负责选择项目并为每一个项目指派项目负责人。在研究了市场的需要,分析了当前药物的不足并且拜会了大量在有良好前景的医药领域进行研究的科学家之后,你决定你的部门进行五个项目,如下所示: Up项目:开发一种更加有效的抗忧郁剂,这种新药并不会带来使用者情绪的急剧变化。 Stable项目:开发一种治疗躁狂抑郁病的新药。 Choice项目:为女性开发一种副作用更小的节育方法。 Hope项目:开发一种预防HIV的疫苗。 Release项目:开发一种更有效的降压药。 对于这5个项目之中的任何一个来说,由于在进行研究之前你并不知道使用的配方以及哪种配方是有效的,所以你只能明确研究所要解决的疾病。 你还有5位资深的科学家来领导进行这5个项目。有一点你十分清楚,那就是科学家都是一些喜怒无常的人,而且他们只有在受到项目所带来的挑战和激励的时候才会努力工作。为了保证这些科学家都能够到他们感兴趣的项目中去,你为这个项目建立了一个投标系统。这5位科学家每个人都有1000点的投标点。 1一般来说,专利权保护发明的期限为17年。在1995年,GATT立法拓展专利权的保护期限到20年。在本案例之中,泰泽公司的高血压药物的注册时间是在1995年之前,所以专利权只能够保护这种药物17年。 成都理工大学管理科学学院教学实验报告(半期考试) 2014~2015学年第二学期 一、实验过程与步骤: 步骤1:新建Excel表,根据表二和表三分别绘制轿车到达间隔时间和洗车服务时间,如图1。 图1统计顾客到达速率 步骤2:模拟从A21开始,模拟数据区域为A21:K1120 。在A21:A1120列,依次编号为1到1100。分别选中24-117、123-1118行,点击鼠标右键将其“隐藏”,便于之后运算,否则表太大不好操作。共模拟1100辆轿车,假设从第101辆轿车开始系统进入稳态,则前面100辆轿车的数据不作为计算范围。 步骤3:在B21:B1120列每一格,分别表示1100辆轿车两两之间到达的间隔时间。在单元格B21中输入公式:=Vlookup(rand(),A$7:C$13,6),完毕按回车键。这个公式的意思是:由rand()产生一个[0,1]之间的随机数,将它与A$7:C$20区域第一列(即A7:A20)各单元格数据相比较,如果它大于或等于某单元格数据而小于同列下一行的数据,excel就会记录下某单元格所在的行数,然 后返回同行第3列的数据。 式:=Vlookup(rand(),E$7:G$14,4),按回车键。输入完毕,将F21单元格数据拖至1120行。这就得 到了1100辆轿车每一辆服务时间的随机数据。泊位数在B19输入,等于3。以上两步的操作结果见图2所示。 图2每辆车服务时间随机数的生成 步骤5:在C21单元格,输入:=0+B21,在C21单元格,输入:=C21+B22(注:从上一辆轿车到达的时刻开始计时,则第二辆轿车到达的时刻就是C21+B22小时末。以后以此推类)。将C21单元格拖动到C1120。结果见图3所示。 图 3 1100辆轿车到点时刻的计算 步骤6:在D21单元格,输入:=C21;在E21单元格,输入:= D21 -C21。在G21单元格,输入:=D25+F25。在H25单元格,输入:=G21-C21。分别将E21、G21、H21的数据拖动至E1120、 实验一 ID3算法实现 一、实验目的 通过编程实现决策树算法,信息增益的计算、数据子集划分、决策树的构建过程。加深对相关算法的理解过程。 实验类型:验证 计划课间:4学时 二、实验内容 1、分析决策树算法的实现流程; 2、分析信息增益的计算、数据子集划分、决策树的构建过程; 3、根据算法描述编程实现算法,调试运行; 4、对所给数据集进行验算,得到分析结果。 三、实验方法 算法描述: 以代表训练样本的单个结点开始建树; 若样本都在同一个类,则该结点成为树叶,并用该类标记; 否则,算法使用信息增益作为启发信息,选择能够最好地将样本分类的属性; 对测试属性的每个已知值,创建一个分支,并据此划分样本; 算法使用同样的过程,递归形成每个划分上的样本决策树 递归划分步骤,当下列条件之一成立时停止: 给定结点的所有样本属于同一类; 没有剩余属性可以进一步划分样本,在此情况下,采用多数表决进行 四、实验步骤 1、算法实现过程中需要使用的数据结构描述: Struct {int Attrib_Col; // 当前节点对应属性 int Value; // 对应边值 Tree_Node* Left_Node; // 子树 Tree_Node* Right_Node // 同层其他节点 Boolean IsLeaf; // 是否叶子节点 int ClassNo; // 对应分类标号 }Tree_Node; 2、整体算法流程 主程序: InputData(); T=Build_ID3(Data,Record_No, Num_Attrib); OutputRule(T); 释放内存; 3、相关子函数: 3.1、 InputData() { 输入属性集大小Num_Attrib; 输入样本数Num_Record; 分配内存Data[Num_Record][Num_Attrib]; 输入样本数据Data[Num_Record][Num_Attrib]; 获取类别数C(从最后一列中得到); } 3.2、Build_ID3(Data,Record_No, Num_Attrib) { Int Class_Distribute[C]; If (Record_No==0) { return Null } N=new tree_node(); 计算Data中各类的分布情况存入Class_Distribute Temp_Num_Attrib=0; For (i=0;i 统计学实验报告 一、实验主题:大学生专业与实习工作的关系 二、实验背景: 二十一世纪的今天大学生已是一个普遍的社会群体,高校毕业人数日益增加,社会、企业所提供的职位日益紧张,大学生就业问题是当今社会关注的焦点。面对日益沉重的就业压力,越来越多的大学毕业生选择了企业需求的职业,而这种职业与自己在校所学专业根本“无关”或相去甚远,大学毕业生就业专业不对口的现象非常严重。专业对口是个广义的概念,就是说你所学的专业与你所作的工作相关,比如你专业是会计,工作后你到了一个企业做会计,或者到银行做柜员,这都是与经济相关的,这就是对口。如果你学机械设计,但工作后却做了统计员,业务员等于你所学专业无关的工作,这就叫专业不对口。专业不对口导致毕业生所学知识没有用武之地,所以这是一种人力资源的浪费。 三、实验目的: 大学生就业专业不对口是客观存在的问题,我们研究此问题有这几点目的:①了解当代大学生实习工作与专业是否对口的情况,当代大学生对工作与专业不对口现象的态度。②分析大学生就业结构和 专业对口问题,了解当今大学生专业对口情况,为以后大学生选择专业、选择工作岗位提供有效的信息和借鉴。③寻找导致专业不对口的原因,以减少社会普遍存在的人力资源的浪费。 四、实验要求:就相关问题收集一定数量的数据,用EXCEL进行如下 分析:1进行数据筛选、排序、分组;2、制作饼图并进行简要解释;3、制作频数分布图,直方图等并进行简要解释。 五、实验设备及材料:计算机,手机,EXCEL软件,WORD软件。 六、实验过程: (一)制作并发放调查问卷。 (二)收回并统计原始数据:收回了102名大学生填写的调查问卷,并对相关数据进行统计。 (三)筛选与实验相关问题: 1.您的性别( ): A. 男B.女 实验1 单纯形法求解线性规划 成绩 实验类型:●验证性实验○综合性实验○设计性实验 实验目的:进一步熟练掌握单纯形法求解线性规划。 实验内容:单纯形法求解线性规划4个 实验原理线性规划单纯形法(线性规划解有四种情形,唯一最优解,无穷多个最解,无界解,无可行解) 实验步骤 1 要求上机实验前先编写出程序代码 2 编辑录入程序 3 调试程序并记录调试过程中出现的问题及修改程序的过程 4 经反复调试后,运行程序并验证程序运行是否正确。 5 记录运行时的输入和输出。 预习编写程序代码: 实验报告:根据实验情况和结果撰写并递交实验报告。 参考程序: function [xx,b,fm,sgma,AA,flg]=myprgmh(m1,m,n,A,b,c) % 单纯形法求解性规划函数。默认标准型人工变量在最前、剩余变量在后构成基本量; % m1 人工变量的个数;m 基变量的个数; n 所有变量的个数; % A 约束方程的系数矩阵; % b 约束方程右端列向量;输出 b 基变量的值; % c 目标函数的系数。cb 基变量的系数 % 输出 xx 为基变量的下标; % fm 输出目标函数的值; % flg 表示解得四种情况; B0=A(:,1:m); % B0 初始可行基矩阵(单位矩阵); cb=c(:,1:m); xx=1:m; % xx 变量的下标; sgma=c-(cb*B0)*A; % sgma 检验数; h=-1; sta=ones(m,1); for i=1:n if sgma(i)>0 h=1; end end vv=0; [msg,mk]=max(sgma); for i=1:m if A(i,mk)>0 sta(i)=b(i)/A(i,mk); else sta(i)=10000; end end [mst,mr]=min(sta); if mst==10000 flg='unbounded solution'; fm=inf; xx=[]; b=[]; h=-1; vv=1; AA=[]; else zy=A(mr,mk) for i=1:m if i==mr for j=1:n A(i,j)=A(i,j)/zy; end b(i)=b(i)/zy; else end end for i=1:m if i~=mr amk=A(i,mk); b(i)=b(i)-amk*b(mr); for j=1:n A(i,j)=A(i,j)-amk*A(mr,j); end else end A; B1=A(:,1:m); % B1 新基的逆矩阵; cb(mr)=c(mk); xx(mr)=mk; sgma=c-cb*A; 实验三 一、实验原理 K-Means算法是一种 cluster analysis 的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。 在数据挖掘中,K-Means算法是一种cluster analysis的算法,其主要是来计算数据聚集的算法,主要通过不断地取离种子点最近均值的算法。 算法原理: (1) 随机选取k个中心点; (2) 在第j次迭代中,对于每个样本点,选取最近的中心点,归为该类; (3) 更新中心点为每类的均值; (4) j<-j+1 ,重复(2)(3)迭代更新,直至误差小到某个值或者到达一定的迭代步 数,误差不变. 空间复杂度o(N) 时间复杂度o(I*K*N) 其中N为样本点个数,K为中心点个数,I为迭代次数 二、实验目的: 1、利用R实现数据标准化。 2、利用R实现K-Meams聚类过程。 3、了解K-Means聚类算法在客户价值分析实例中的应用。 三、实验内容 依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。对其进行标准差标准化并保存后,采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。编写R程序,完成客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数 四、实验步骤 1、依据航空公司客户价值分析的LRFMC模型提取客户信息的LRFMC指标。 2、确定要探索分析的变量 3、利用R实现数据标准化。 4、采用k-means算法完成客户的聚类,分析每类的客户特征,从而获得每类客户的价值。 客户的k-means聚类,获得聚类中心与类标号,并统计每个类别的客户数 六、思考与分析 使用不同的预处理对数据进行变化,在使用k-means算法进行聚类,对比聚类的结果。 kmenas算法首先选择K个初始质心,其中K是用户指定的参数,即所期望的簇的个数。 这样做的前提是我们已经知道数据集中包含多少个簇. 1.与层次聚类结合 经常会产生较好的聚类结果的一个有趣策略是,首先采用层次凝聚算法决定结果抽样调查-分层抽样实验报告
大数据挖掘weka大数据分类实验报告材料
最新版计量经济学实验报告
运筹学指派问题实验报告
运筹学实验报告
数据挖掘实验报告1
统计学实验报告【最新】
运筹学实验报告
数据挖掘实验报告三