搜档网
当前位置:搜档网 › 人工智能与机器学习项目报告

人工智能与机器学习项目报告

人工智能与机器学习项目报告
人工智能与机器学习项目报告

《人工智能与机器学习》课程项目报告国内年度冠军电影票房预测

姓名:111111111

课程名称:人工智能与机器学习

指导教师:111111111111

日期:202022222222

1. 绪论

电影业中,票房已经成为衡量一部电影是否成功的重要指标之一,可以用观众人数或门票收入来计算,一般直接用来衡量一部电影的热播程度。随着现代化建设的发展在,中国城乡居民收入水平显著提高,精神文化生活伴随着物质生活水平的提高也日益成为城乡广大消费者追求的目标,从数据可以看出以往只有少数人可以到的影视作品,现在已经成为大宗消费品,遍布各个城市,成为人们精神生活的寄托以及茶余饭后的谈资,电影作品已经成为一种潮流的象征,日益丰富着我们日常的生活。

需求带动生产,影视作品的数量都以每年惊人的速度增长,每年优秀的影视作品经过广大人们的选择都会产生,这其中的一个标准就是票房的多少,这些影视作品或具有现实的教育意义,或具有生动的艺术效果而打动观众。每年的票房冠军总是一定程度上反应社会上的需求或潮流。票房冠军更能反映国家的发展和经济状况。

本次将根据26年的冠军票房来预测之后四年的冠军票房。

2. 模型的构建

2.1 原始数据

表11994-2016年冠军票房

图1. 历年冠军票房折线图

2.2 研究方法

线型回归的目标是找到一个函数,能够将输入属性映射到输出属性或目标属性。

通过MATLAB 对数据进行处理,通过MATLAB 内部线性回归算法得到一次、二次、三次、四次、五次回归模型如下:

199520002005

201020152020

010********y

x

一次线性回归模型:y 1.6393276x =-

199520002005

201020152020

010********y

x

二次线性回归模型:25

0.1496598.8610y x x =-+? s

199520002005

201020152020

010********y

x

三次线性回归模型: 3257

y 0.00864851.9 1.03910 6.92610x x x =-+?-?

199520002005

201020152020

010********y

x

四次线性回归模型:434279

0.00047 3.79 1.14410 1.533107.70810y x x x x =-+-?+?-?

199520002005

201020152020

010********y

x

五次线性回归方程:554362912

y 8.398100.84213377 6.77310 6.79110 2.72410x x x x x -=-?+-+?-?+?

3. 模型的评估与选择

当模型的未知参数估计出来后,就初步建立了一个回归模型。建立回归模型的目的是应用它来研究问题,但如果直接用这个模型去做预测、控制和分析,是不够慎重的。因为这个模型是否真正揭示了自变量与因变量之间的关系,必须通过对模型的评估才能决定。通过验证集评估和验证最好的模型,同时也必须了解到拟合的三种误差:过拟合、训练误差、泛化误差。如果模型过于简单,就有较大的训练误差。如果模型过于复杂就有较大的泛化误差。 如果一个回归模型没有通过某种统计检验,或者通过了统计检验而没有合理的经济意义,就需要对回归模型进行修改

4. 结论

相关主题