检测假币

本练习的数据集来自加州大学欧文分校机器学习数据存储库,该存储库包含大量用于机器学习算法的数据集。本练习的原始数据集可从https://archive.ics.uci.edu/ml/datasets/banknote+authentication#获得。

我已经将数据集重组为这里可用的CSV文件。

原始数据集是通过拍摄真钞和假钞的照片,然后通过小波变换压缩这些图像来准备的。准备数据集的研究人员然后从每个压缩的输入图像中提取四个关键特征,然后将每个实例分类为真实的笔记或伪造的笔记。

你的任务

为该数据集构建分类模型,并确认简单的线性分类模型不足以成功分离这两个类。

接下来,使用多项式回归构造分类模型。成功分离这两个类所需的最小次多项式模型是什么?

最后,将多项式模型与Ridge回归结合起来,并证明仍然可以成功地分离这两个类。

到期日期

这份作业的截止日期是2月1日,星期四。