And hello to u too:) Click the icon above for more detail

西瓜

成品笔记

第一章:绪论

1.1 引言 & 1.2 基本术语

1.3 假设空间

1.4 归纳偏好 Inductive Bias

1.5 发展历程和1.6应用现状

课后习题

1.1 表1.1中若只包含编号为1和4的两个样例,试着给出相应的版本空间

1.2 使用最多包含k个合取式的折合范式来表达西瓜分类问题的假设空间,估算共有多少种可能的假设。

1.3 若数据包含噪声,则假设空间中有可能不存在与所有训练样本都一致的假设。在此情形下,试设计一种归纳偏好用于假设选择

第二章 模型评估与选择

2.1 经验误差与过拟合

所以只要相信\( P != NP \),那么过拟合就无法避免

2.2 评估方法

2.2.1 留出法

- 简单的将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T,用训练集训练模型,用测试集来近似估计泛化误差

2.2.2 交叉验证法(K-fold cross validation)

2.2.3 自助法 bootstrapping

$$

\begin{aligned}

\lim_{m\to\infty} (1-\frac{1}{m})^m = \frac{1}{e} \approx 0.368

\end{aligned}

$$

2.2.4 调参与最终模型

整个训练和测试的流程:给结果的流程是划分数据集(训练集和测试集)-> 训练数据集 -> 评估数据集 -> 调参 -> 重新训练或确定参数 -> 给整个数据集D上面把参数确定好的模型重新训练 -> 提交用户

2.3 性能度量(Performance measure)

\[\begin{aligned} E(f;D) = \frac{1}{m} \sum_{i=1}^{m}(f(x_i)-y_{i})^2 \end{aligned}\]