能够用机器学习机技术解决的问题称之为机器学习的"适定问题"。这个词我也是第一次听说,我理解适定就是适合的意思,也就是说机器学习适合什么样的问题,或者说什么样的问题能用机器学习解决。也就是在给机器学习下定义,而且跟解释什么是机器学习不用,这里用一个明确的范围来定义。
Well-posed Learning Problem
原文是:
A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.
译为 适定学习问题 ,是机器学习领域的核心定义。这个概念由 Tom Mitchell 在经典教材《Machine Learning》中提出,奠定了机器学习的理论框架 —— 机器学习的本质,就是通过经验提升任务性能的过程 。
通过经验提升任务性能的过程 。拆解为
| 要素 | 英文 | 含义 | 示例 |
|---|---|---|---|
| 任务 | T (Task) | 程序需要完成的具体目标 | 图像分类、房价预测、语音识别 |
| 性能指标 | P (Performance Measure) | 衡量任务完成好坏的标准 | 分类准确率、预测误差的均方根 |
| 经验 | E (Experience) | 程序用于学习的数据或交互信息 | 标注好的图像数据集、用户的历史点击记录 |
任务:就是你要干嘛
经验:就是你从哪儿知道怎么干
指标:就是你怎么知道你干的对不对或者好不好。
这个定义明确了 什么样的问题可以用机器学习解决 :只有同时具备 T、P、E 三个要素,且性能能随经验提升的问题,才是 “适定” 的机器学习问题。
比如 “用历史销售数据预测未来销量” 就是典型的适定问题,而 “生成一首无规则的诗” 若没有明确的性能指标 P,则不属于这个范畴。
反例:为什么 “写一首诗” 不算典型的适定学习问题?
- 任务 T:写一首诗 → 看似明确,但 “好诗” 的标准太主观
- 性能指标 P:没法量化(有人觉得押韵就是好,有人觉得意境才重要,没有统一的 P)
- 经验 E:就算给一堆诗当素材,程序写出来的诗也没法用一个指标判断 “变好” 了