什么样的问题可以用机器学习技术解决


能够用机器学习机技术解决的问题称之为机器学习的"适定问题"。这个词我也是第一次听说,我理解适定就是适合的意思,也就是说机器学习适合什么样的问题,或者说什么样的问题能用机器学习解决。也就是在给机器学习下定义,而且跟解释什么是机器学习不用,这里用一个明确的范围来定义。

Well-posed Learning Problem

原文是:

A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E.

译为 适定学习问题 ,是机器学习领域的核心定义。这个概念由 Tom Mitchell 在经典教材《Machine Learning》中提出,奠定了机器学习的理论框架 —— 机器学习的本质,就是通过经验提升任务性能的过程

通过经验提升任务性能的过程 。拆解为

要素 英文 含义 示例
任务 T (Task) 程序需要完成的具体目标 图像分类、房价预测、语音识别
性能指标 P (Performance Measure) 衡量任务完成好坏的标准 分类准确率、预测误差的均方根
经验 E (Experience) 程序用于学习的数据或交互信息 标注好的图像数据集、用户的历史点击记录

任务:就是你要干嘛

经验:就是你从哪儿知道怎么干

指标:就是你怎么知道你干的对不对或者好不好。

这个定义明确了 什么样的问题可以用机器学习解决 :只有同时具备 T、P、E 三个要素,且性能能随经验提升的问题,才是 “适定” 的机器学习问题。

比如 “用历史销售数据预测未来销量” 就是典型的适定问题,而 “生成一首无规则的诗” 若没有明确的性能指标 P,则不属于这个范畴。

反例:为什么 “写一首诗” 不算典型的适定学习问题?

  • 任务 T:写一首诗 → 看似明确,但 “好诗” 的标准太主观
  • 性能指标 P:没法量化(有人觉得押韵就是好,有人觉得意境才重要,没有统一的 P)
  • 经验 E:就算给一堆诗当素材,程序写出来的诗也没法用一个指标判断 “变好” 了

评论