机器学习训练的主要流程:

image-20230319170611582

机器学习中的关键组件⚙

⚙组件 注释
📊数据 数据集由一个个样本(example, sample)组成;遵循独立同分布(independently and identically distributed, i.i.d.);每个样本由一组称为特征(features,或协变量(covariates))的属性组成。 机器学习模型会据此性进行预测;数据集包括训练集(training dataset)、验证集(val dataset)和测试集(test dataset)。
📐 模型 模型是用来转换数据的,由神经网络错综复杂地交织在一起。
🎯 目标函数 也被称为“损失函数”,用来量化模型的有效性。大多数情况是“可优化”的;
预测数值时,最常见的损失函数是平方误差(squared error),即预测值与实际值之差的平方;
解决分类问题时,最常见的目标函数是最小化错误率,即预测与实际情况不符的样本比例。
🗝 优化算法 用于搜索最佳参数,以最小化损失函数。基本方法——梯度下降法(gradient descent)

各种机器学习问题

监督学习(supervised learning)

  • 回归问题(regression)

    任何有关“有多少”的问题很可能是回归问题,其目标是生成一个模型,使它的预测值非常接近实际标签值。

    例如:你让人修理了排水管,承包商花了3小时清除污水管道中的污物,然后他寄给你一张350美元的账单。 而你的朋友雇了同一个承包商2小时,他收到了250美元的账单。 如果有人请你估算清理污物的费用,你可以假设承包商收取一些基本费用,然后按小时收费。 如果这些假设成立,那么给出这两个数据样本,你就已经可以确定承包商的定价结构:50美元上门服务费,另外每小时100美元。 在不经意间,你就已经理解并应用了线性回归算法。

  • 分类问题(classification)

    有关“哪一个”的问题很可能是分类问题,其目标是训练出一个分类器来预测样本属于哪个类别。

    这类问题可以分为二项分类(binomial classification)多项分类(binomial classification)两大类,其常见的损失函数被称为交叉熵(cross-entropy)

  • 标注问题(Annotation)

    有时我们希望模型描绘输入图像中的内容,比如:包含一只鸡、一只狗和一只猫。

    学习预测不相互排次的类别的问题成为多标签分类(multi-label classification)

  • 搜索问题(search)

    搜索引擎会使用机器学习和用户行为来获取网页相关性的评分。

  • 推荐系统(recommender system)

    对于任何给定的用户,推荐系统都可以检索得分最高的对象集,然后推荐给用户。其缺陷在于:因为用户更倾向于给感觉强烈的参评打分,但所以单独使用其作为预测模型会导致数据中只包含“审查后的反馈”;因为系统会优先推送购买量较大的产品,所以可能会形成反馈循环

  • 序列学习(Sequence)

    序列学习的输入样本是连续的,如:音频、视频等。我们期望训练的模型具有“记忆”功能,如视频样本,通过前一帧的图像,我们可能对后一帧中发生的事情更有把握。

    ❓问题 ❕注解
    标记和解析 基于文本结构和语法假设对文本进行分解,以获得一些注释
    自动语言识别 输入序列是说话人的录音,输出序列是说话人所说内容的文本记录
    文本到语音 输入是文本,输出是音频文件
    机器翻译 不同于语音识别,在机器翻译中颠倒输入输出的顺序非常重要。 虽然机器翻译也是将一个序转换成另一个序列,但输入和输出的数量以及相应序列的顺序大都不会相同

无监督学习(unsupervised Learning)

⚙问题 注解
聚类(clustering) 在没有标签的情况下,将样本分成某几大类,如:风景、动物、工具等。
主成分分析(PCA) 找少量的参数来准确捕捉数据的线性相关属性
因果关系(CP) 根据统计数据,来发现各类数据之间的关系
生成对抗网络(GAN) 一种合成数据的方法,甚至对于像图像和音频这样复杂的非结构化数据。
潜在的统计机制是检查真实数据和虚假数据是否相同的测试

强化学习(Reinforcement Learning)

image-20230319192839845

  • 环境被完全观测的强化学习问题,称为马尔可夫决策过程(Markov decision process)

  • 状态不依赖之前的动作,这类强化学习问题,称为上下文老虎机(contextual bandit problem)

  • 只有一组最初未知奖励的可用动作的强化学习问题称为多臂老虎机(multi-armed bandit problem)