统计学习
Table of Contents
生成模型和判别模型
监督学习方法:生成方法、判别方法 生成方法:给定输入X产生输出Y的生成关系, 典型:朴素贝叶斯、隐马尔科夫 优点:可以还原出联合概率分布,学习收敛速度快,存在隐变量时,仍可以用 判别方法:直接学习决策函数或者条件概率分布作为预测的模型 优点:学习的准确率高,可以对数据进行抽象、定义并使用特征,简化学习问题
分类问题
包含学习和分类两个过程。 评价分类器的指标:分类准确率 二分类问题:精确率和召回率
标注问题
可以看作分类问题的一个推广,结构预测问题的简单形式 包含学习和标注两个过程。 常用方法:隐马尔科夫模型、条件随机场
回归问题
预测输入变量和输出变量之间的关系 函数拟合 最常用损失函数:平方损失函数 用最小二乘法求解