简述低频分类数据的特点、形成原因及影响。
简述低频分类数据的特点、形成原因及影响。
正确答案:低频分类数据通常呈现出类别众多,并且很多类别仅有几个甚至一个样本的情况。低频分类数据形成原因大致可以分为两种:第一,真实的分类结果中确实存在低频分类。第二,采集数据时格式不规范或错误,从而形成一些频数极小(如仅有一个样本)的类别。过多的低频分类会严重影响建模的效率。
- 上一篇:简述等宽法的适用情况。
- 下一篇:请简述使用相关系数选择变量的思想和步骤。
简述低频分类数据的特点、形成原因及影响。
正确答案:低频分类数据通常呈现出类别众多,并且很多类别仅有几个甚至一个样本的情况。低频分类数据形成原因大致可以分为两种:第一,真实的分类结果中确实存在低频分类。第二,采集数据时格式不规范或错误,从而形成一些频数极小(如仅有一个样本)的类别。过多的低频分类会严重影响建模的效率。