简述低频分类数据的特点、形成原因及影响。


简述低频分类数据的特点、形成原因及影响。

正确答案:低频分类数据通常呈现出类别众多,并且很多类别仅有几个甚至一个样本的情况。低频分类数据形成原因大致可以分为两种:第一,真实的分类结果中确实存在低频分类。第二,采集数据时格式不规范或错误,从而形成一些频数极小(如仅有一个样本)的类别。过多的低频分类会严重影响建模的效率。


Tag:低频 数据 类别 时间:2024-03-21 12:26:09