项目经验


1 NER

1.1 提升效果的方式

  1. 对于两种相似实体,加入两种实体同时识别,效果比人为去除一类实体更好,直觉上看模型学习两者的差距,更好的区分两者
  2. 过多的负样本(无实体)会导致模型效果变差,因为模型过多地关注是负样本,而无法识别样本
  3. 在实体识别任务中,cased的预训练模型效果优于uncased模型,因为可以通过大小写区分实体

2 TextClassify

2.1 提升效果的方式

  1. 对于具有长尾问题的文本分类,引入加权loss函数有助于提升模型性能
  2. BERT-RCNN对于文本分类的效果是不错的,相比于BERT-CNN、BERT-DPCNN、BERT-RNN、BERT-base

文章作者: fdChen
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 fdChen !
评论
  目录
加载中...