1 NER
1.1 提升效果的方式
- 对于两种相似实体,加入两种实体同时识别,效果比人为去除一类实体更好,直觉上看模型学习两者的差距,更好的区分两者
- 过多的负样本(无实体)会导致模型效果变差,因为模型过多地关注是负样本,而无法识别样本
- 在实体识别任务中,cased的预训练模型效果优于uncased模型,因为可以通过大小写区分实体
2 TextClassify
2.1 提升效果的方式
- 对于具有长尾问题的文本分类,引入加权loss函数有助于提升模型性能
- BERT-RCNN对于文本分类的效果是不错的,相比于BERT-CNN、BERT-DPCNN、BERT-RNN、BERT-base