1、引言
在进行自然语言处理(NLP)处理的时候,基本的操作无外乎分词、分类、聚类、命名实体识别、规则过滤、摘要提取、关键字提取、词性标注、拼音标注等。
分类通用的做法就是根据提供的语言库自学习识别成对应的分类。现有的复旦大学提供的语料库有20种分类。(参考:http://www.nlpir.org/?action-viewnews-itemid-103),网上也有提供更多种分类的。
分词网上比较NB的几个实验室有:
1)、背景理工大学张华平副教授的 nlp 自然语言处理与信息共享检索平台http://ictclas.nlpir.org/nlpir/。
2)、哈工大“语言云” 以哈工大社会计算与信息检索研究中心研发的 “语言技术平台(LTP)” http://www.ltp-cloud.com/demo/。
(本段摘自网络)文本分类
继续阅读与本文标签相同的文章
上一篇 :
优化网络和应用性能必知的三个经典响应时间点
-
Python3入门(八)模块
2026-05-24栏目: 教程
-
RocketMQ问题排查思路
2026-05-24栏目: 教程
-
maxCompute(ODPS)问题排查思路
2026-05-24栏目: 教程
-
K8S实践 - Promethues从VM迁移K8S实录
2026-05-24栏目: 教程
-
借助URLOS快速安装MySQL 5.6
2026-05-24栏目: 教程
