一、产品介绍:
自然语言处理(Natural Language Process,简称NLP),是一款基于人工智能技术,为各行各业的企业和开发者提供的针对文本智能化分析及处理的云服务,意在帮助用户高效处理文本数据,实现数字化和智能化转型。
腾讯云自然语言处理(Natural Language Process,NLP),前身为腾讯文智自然语言处理,现经过全新升级,正式发布v1.0版本。
产品深度整合了腾讯内部(包括AI Lab,信息安全团队、AI平台部、翻译君和知文团队自研等)优秀的 NLP 前沿技术,依托于海量中文语料累积,全面覆盖了从基础到高级的智能文本处理能力。
其中,
- 基础版包括词法分析、句法分析、篇章分析、向量技术、情感分析、文本纠错、文本分类等;
- 高级版包括敏感词识别、文本审核等。
现阶段,为感谢合作伙伴和新老客户的信任和支持,当前产品公测免费,公测截止时间为2019年11月1日。
【快速链接】
1- 腾讯云自然语言处理产品介绍:https://cloud.tencent.com/product/nlp
2- 腾讯云自然语言处理产品文档:https://cloud.tencent.com/document/product/271
3- 腾讯云自然语言处理 API文档:https://cloud.tencent.com/document/product/271/35484
二、产品功能:
产品全面覆盖了从词法、句法到篇章级别等各个粒度的NLP能力。
其中,
- 词法分析包括智能分词、词性标注、命名实体识别等;
- 句法分析包括句法依存分析、文本纠错、句向量等;
- 篇章分析包括情感分析、关键词提取、文本分类、自动摘要、敏感词识别、文本审核等。
(一)、词级别的自然语言处理功能
1-词法分析(LexicalAnalysis)
- 提供智能分词(基本词和短语)、词性标注、命名实体识别功能。
- 专业的团队对数据、模型、程序进行迭代更新以保证识别效果的不断提升。
- 用户只需简单调用相关 API 接口即可获取到所需结果,无需担心例如新词发现、歧义消除、调用性能等词法分析的难题。
2-同义词/相似词(SimilarWords)
- 为用户提供同义词查询服务。
- 团队通过全网数据挖掘出海量同义词,并持续对数据、模型等进行迭代更新,保证同义词的效果始终与时俱进。
- 未来用户也可以通过提供产品专有的数据,与我们合作打造专属的同义词库。
词级别的自然语言处理功能还包括:词向量(WordEmbedding),词相似度(WordSimilarity)等。
(二)、句子级别的自然语言处理功能
3-文本纠错(TextCorrection)
- 能够实现对文本的自动纠错,即对一句话或一段话中的错别字(错别词)进行自动纠错。
- 用户只需要提供业务数据和日志, 无需关注技术细节和更新流程, 就可以享受到业务自身定制的纠错服务,甚至能不提供业务数据,享受通用的纠错服务。
- 在办公文档审核、文本智能质检等场景有广泛的应用。
句子级别的自然语言处理功能还包括:句法依存分析(DependencyParsing),句向量(SentenceEmbedding),句相似度(SentenceSimilarity)等。
(三)、篇章级别的自然语言处理功能
4-情感分析(SentimentAnalysis)
- 为有情感分析需求的产品提供服务。
- 该服务能够对文本信息情感上的正向、负向及中性进行评价。
- 在舆情监控、话题监督、口碑分析等商业分析领域有非常重要的应用价值。
5-关键词提取(KeyWordsExtraction)
- 基于关键词抽取平台,提取一句话或一段话中体现关键信息的词,为用户实现例如新闻内容关键词自动提取、评论关键词提取等基础服务。
- 未来还将支持用户自定义词典,提高在垂直领域的抽取效果。
- 该功能支持的场景包括新闻和内容媒体信息抽取、金融场景文档结构化抽取等。
6-敏感词识别(SensitiveWordsRecognition)
- 识别文本信息中的广告,以及信息的色情、政治等敏感程度,并返回对应的敏感词。
- 可用于敏感信息过滤、舆情监控、UGC文本数据审核等。
篇章级别的自然语言处理功能还包括:自动摘要(AutoSummarization),文本分类(TextClassification),文本审核(TextApproval)等。
(四)、更多自然语言处理功能
腾讯云NLP还提供更多的功能,详情请参阅API文档:https://cloud.tencent.com/document/product/271/35484
Reference:
https://cloud.tencent.com/document/product/271/3317
https://cloud.tencent.com/developer/article/1461687