最新 最热

【小白学习PyTorch教程】十五、通过PyTorch来创建一个文本分类的Bert模型

2018 年,谷歌发表了一篇题为《Pre-training of deep bidirectional Transformers for Language Understanding》的论文。

2022-08-18
0

【技术白皮书】第三章:文字表格信息抽取模型介绍——实体抽取方法:NER模型(上)

深度学习是一个由多个处理层组成的机器学习领域,用于学习具有多个抽象层次的数据表示。典型的层次是人工神经网络,由前向传递和后向传递组成。正向传递计算来自前一层的输入的加权和,并通过非线性函数传递结果。向后传递...

2022-08-17
0

【技术白皮书】第二章:OCR智能文字识别回顾——自然语言文本发展历程

从自然语言文本中获取结构化信息的研究最早开始于20世纪60年代中期,这被看作是信息抽取技术的初始研究,它以两个长期的、研究性的自然语言处理项目为代表。...

2022-08-16
1

大厂技术实现 | 爱奇艺文娱知识图谱的构建与应用实践 @自然语言处理系列

知识图谱是一种用图模型来描述知识和建模世界万物之间关联关系的技术方法。本文研究的是爱奇艺奇搜知识图谱的构建流程与应用场景,了解这一文娱行业知识图谱是如何帮助用户精确找到想要的内容、回答用户问题、以及理解...

2022-08-15
0

大厂技术实现 | 详解知识图谱的构建全流程 @自然语言处理系列

知识图谱(Knowledge Graph)的概念由谷歌2012年正式提出,旨在实现更智能的搜索引擎,并且于2013年以后开始在学术界和业界普及。目前,随着智能信息服务应用的不断发展,知识图谱已被广泛应用于智能搜索、智能问答、个性化推荐...

2022-08-15
1

OCR 【技术白皮书】第一章:OCR智能文字识别新发展——深度学习的文本信息抽取

信息抽取 (Information Extraction) 是把原始数据中包含的信息进行结构化处理,变成表格一样的组织形式。输入信息抽取系统的是原始数据,输出的是固定格式的信息点,即从原始数据当中抽取有用的信息。信息抽取的主要任务是将...

2022-08-15
1

大模型落地实践:同花顺大模型技术应用及优化

作者介绍:谌明,浙江核新同花顺网络信息股份有限公司首席技术官,浙江省金融信息工程技术中心副主任,之江实验室金融大数据智能计算实验平台专家;曾主持多个国家重点项目,总投入资金数亿元;发表 SCI/EI 高水平学术论文 20 余篇...

2022-08-11
0

NLP 论文领读|无参数机器翻译遇上对比学习:效率和性能我全都要!

检索式增强在各种自然语言处理任务中被广泛应用,其主要目的是基于一定的检索范式来利用现存数据,影响模型最终得到的结果,从而降低模型参数的负担。之前澜舟公众号已经发布了一篇相关的论文领读《别再第四范式:看看新热点...

2022-08-11
1

2020美赛C题解题思路(A Wealth of Data)[通俗易懂]

亚马逊在网购平台提供了两种功能:评级/星级(rate)、评估/评论(review)。个人评级称为“产品星级评估(star rating)”,也就是客户买完产品后的评价,由1星到5星;另外,购买产品的客户还能评论,表达自己的意见和信息。而其他客户...

2022-08-11
0

NLP︱高级词向量表达(二)——FastText(简述、学习笔记)「建议收藏」

1、NLP︱高级词向量表达(一)——GloVe(理论、相关测评结果、R&python实现、相关应用) 2、NLP︱高级词向量表达(二)——FastText(简述、学习笔记) 3、NLP︱高级词向量表达(三)——WordRank(简述) 4、其他NLP词表示方法paper:从符号到分布...

2022-08-10
0