项目功能
目前知识图谱在各个行业中应用逐步打开,尤其在金融,医疗,法律,旅游方面.知识图谱助力法律智能,能够在一定程度上利用现有大数据以及机器学习/深度学习与自然语言处理技术,提供一些智能的解决方案.本项目将完成两个大方向的工作:
1, 以罪名为核心,收集相关数据,建成基本的罪名知识图谱,法务资讯对话知识库,案由量刑知识库.
2, 分别基于步骤1的结果,完成以下四个方面的工作:
- 基于案由量刑知识库的罪名预测模型
- 基于法务咨询对话知识库的法务问题类型分类
- 基于法务咨询对话知识库的法务问题自动问答服务
- 基于罪行知识图谱的知识查询
代码下载地址
关注微信公众号 datayx 然后回复 法务 即可获取。
AI项目体验地址 https://loveai.tech
罪名法务智能项目,内容包括856项罪名知识图谱, 基于280万罪名训练库的罪名预测,基于20W法务问答对的13类问题分类与法律资讯问答功能.
罪名预测
1, 问题类型: 罪名一共包括202种罪名,文件放在dict/crime.txt中, 详细内容举例如下:
2, 问题模型: 罪刑数据库一共有288万条训练数据,要做的是202类型的罪名多分类问题.本项目采用的方式为:
3, 效果: 执行 python crime_classify.py
法务咨询问题分类
1, 问题类型: 法务资讯问题一共包括13类,详细内容如下:
2, 问题模型: 法务咨询数据库一共有20万条训练数据,要做的是13类型咨询问题多分类问题.本项目采用的方式为:
3, 效果: 执行 python question_classify.py
法务咨询自动问答
运行 python crime_qa.py
总结
1, 本项目实现的是以罪刑为核心的法务应用落地的一个demo尝试. 2, 本项目采用机器学习,深度学习的方法完成了罪名预测,客服问句类型预测多分类任务,取得了较好的性能,模型可以直接使用. 3,本项目构建起了一个20万问答集,856个罪名的知识库,分别存放在data/kg_crime.json和data/qa_corpus.json文件中. 4, 法务问答,可以是智能客服在法律资讯网站中的一个应用场景落地. 本项目采用的是ES 语义相似度加权打分策略实现的问答技术路线, 权值计算与阈值设定可以用户指定. 5, 对于罪名知识图谱中的知识可以进一步进行结构化处理,这是后期可以完善的地方. 6, 如何将罪名,咨询,智能研判结合在一起,形成通路,其实可以进一步提升知识图谱在法务领域的应用.