中新天津生态城是中国、新加坡两国政府战略性合作项目。生态城市的建设显示了中新两国政府应对全球气候变化、加强环境保护、节约资源和能源的决心,为资源节约型、环境友好型社会的建设提供积极的探讨和典型示范。
作为中国、新加坡两国政府间试点的智慧城市项目,中新天津生态城凭借丰富的智慧建设成果,已经成为天津市智慧城市建设的标杆。在此背景之下,生态城发布《中新天津生态城智慧城市发展白皮书》,以“善政、惠民、兴业”为目标巩固生态城建设,有着精准招商引资、主动服务企业、区域经济分析的进一步需求。
基于这样的需求,中新天津生态城产业大脑项目应时而生。爱数AnyDATA作为其中重要的一环,起着承上启下的作用,通过汇总内外部海量数据,生成知识网络,形成产业大脑,实现“手里有一本账,心中有一盘棋,眼前有一张图”的美好愿景。通过产业大脑这个百事通,助力生态城精准招商引资、主动企业服务,实现智慧营商!
实施时间:
开始时间:2021年6月
截止时间:2021年12月
应用场景 基于当前智慧城市产业发展中的痛点,聚焦于智慧城市营商环境三大核心应用,作为产业大脑贯穿智慧城市“产业-招商-服务”全环节。
① 产业招商引资。汇聚外部企业工商数据、专利数据、招投标数据、业务数据、舆情数据、风险数据,对企业进行多维度分析,为企业制定360°画像。结合知识图谱技术,深度研究行业、企业业务,基于产品标签集相似度,寻找同类企业,对比评估企业实力,寻找隐形冠军。
② 产业与经济分析。根据企业产业标签管理,了解生态城产业结构,紧跟国家发展战略目标;通过多维度分析,了解各产业发展情况,掌握产业增长与下降趋势,以及影响产业发展走势的主要企业;收集宏观经济与区域经济数据,并进行对比,掌握经济发展差距,为宏观调控提供支持。
③ 企业主动服务。从企业入驻起对企业进行全生命周期管理。对标同行上市企业画像,判断企业发展方向、可能遇到的问题,进行主动培育服务。同时,基于政策试算器,向政策管理用户提供政策匹配企业列表、企业兑现情况清单。
面临挑战 中新天津生态城是中国、新加坡两国政府间重大合作项目,是世界上首个国家间合作开发的生态城市。当前,生态城正加快实施“生态城市升级版”和“智慧城市创新版”双轮驱动发展战略,全力打造“产城融合示范区、绿色发展示范区、智慧城市示范区、国际合作示范区”,努力建设宜居宜业宜游的美丽滨海之城。然而在智慧城市的产业发展中,还面临一系列的挑战。
智慧城市产业发展的痛点:粗放的产业布局、招商引资与企业服务
产业规划与分析:缺乏执行大盘。出现有产业规划和战略,但没有产业链和数据支撑。有总体的数据,但缺乏产业深度分析。有竞争城市/园区,但没有系统性比对分析。有头部企业,但不知腰部和潜力股。
产业招商引资:粗放、单薄。出现有产业招商方向,但没有产业链,导致招商缺乏针对性。有招商标的,但是企业分析缺乏职支撑数据、局限性大。有待招商优质企业,但是缺乏企业能力的智能评估。
产业扶持与企业服务:出现有政策扶持,但无法充分进行利用。有营商服务,但无法主动为企业提供全面、个性化服务。
数据支持 目前市面上的数据产品是没有上下游关系,上下层关系的,不能发现产品关联关系。不能分析产品上下游影响关系,并且产品没有和国民经济行业关联,不能通过国民经济统计精准统计产业链的企业。
爱数AnyDATA产业知识网络数据,具有产品上下游、上下层关系、国民经济行业和产品关联关系以及产品和企业关联关系,能够通过知识网络自动分析产品上下游影响关系,解决国民经济、产业概念精准统计。
囊括全部产业主体:3200万全国基础企业,75万核心产业企业,全部上市企业数据,包括企业工商数据、财务数据、知识产权数据、司法诉讼数据、企业资质数据、招投标数据、企业产品、企业投融资等数据;
独特的产业数据网络:基于国民经济分类4层扩展到10层产品体系;5000多个产品横纵层级、产品与国民经济对应关系、产品和企业的对应关系数据网络。
应用技术与实施过程 一、总体架构
本次建设内容主要包括1个产业知识网络、3个能力平台、6项智慧应用、21个子模块。其中:3个能力平台包括:企业主动服务平台、经济运行分析平台、产业精准招商平台,6项智慧应用包括:企业主动服务、企业画像、区域经济分析、区域产业分析、精准招商引资、产业与企业服务,21个子模块包括:政策兑现、精准匹配、资本市场培育、企业服务门户、政策搜索、产业晴雨表、产业标签统计分析、区域产业要素分析与研判、区域产业政策及要素比对、区域经济驾驶舱、经济标签统计分析、自定义产业财税分析、区域产业要素与招商标的对比分析、产业链招商、以商招商、企业关系图谱、企业业务图谱、企业实力指数、企业风险分析、信用活力报告、生命周期服务。下面是平台总体架构:
二、AnyDATA知识网络总体架构
如图所示,AnyDATA 支持不同种类的数据源,包括 AnyShare 内容云,AnyRobot 日志云以及主数据库和数据湖(大数据平台)。在平台中,分为如下几个层次:
1) 语言模型层:由于知识网络的基础是知识、三元组等信息,而语言是人类智能的载体,语言模型的目标就是能够让机器能够处理和计算人类的知识。这部分,包含了基于海量通用型数据的内置基础语言模型,以及可以根据实际应用场景定制的语言模型;
2) 数据知识化:提供了多种方式,包括语言模型训练、智能辅助标注、迁移学习模型、知识抽取模型、知识融合模型等方式来实现启发式的知识图谱构建;
3) 知识层:为了实现一个智能应用,需要有一系列的或人工指定的知识或通过机器学习获得的知识表达形式来支撑,这部分包含了知识图谱、决策树、概率图和领域数据服务的支持;
4) 知识化分析,有了上述的几类之后,就可以基于这些知识进行各个场景的分析及运算,下文中有比较详细的描述。
知识网络生成的业务逻辑
知识网络生成过程是一个非常复杂的系统工程,需要一整套的业务逻辑来进行支撑。
知识网络生成需要多种数据源的参与,对于不同种类的处理又能也有比较大的差异,对于结构化数据而言,用户可以直接根据结构化数据的模型(Schema)选择需要的数据,再根据自己的需要来构建知识网络的模型(也就是本体模型)即可。
对于内容数据实现知识网络生成则更加复杂一些,需要使用机器学习模型来进行数据的抽取,而这些模型可以来自用户自训练模型或者是内置的模型。
生成知识网络的过程中,还有一部分的数据也非常重要,那就是领域数据服务,对于各行各业而言都有自己的行业专属的、相对通用的知识,例如本项目中的产业知识网络,就是利用了产业图谱数据服务,来配合本地数据生成的知识网络获取更多的知识,满足不同的应用场景。
有了这个知识网络之后,就可以将知识网络应用于不同的领域。
三、总体技术架构
1、应用框架
系统在应用层面可采用符合 J2EE(java 2 Platform Enterprise Edition)技术规范。整个系统运行于应用服务器之上,利用应用中间件支撑系统的运行。
J2EE 是 Java 2 Enterprise Edition 的简称,它继承了 Java 平台无关性的特点,用户不必将自己捆绑在某一种硬件或操作系统上,可以根据自身的情况选择合适的硬件、操作系统、数据库。J2EE 是一种功能完备、稳定可靠、安全快速的企业级计算平台,它由多种基于 JAVA 的技术组成,包括 Portlet,EnterpriseJavaBeans(EJB) , JavaServer Pages(JSP) , servlets , Java Naming and Directory Interface(JNDI), Java Transaction API(JTA), CORBA, JDBC API 等。
2、SOA 面向服务
建设建议采用 SOA 松耦合方式构建业务应用层、应用支撑层,增强系统之间交互性,避免重复建设,节约政府投资,加快系统建设进程:
1) 以服务的形式提供独立的、可复用的、自动化的服务组件;
2) 通过快速组合与松散耦合来提高应用搭建效率,节约建设成本;
3) 通过业务流程数据的收集及流程风险评估,建立标准的业务模型, 在实际业务应用建立过程中,与标准流程进行比对,如不合理,则进行流程再造。
3、WebService 技术
Web Service 是一种以 SOAP 为轻量型传输协议、以 XML 为数据封装标准、基于 HTTP 的组件集成技术。
Web Service 主要是为了使原来各孤立的站点之间的信息能够相互通信、共享而提出的一种接口。Web Service 所使用的是 Internet 上统一、开放的标准, 所以 Web Service 可以在任何支持这些标准的环境(Windows,Linux)中使用。Web Service 技术有助于大量异构程序和平台之间的互操作性,从而使存在的应用程序能够被广泛的用户访问。
Soap 技术是 Web Service 的核心,它以 XML 的标准格式封装数据包,其中封装的沟通信息是以文本方式来表达的,并且遵循标准的封装规则。这意味着任何组件模型、开发工具、程序语言和应用系统只要支持 XML 和文本格式的数据,就可以顺利的使用该技术。
四、业务功能与关键技术
以产业链、企业图谱为中心的大规模知识网络:
产业链图谱及精准招商:以产品上下游、上下层为关系构建的5000多个产品价值链图谱,并与国民经济、战略新兴产业实现有机对接,可以实现对产业链精准分类和关联分析;
企业图谱:基于工商、知识产权等公开数据,构建企业集团关系链、市场布局、产品业务链,实现企业链的精准定位和分析;
产品竞争图谱:基于企业产品标签集相似度构建竞争网络,寻找细分领域隐形冠军;
政策图谱与规则知识库:省市区多级政策要素自动抽取,形成分类、分级的政策要素与政策适用规则库,以便政策的自动精准匹配推荐;
产业及经济运行预测分析:基于产业链、企业链及其他产业要素动态事件的可视化推理及关联分析预测;
投融资雷达:基于投融资事件知识与企业链、产业链的匹配,实现焦点招商、以商招商(园区关联企业的投融资线索)。
平台本地部署,数据按需动态更新:
本地部署大数据平台及AnyDATA知识网络平台,服务于外部数据与内部数据的知识网络构建、知识推理分析,对接上层企业服务平台、产业与经济分析应用、产业链精准招商应用;
互联网、外部数据采用订阅模式,按T 1节奏动态更新,包括产业舆情、企业工商、知识产权、招投标等数据。
本项目中涉及的关键技术包括:
十亿级知识网络构建技术:基于自然语言处理的知识抽取及融合,对企业工商、企业政策、知识产权、产业舆情、招投标等内容,通过自然语言处理进行命名实体、关系的识别,并结合图谱已有命名实体和词库进行知识抽取和融合等等,形成了一个十亿级规模的产业知识网络。
大规模知识推理和分析技术:基于5000 全行业产业链图谱、企业图谱、产业事件知识图谱、知识产权知识图谱等,并结合政策规则知识库,形成千万级图谱内搜索分析、图谱间联动分析的大规模知识推理分析技术框架。
外部合作 中新天津生态城产业大脑项目,定制化模块内容方面拓维主要配合爱数一起调研需求,开发系统模块,配合系统上线等工作。一起调研功能模块需求,推进项目进度,确保项目交付,为客户提供优质的质量和服务保障。
拓维在项目中主要负责项目定制化功能模块的需求调研、开发、系统培训、系统试运行、系统上线以及后期的运维工作。定制化模块含:政策兑现、资本市场培育、企业服务门户、区域经济驾驶舱、经济标签统计分析、自定义财税分析、区域企业生命周期管理。
商业变化 寻找细分领域的隐形冠军,解精准招商引资之困
基于大数据、人工智能技术构建智慧城市企业和营商知识网络,洞悉产业的发展趋势,为企业制定360°画像,客观分析企业的隐藏关系,为政府挖掘符合生态城主导产业招商的目标企业与人才。提升招商引资效率,创新招商引资模式,系统性的提升生态城企业营商环境,将生态城产业发展态势以直观数字化形式进行展示,实现了产业链精准招商、以商招商和招商标的的精准分析,提升区域产业政策竞争力。
惠企政策主动化、便利化,解主动服务企业之困
利用人工智能、自然语言处理技术,构建了政策图谱和推荐引擎,让经济政策精准匹配企业,发挥经济政策的价值,助力政府打造良好营商环境。同时,为企业提供了定制化问答、实时匹配政策、一站式政策兑现、全过程服务跟踪和分析,提升企业全生命周期的服务体验,实现跨系统的政策汇总、匹配计算、通知送达、申报等全链路辅助。结合企业服务平台,利用智能外呼技术,主动打电话给企业,收集企业反馈。
从‘企业找政策’到‘政策找企业’,精准匹配,及时送达,智能回访,降低企业经营成本,提高政府主动服务能力。
多因素、动态化预测,解区域经济分析之困
以产业为中心,以时间和空间两个维度,构建经济分析和预测模型,结合招商、产业要素、国内外环境因素,实现多因素经济联动分析预测,动态反应经济变化情况,对未来经济形式预先态势感知,为领导决策提供支撑;为塑造智慧营商环境,提供核心竞争力。