背景-第四范式
第四范式就是给各行各业提供人工智能技术与服务的。愿景是能够基于行业应用场景及痛点,用机器学习技术开发出解决方案,为企业提升商业价值,找到下一个增长点,提升企业竞争力。目前主要覆盖的行业是金融和互联网。还积极参与了糖尿病,生物基因等公益项目的科研,未来希望覆盖到各行各业,让每个人都享受到人工智能带来的红利。
主打产品:“先知”(Prophet)平台
先上一张产品图感受一下
需求定位
面向痛点:
- 企业定制化AI系统门槛太高、代价太大
- AI团队构建太慢,人才培养平均耗时6-10年
先知系统特色:AI应用开发平台,集成深度学习、强化学习、迁移学习、记忆网络等;技术实力超越30个顶尖数据科学家;业界独有的发明专利;百余个成功案例;面向主要行业:金融、电信、互联网等。
“第四范式先知”定位于企业级AI核心系统,由数据核心、算法核心、生产核心三大模块组成,覆盖了人工智能在生产中的各应用环节,在进一步降低AI开发门槛的同时,亦让企业挖掘AI需求及应用AI更为简单高效,帮助企业在AI时代从战略、策略到执行全面智能化。
三大核心
- 数据核心:集数据接入与处理、数据管理与访问于一身。支持结构化与非结构化的数据接入与处理,并产生海量高维特征,保证特征数据高速获取的同时,将数据接入的时效性从T 1/T N提升为毫秒级。
- 算法核心:提供高维机器学习与深度学习训练、基于深度学习的高维特征生成、图像文本以及图关系的高维特征挖掘等决策能力生成算法;自动模型选择、自动调参、特征组合自动探索等降低机器学习成本及门槛的协助算法,并围绕NLP、知识图谱,提供多种核心基础服务及应用服务。
- 生产核心:私有PaaS架构,将数据服务、算法任务、线上服务等基础能力服务化,通过SDK接口调用,快速将服务转化为具备高可用、可伸缩、可监控的应用程序。具备模型管理、灰度发布、多租户、资源隔离、审计支持等企业级关键特性。
六大系统优势
端到端
- 丰富、易用的机器学习模型调研功能,覆盖从数据处理到特征工程到建模及评估优化的全过程,支持业界主流机器学习算法
- 模型支持一键部署,支持以离线批量和在线实时等方式满足实际应用需求
- 基于不断产生的业务数据进行模型自学习,提供持续稳定的效果提升
高VC维模型
- 机器学习算法的能力取决于模型的“VC维”。第四范式先知可采用高维度复杂模型,最终模型特征数量可达到上千亿
- 自主研发专为机器学习而生的算法引擎。随着数据量上升,引擎运算效率接近线性增长,并确保在高效并行时快速收敛
实时计算和预估
- 基于分布式内存数据库的实时线上数据处理,提供高性能实时表拼接,时序特征生成等功能
- 支持多种算法模型的实时预估,特征工程免开发迁移,企业级高可用架构,毫秒级响应,按需灵活扩展
破除人才壁垒
- 友好的图形交互界面,用户可通过拖拽方式零编码定义建模全过程
- 多项专利算法,如高维离散嵌入式树网络算法、线性分型分类算法等,高效利用样本数据,即使不做特征工程也能获得最佳模型
- 自动调参,自动特征工程等多种专利技术,让用户无需深入理解算法原理,系统可以帮您选出最佳配置
建模效率高
- 自主研发兼顾开发效率与运行效率的分布式模型训练框架,TB级数据规模下,模型训练速度达spark万倍,更快获得有效模型
- 将常用、有效的数据处理过程进行产品化封装,只需简单配置即可对原始数据表进行复杂计算与处理,将数据科学家在数据处理工作上的工作量减少80%
- 计算过程全部运行于分布式计算引擎之上,平台对引擎进行了多项数据处理执行优化,数据处理速度为单机平台的数百倍
企业级平台
- 可在x86服务器上运行,兼容企业级Linux操作系统与Hadoop商业发行版,充分保护企业已有投资
- 支持SaaS、私有云、私有部署等多种安装部署方式
- 提供用户权限、用量额度管理、模型版本管理与运维等企业级功能,满足IT管理与数据安全的需求。
- 组件式产品架构,可根据企业需求灵活裁剪与组合,满足业务定制化需求
应用场景
- 反欺诈:基于交易相关数据和用户历史行为建立模型,识别交易欺诈行为,并基于第四范式先知预估平台的流数据处理能力和实时预估能力,实现在线实时交易反欺诈。
- 个性化推荐:基于用户行为历史,在线实时提供最有针对性和时效性的个性化内容、产品或知识推荐。应用场景相对广泛,如理财产品推荐、直播类APP付费内容分享APP、媒体平台及新闻APP的内容推荐等。
- 产品定价:预测客户对于不同价格策略的敏感度和响应度,实现个性化价格与优惠策略,确保总利润提升。
- 精准营销:通过模型预测客户对于短信推送产品的响应率,从而对高响应率客户进行精准营销。基于第四范式先知预估平台,可实现离线批量营销与在线实时营销。自学习平台确保精准度不衰减。
- 智能制造:利用人工智能技术,优化制造业的生产流程。通过机器学习模型做到个性化生产、产能预测和供应链管理,节省耗材、提高利润,提高企业竞争力。
- 计算广告:机器学习于互联网广告领域的应用非常成熟,在BAT公司均得以成功实践。核心解决特定语境下特定用户和广告之间“最佳匹配”问题,通过预估广告点击率,提升数据价值和流量变现效率。
- 客户运营:基于客户历史行为与习惯数据,提供更精准客户服务,提升运营效率。如潜在客户识别、客户流失预测、呼叫中心流量预测等问题。
九三智说
第四范式团队这个成立于2015年的创业公司对外界感觉很神秘,从网上仅仅可见的一些资料对“先知”平台的轮廓了一点点粗浅的描述。但其对人工智能、机器学习、VC维等的理解,给九三智很多启发也非常认可,此处引用一下:“人工智能=机器学习 大数据”、“机器学习=数据 特征 模型”。
九三智认为,智能时代之中,最核心的就是“智能引擎”,就好像工业时代的发动机一样,落地到不同的场景是不同形式的发动机,配合各种机器实现不同的任务,产品的形态可以是平台型的,也可以是完成特定任务的机器,比如汽车、飞机等。互联网时代的赋能,将物理世界信息化并通过网络快速传输,加速了世界的节奏。智能时代的赋能,对信息背后的规律进行高效建模,从而用更加优化的方式驱动世界运行。
第四范式的“先知”系统,无疑就是平台型的AI产品,以AI落地行业场景的低门槛、定制化为特色的推广。类似性的产品有亚马逊AWS、谷歌AutoML、阿里云、百度Dueros等。平台型产品的“前(野)景(心)”都是非常大的,但门槛无疑极高,通常是掌握一定行业生态的巨头做的事情。因为平台是市场竞争中的“大国重器”,先期需要用利润奶牛投入大量资源来培育平台,后期则可以依托平台来掌控一个产业生态,比如苹果公司、SAP、IBM等。技术和产品只是要素之一,更重要的是市场掌控力,才能拿到“规则制定权”,这里面资本的力量、市场的力量都非常重要,是战略级的竞争。
第四范式的切入点很值得借鉴,是利润最厚的金融和互联网,能够快速实现资金的良性循环。团队技术实力毋容置疑,戴文渊、陈雨强等都是行业顶级大牛。市场运作方面,近期获得工商银行、中国银行、建设银行及其所属基金共同参与的战略投资。可以说起步非常之成功,目前态势极其看好。
九层之台,起于垒土。市场竞争的胜出终究要靠“资金角度的活下来”和“产品角度的用户体验”来话事。祝愿第四范式可以走出属于国人自己的AI之路。
文末彩蛋:先知系统一段官方产品视频(约14Mb)
参考资料
第四范式官网:https://www.4paradigm.com/
知乎回答,永结童心,https://www.zhihu.com/question/40059002/answer/97403745
第四范式联合创始人陈雨强:机器学习在工业应用中的新思考:https://zhuanlan.zhihu.com/p/24505389
第四范式戴文渊:商业公司构建AI能力的五大核心要素:https://zhuanlan.zhihu.com/p/27190408