C3是大名鼎鼎的Tom Siebel(创办了定义CRM概念的Siebel CRM)再次创业的公司,早期应该也是以CRM起家的,很早就提出了Enterprise AI的口号,在这个领域是当之无愧的领导者。在今年2月就宣布了Generative AI Product Suite,算是仅落后于微软的大厂了,从最近发布的AI for ESG和AI for CRM的视频,是已经与ChatGPT相结合了。
现在官网上已经包含AI Applications, AI Platform, Generative AI Product Suite, AI Ex Machina这4部分。其中只有Ex Machina可以免费试用,定位为No-code AI for Citizen Data Scientists。Ex Machina这个名字搜了下是《机械姬》这部电影,不知道有什么文化的深层含义,Citizen Data Scientists这个定位估摸着我也能看懂,就薅个羊毛吧。在https://c3.ai/products/c3-ai-ex-machina/start-your-free-trial/ 可以申请2周的Free Trial, 申请后会收到一封包含登录链接的邮件,进入后左侧只有几个菜单,也比较技术。
Templates可能能更好地帮助理解产品。挂了12个行业但实际上没有相关模板。。。
同样的下面的13种分析模型、8种LoB、7种Use-Case也都是挂羊头卖狗肉的。。。
怀疑是元数据没有维护到位,看了下Node Example开头的应该都是基于一个个节点的说明;相对来说更有端到端的业务场景的有:Identifying Credit Default, Customer Churn, Customer Segmentation, Employee Attribution, Energy Generation, Sales Funnel Analytics, Supplier Delay Risk.
Customer Segmentation是我相对熟悉的,说明也很详细,是用K-means做聚类分析,就看看它吧。第1步是loadDataSet,这似乎应该是一个默认的node但我在左侧树里找不到。。。anyway,如果点Preview或者Rerun的话可以看到数据集,共有200行x5列,所以仅用性别、年龄、年收入(k:15-17似乎已聚类好了)、消费分数(1-100也做好了归一) 这4个特征来聚类。
第2步Convert Ints to Doubles,能看出是Column - Type Converter组件,将后3列转化为Double方便算法处理。
第3步是最关键的AI Pipeline,但显示我没有权限查看。。。
第4步Columns Rename将输入数据集里的后2列改为更友好的显示名。
第5步Scatter Plot双击可展示图表如下。这里可以看出输出数据集多了prediction这一列。如果把所有的特征都加入展示的散点图(也可以改图表格式),可以看出分成了5个聚类。除了这个结果外,也没有任何的模型解释、损失函数等等,也不知道是不是在我没有权限的AI Pipeline里。总之这个template onboarding还是非常土鳖的。
既然流程走不太通,那还是继续看下功能模块。Home中没有什么特别的干货。Workbench才是主力阵地,Projects中就包含使用Template自动生成的项目,整个项目还能被导出为一个json文件。每次查看Project的设计时还要启动环境(仅几秒钟)也不知道是什么思路。。
项目的核心还是那些组件,有Input Data, Transform, Prepare, Analyze, Timeseries and Sequences, Text Analytics, Graph, AutoML Train, Visualize, Output Data这几大类。
AutoML Train部分是核心,支持预置的6大类14种机器学习模型(以及对接SparkML里的模型),以Random Forest Classification为例也支持N种自定义配置。
AI Pipelines中似乎可以创建可被Projects重用的子程序。
Stories中似乎可以把N个visualization组合为1个故事,有点像仪表盘。
Datasets中已经有了36个,并且创建时间早于我开通账号时间,应该都是Templates自带的。
Schedules如其名,Connectors就完全不知道怎么用。
还有个主菜单就是Learn,所以C3也是知道这个产品需要很多的学习成本的。。。
其中最重要的就是Machine Learning & Artificial Intelligence部分了,因为其它的和一个工作流或ETL工具也没有太大差别。这部分用了最基础的随机森林做例子,所以也没有太多干货,视频中写了“请期待AutoML”但现在还没有。所以ExMachina定位为给Citizen Data Scientist使用是很准确了,它只是帮助数据科学家从使用Python Notebook改为使用这个拖拽和填写一堆参数的界面,上手可以无代码,但断不是给业务人员用的。
Subscribe菜单把价格页也嵌入进来了,试用版送的32GB(不知道定价页里为啥是小写b)内存价值$5.5/小时,这羊毛也算挺值钱了。