最近基于puerts做了个nodejs addon,能让nodejs方便的调用c 的库。拿一个比较知名的同类方案v8pp做对比:
相同点
- 都是基于C 模板技术提供了声明式绑定API。
- 都能支持nodejs和其它v8环境
先列几个不同点
- v8pp提供了包括v8的初始化,设置,c /js交互等封装,而puerts仅仅专注于c /js交互一项。
- 声明要绑定c api后,puerts能生成这些c api的TypeScript声明(.d.ts文件),这似乎是首创
- puerts对c 特性支持丰富些,比如支持函数重载
- puerts的性能更强悍:简单C 静态方法比v8pp快50%~90%,简单C 成员方法比v8pp快4~5倍,在此基础上如果开启v8 fast api call特性还能再提升一倍。
语言无关的原生addon标准
puerts不仅仅想做更好的v8/C 绑定方案,还通过“跨语言交互”抽象出来的一套api,定义了一个语言无关的原生addon标准。该标准的addon无需重新编译可以在实现了该标准的游戏引擎(UE /Unity),nodejs、lua等环境加载使用。可以下载这个工程体验一下:puerts_addon_demos,也期待该标准的更多语言支持。
反观nodejs原生addon,要在同出一源的electron加载也要用electron的工具重新构建:using-native-node-modules
HelloWorld
被调用的C 代码
代码语言:javascript复制class HelloWorld
{
public:
HelloWorld(int p) {
Field = p;
}
void Foo(std::function<bool(int, int)> cmp) {
bool ret = cmp(Field, StaticField);
std::cout << "Foo, Field: " << Field << ", StaticField: " << StaticField << ", compare result:" << ret << std::endl;
}
static int Bar(std::string str) {
std::cout << "Bar, str:" << str << std::endl;
return StaticField 1;
}
int Field;
static int StaticField;
};
int HelloWorld::StaticField = 0;
声明式导出到addon
代码语言:javascript复制UsingCppType(HelloWorld);
void Init() {
puerts::DefineClass<HelloWorld>()
.Constructor<int>()
.Method("Foo", MakeFunction(&HelloWorld::Foo))
.Function("Bar", MakeFunction(&HelloWorld::Bar))
.Property("Field", MakeProperty(&HelloWorld::Field))
.Variable("StaticField", MakeVariable(&HelloWorld::StaticField))
.Register();
}
//hello_world is module name, will use in js later.
PESAPI_MODULE(hello_world, Init)
js调用该addon
代码语言:javascript复制const puerts = require("puerts");
let hello_world = puerts.load('path/to/hello_world');
const HelloWorld = hello_world.HelloWorld;
const obj = new HelloWorld(101);
obj.Foo((x, y) => x > y);
HelloWorld.Bar("hello");
HelloWorld.StaticField = 999;
obj.Field = 888;
obj.Foo((x, y) => x > y);
lua调用该addon
代码语言:javascript复制local puerts = require "puerts"
local hello_world = puerts.load('path/to/hello_world')
local HelloWorld = hello_world.HelloWorld
local obj = HelloWorld(101)
obj:Foo(function(x, y)
return x > y
end)
HelloWorld.Bar("hello")
HelloWorld.StaticField = 999
obj.Field = 888
obj:Foo(function(x, y)
return x > y
end)
代码解释
- 被调用的代码包含了比较常用的几种情况:构造函数、成员变量、成员函数、静态变量、静态函数,也包含了比较高级点的std::function,这种变量在js/lua可以直接传函数
- 绑定声明部分可以理解为基于c 构造的一个dsl,根据文档学习怎么使用即可。
TypeScript调用代码
编译好addon后,可以用puerts提供的工具生成声明文件。
先安装puerts工具
代码语言:javascript复制npm install -g puerts
将声明文件生成到typing目录
代码语言:javascript复制puerts gen_dts pathtoyouraddon -t typing
打开声明文件typingmodule_nameindex.d.ts,可以看到针对声明的C 类的ts声明:
代码语言:javascript复制declare module "hello_world" {
import {$Ref, $Nullable, cstring} from "puerts"
class HelloWorld {
constructor(p0: number);
Field: number;
static StaticField: number;
static Bar(p0: string) :number;
Foo(p0: (p0:number, p1:number) => boolean) :void;
}
}
把typing目录加到ts工程的tsconfig.json的compilerOptions/typeRoots即可享受代码提示、检查之乐。
上面js调用代码的ts版本如下:
代码语言:javascript复制import {load} from "puerts";
import * as HelloWorldModlue from 'hello_world'
let hello_world = load<typeof HelloWorldModlue>('path/to/hello_world');
const HelloWorld = hello_world.HelloWorld;
const obj = new HelloWorld(101);
obj.Foo((x, y) => x > y);
HelloWorld.Bar("hello");
HelloWorld.StaticField = 999;
obj.Field = 888;
obj.Foo((x, y) => x > y);
通过HelloWorld例子我们初步了解了puerts for node的初步使用,想进一步使用请看文档和例子。
接下来我们讲下设计、实现相关的东东。篇幅的关系只讲两个主题:
- 语言无关addon设计
- 性能
语言无关addon设计
笔者从xLua到puerts,使用过脚本引擎/虚拟机有:lua、v8、jscore、quickjs、wasm3等等,感觉脚本引擎/虚拟机和宿主交互来来去去就那么回事,于是萌生了一个“做一套跨虚拟机的FFI抽象”的想法。
C还是C ?
这些引擎有的提供的是C接口,有的提供的是C 接口,这抽象接口用哪个语言好?
很显然应该用C,它兼容性更好,有可能有些环境只能用C,而且一个动态库和可执行程序之间的接口如果用到了C 的类型(std::string, std::shared_ptr等),两边使用的C 版本不一样很容易导致崩溃,如果这些不能用,为何不直接用C?
回调签名
虚拟机调用宿主的一个函数,其实是调用宿主注册的一个特定接口的回调,回调中读取参数调用实际函数后,把结果返回给虚拟机。每个虚拟机对这回调的定义基本都不一样,也很难评个高下。最终定了如下回调签名。
代码语言:javascript复制typedef struct pesapi_callback_info__* pesapi_callback_info; typedef void (*pesapi_callback)(pesapi_callback_info info);
主要是基于两点考虑:
- 这签名和puerts主打支持的v8是兼容的,可以直接作为v8的回调,减少v8适配的性能损失
- 单参数的接口,其它多参数回调只要栈上构造一个栈结构体装一下即可,性能损失也不大,以quickjs为例,它的签名是这样的
typedef JSValue JSCFunctionData(JSContext *ctx, JSValueConst this_val, int argc, JSValueConst *argv, int magic, JSValue *func_data);
虽然差别很大:有很多参数,而且有返回值。我们可以这么适配一下
代码语言:javascript复制struct pesapi_callback_info__ {
JSContext *ctx;
JSValueConst this_val;
int argc;
JSValueConst *argv;
int magic;
JSValue *func_data;
JSValue result;
};
[](JSContext *ctx, JSValueConst this_val, int argc, JSValueConst *argv, int magic, JSValue *func_data) {
pesapi_callback_info__ callbackInfo;
callbackInfo.ctx = ctx;
callbackInfo.this_val = this_val;
callbackInfo.argc = argc;
callbackInfo.argv = argv;
callbackInfo.magic = magic;
callbackInfo.func_data = func_data;
pesapi_callback callback = (pesapi_callback)(JS_VALUE_GET_PTR(func_data[0]));
callback(callbackInfo);
return callbackInfo.result;
}
其它接口
- 基本数据类型转换
- 对象生命周期管理:由虚拟机主动new的原生对象,没引用(gc)时应该释放掉,原生持有的一些虚拟机gc对象,比如回调函数,应该保持引用
- 面向对象信息描述:有哪些类,类的函数和成员信息,这些类间的继承关系
addon初始化
翻到前面的HelloWorld例子,有这么一行:
代码语言:javascript复制PESAPI_MODULE(hello_world, Init)
PESAPI_MODULE是一个宏,这将会在addon动态库中定义几个入口,其中最重要是一个addon初始化函数,实现了“跨虚拟机的抽象接口”的程序加载addon后会主动调用,传入前面说的那一系列接口实现函数的指针。
pesapi
前面说的“跨虚拟机的抽象接口”叫pesapi,是Portable Embedded Scripting API的缩写,整套API的描述只有一个200多行的简单纯c头文件。
纯用这套api去编写addon也是可以的,这种方式仅仅依赖一个头文件和一个c文件,不依赖任何库。这是一个例子:tiny_c
可以看到比较繁琐,前面的HelloWorld使用的声明式绑定方式简单很多,也仅仅多依赖些头文件和C 14,不需要依赖node或者v8。
性能
我们对一个C 类进行声明式绑定,默认编译后生成的是对pesapi的调用,好处是这种addon不依赖于任何的脚本引擎/虚拟机,以二进制形式发布,可以在任意支持pesapi的环境使用,但它也有缺点:脚本引擎/虚拟机的API先封装成pesapi再被addon调用,性能会有一些损失。
具体可以看这个对比测试工程:puerts_node_performance,主页有多个平台的测试结果,其中puerts_perf即为模板绑定 pesapi的测试,作为对比的v8api_perf则是手工调用v8 api的测试,还是有不小的性能损失的。
napi_perf是手工调用nodejs的napi实现的addon,napi和pesapi类似,都是封装成c接口给addon调用(ps:pesapi的设计也有参考napi),它的测试数据和puerts模板绑定 pesapi是差不多的,可见性能损失更多的源于c接口的封装。
v8 API直调优化
代码不需要修改,只需编译时加入PES_EXTENSION_WITH_V8_API宏即可获得相当大的性能提升,顾名思义加了这个宏,模板将改为调用v8 api而不是pesapi,puerts_v8_perf即是这种方式编译的addon,性能比较接近v8api_perf,远比同样是模板 v8 api的v8pp性能要好(v8pp_pref)。
当然,也有代价的,这导致v8 api的依赖,addon编译需要加入v8,而且这种addon也不能在其它虚拟机上跑。
v8 fast api call支持
v8有一个甚少人知道和使用的特性:fast api call。
前面也说过原生调用是通过特定形式的回调来实现,每一个参数处理都至少有一次函数调用,而fast api call是根据函数签名信息,用TurboFan编译器运行时jit生成代码完成虚拟机内部Calling Convention到原生Calling Convention的转换,可能一个参数只需要简单的一个指令。
这特性也有一些坑:
- 该特性并不是所有类型都支持,对于不支持的类型,含不支持类型的函数你用它提供给的模板库去收集签名信息时会报编译错误
- 成员方法并不直接支持
- 碰到过一个神奇的问题:静态方法甚至比不用该特性还慢,进一步摸索发现静态方法先用变量持有再调用就有效果
const Add = Calc.Add
Add(1, 2) // fast
Calc.Add(1, 2) // very slow
网络甚少fast api call的资料,只能结合源码去摸索去解决这些问题,所幸都搞定了。
之前puerts_v8_perf不需要修改代码,只需:
- 编译时添加WITH_V8_FAST_CALL宏
- 如果是用node-gyp编译,会报找不到v8-fast-api-calls.h,需要自行下载合适版本的该文件,puerts_node_performance主页有介绍方法
- 启动node要加--turbo-fast-api-calls参数
即可享用这巨大的性能提升。实测puerts_fastcall_perf比v8api_perf还要快1~2倍。