最近一段时间在做数据库相关,给一些开源社区提交过几个issue与pr,今天来简单复盘一下。
目前给Apache arrow社区提交了10个pr,已有5个合入主干,还有5个在CR中。
给DuckDB提交4个pr,有3个已经合入。
1.Apache arrow
给arrow 提交的pr有比较复杂的功能,也有简单的bug修复。
功能涉及:
- 重构Sort算子,支持多SortKey的nulls first语义。
- 实现NestedLoop算子。
- 合并多batch。
- 支持case_when除法溢出。
- 支持distinct表达式等等。
bug 相关的涉及:
- Mac平台编译。
- AVX2编译。
- Gtest工具集对于float64的nan相等判断。
2.DuckDB
功能涉及:
- 调试Join reorder。
bug修复涉及:
- logic_root相关未使用变量。
- 文档注释错误。
提交代码给开源社区最大的好处是自己的代码可以得到很好的反馈,特别是自己平时写代码的习惯,测试的习惯都可以得到很好的锻炼。
学习一个项目,如何验证呢?
最好的办法,就是能够发现问题,并且解决它,而这些贡献的内容也都是在学习过程中去一一化解。
3.如何参与并提交
通常给开源社区提交代码都有一些目的,例如:自己的代码本来也是开源,想双向反馈,自己开发的特性能够及时的合入主干,方便后面功能迭代。
不管是什么样的目的,都有一个共同点,就是学习。
参与这个项目首先要去对这个项目有一个系统的认识,随后从一些bug/小的feature去切入,这样的话非常容易给社区提pr,提交的pr需要尽可能的小,不然很难合,就拿上面提交的算子NestedLoop来说,提交了之后还没人给我Code Reviewer,一方面这个太深入了,另一方面代码量确实大,几千行的代码。
所以,提交自己的第一个pr,需要控制代码行数,并且尽可能清晰的描述它。
每个开源社区都有自己的代码规范,我们需要做的是按照代码规范来实施,当完成一个需求/bug修复时,通常需要做下面一些事情:
- 本地开发需求/功能
- 按照规范进行测试,ut or reg测试等
- 提交pr,按照pr模版填写,这一步通常需要绑定issue
- 等待review
- 接受反馈并进行回复,如果需要修改代码,提交最新代码
- commiter确认无误,approve,随后合入主干
最后,我想说的是学习开源项目很有趣,参与开源项目就更加Cool了,也非常期待未来能够提交更多的代码,参与更多的开源项目,认识更多的小伙伴。