本篇文章聊聊如何使用 Golang 来运行 Python 代码,用 Python 现成软件包来偷个懒儿,来少写一些代码。
写在前面
最近折腾了一些“陈年项目”,不少都是使用 Python 实现的。而我在折腾的项目的代码主要是使用 Golang 实现的。改写这些项目中的基础逻辑并不麻烦,借助 ChatGPT ,都是分分钟的事情。
但是有一些项目依赖的 Python 软件包,却让我为了难:
- Go 官方没有提供功能相等的,测试完备的替代包。
- 开源社区没有实现功能相近的软件包,或者实现的程序缺乏测试保障。
- 重新从零到一实现,意味着大量的时间消耗,尤其是具备大量测试用例的 Python 项目,比如:https://github.com/derek73/python-nameparser
作为一个有追求的工程师,我们首先需要排除掉使用 os/exec
这类方式,丑陋(不可靠、不稳定)的使用 Shell 来执行 Python 代码。
完整代码开源在 soulteary/docker-python-in-go,你可以自取。
在折腾之前,我们先聊聊原理和场景限制。
实现原理和场景限制
2018 年 11 月,DataDog 团队借鉴社区成名已久的 sbinet/go-python 项目,创建了 DataDog/go-python3 项目,提供了 Go 语言和 CPython-3 API 的绑定。
但可惜的是,在 2021 年 12 月 1 日,DataDog 团队宣布存档项目。值得庆幸的是,官方宣布项目交由 go-python/cpy3 继续维护。
不过,随着 Python 的版本迭代和变动,项目陷入了困境:
- Python 3.8 中,需要调整 Python 源码实现,移除
PyEval_ReInitThreads
函数,才能够正常工作。 - Python 3.9 之后,Python C API 中更是移除了
PyDict_ClearFreeList
的接口支持,导致项目不能继续兼容运行。
所以,如果我们愿意调整 Python 源码,那么我们可以使用 3.8 版本的 Python,否则方案就只能在 3.7 版本的 Python 运行。
除了不同版本 Python 本身的“接口”限制之外,还有一个硬件相关的限制。我们身边越来越多同学购置了 M1 / M2 芯片的 Mac ,但是 Python 3.8 之前,支持 ARM 芯片,会出现比较多的编译问题。除了 Python 之外,Golang 1.17.7 及之前的版本也对 M1 / M2 芯片存在兼容性问题。
所以,如果我们需要支持 M1 / M2 的设备,那么我们需要使用社区维护者调整过源码的 Python 3.8,以及比较新版本的 Golang。
使用 Docker 解决上面的环境依赖问题
在 2023 年,许多系统、软件都产生了非常多的变化。如果我们按照网上的方式来,可能会遇到这样或者那样的问题。好在,我们还有一条简单可靠的路:Docker。
虽然,社区维护者 Christian Korneck 提供了一些例子,但其实在容器里无论是安装 Python 还是 Golang,都会引入不必要的额外变量。
我们有更好的方案,直接基于 Python 和 Golang 的官方提供的镜像,来制作构建环境和运行环境,让 Docker 容器既小巧又可靠。
编程实战
好了,前置的相关知识,到这里就了解的差不多了。下面,我们来聊聊如何折腾它。
准备 Python 程序
我们以前文中提到的 Python 软件包 derek73/python-nameparser 为例,编写一个简单的 Python 程序片段,能够“简单快速的解析人名”。
代码语言:python代码运行次数:0复制from nameparser import HumanName
print(HumanName("Dr. Juan Q. Xavier de la Vega III (Doc Vega)").as_dict())
将上面的代码保存为 app.py
,然后使用 python app.py
执行这个程序,验证程序能够正常运行。
# python app.py
{'title': 'Dr.', 'first': 'Juan', 'middle': 'Q. Xavier', 'last': 'de la Vega', 'suffix': 'III', 'nickname': 'Doc Vega'}
程序准备完毕之后,我们来完成 Golang 部分的实现。
实现 Golang 程序
Golang 的程序实现也不复杂,我们可以将上面的代码直接 HardCode 到 Go 里,或者使用 os
、io
包里的函数,来读取我们的 Python 程序,大概 20 行内就能解决战斗。
package main
import (
python3 "github.com/go-python/cpy3"
)
func main() {
defer python3.Py_Finalize()
python3.Py_Initialize()
code := `
from nameparser import HumanName
print(HumanName("Dr. Juan Q. Xavier de la Vega III (Doc Vega)").as_dict())
`
python3.PyRun_SimpleString(code)
}
这部分代码的备份,你在 soulteary/docker-python-in-go/app/main.go 可以找到。
使用 Docker 完成程序构建
这里,我们先来实现一个最简的 Docker 配置:
代码语言:shell复制# Base Images
FROM golang:1.20.4-alpine3.18 AS go-builder
FROM python:3.7-alpine3.18 AS builder
# Base Builder Env
COPY --from=go-builder /usr/local/go/ /usr/local/go/
ENV PATH="/usr/local/go/bin:${PATH}"
RUN python -m pip install --upgrade pip
RUN apk add build-base pkgconfig
ENV PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/
ENV CGO_ENABLED=1
# Copy source code
COPY app /app
WORKDIR /app
# Install deps
RUN pip install nameparser &&
go mod init human-name &&
go mod tidy
# Build the binary
RUN go build -o HumanName
# Run Image
FROM python:3.7-alpine3.18
# Copy Python Deps
COPY --from=builder /usr/local/lib/python3.7/site-packages/nameparser /usr/local/lib/python3.7/site-packages/nameparser
# Copy binary
COPY --from=builder /app/HumanName /HumanName
CMD ["/HumanName"]
将上面的内容保存为 Dockerfile
,然后使用下面的命令构建镜像:
docker build -t soulteary/python-in-golang .
镜像构建过程中,我们将看到类似下面的日志:
代码语言:shell复制# docker build -t soulteary/python-in-golang .
[ ] Building 2.5s (18/18) FINISHED
=> [internal] load build definition from Dockerfile 0.0s
=> => transferring dockerfile: 37B 0.0s
=> [internal] load .dockerignore 0.0s
=> => transferring context: 2B 0.0s
=> [internal] load metadata for docker.io/library/python:3.7-alpine3.18 2.4s
=> [internal] load metadata for docker.io/library/golang:1.20.4-alpine3.18 1.5s
=> [auth] library/python:pull token for registry-1.docker.io 0.0s
=> [builder 1/8] FROM docker.io/library/python:3.7-alpine3.18@sha256:f48c5f6a8a22a73558ea93eb26d2c7928d23f2acb2bb9270be9a08 0.0s
=> [go-builder 1/1] FROM docker.io/library/golang:1.20.4-alpine3.18@sha256:ee2f23f1a612da71b8a4cd78fec827f1e67b0a8546a98d25 0.0s
=> [internal] load build context 0.0s
=> => transferring context: 56B 0.0s
=> CACHED [builder 2/8] COPY --from=go-builder /usr/local/go/ /usr/local/go/ 0.0s
=> CACHED [builder 3/8] RUN python -m pip install --upgrade pip 0.0s
=> CACHED [builder 4/8] RUN apk add build-base pkgconfig 0.0s
=> CACHED [builder 5/8] COPY app /app 0.0s
=> CACHED [builder 6/8] WORKDIR /app 0.0s
=> CACHED [builder 7/8] RUN pip install nameparser && go mod init human-name && go mod tidy 0.0s
=> CACHED [builder 8/8] RUN go build -o HumanName 0.0s
=> CACHED [stage-2 2/3] COPY --from=builder /usr/local/lib/python3.7/site-packages /usr/local/lib/python3.7/site-packages 0.0s
=> CACHED [stage-2 3/3] COPY --from=builder /app/HumanName /HumanName 0.0s
=> exporting to image 0.0s
=> => exporting layers 0.0s
=> => writing image sha256:8c4e43d26afff57ef65cc8431d3c0a01e57ad43e2acbe3f90ac5a5b6c5edab12 0.0s
=> => naming to docker.io/soulteary/python-in-golang
镜像构建完毕,执行下面的命令,就能够验证程序是否正常了:
代码语言:shell复制docker run --rm -it soulteary/python-in-golang
不出意外,程序将输出下面的内容:
代码语言:shell复制# docker run --rm -it soulteary/python-in-golang
{'title': 'Dr.', 'first': 'Juan', 'middle': 'Q. Xavier', 'last': 'de la Vega', 'suffix': 'III', 'nickname': 'Doc Vega'}
好了,在 Golang 中运行 Python 程序,到这里就基本搞定啦。
当我们观察构建好的镜像,能够看到,我们构建的镜像仅仅比官方原始镜像增加了 1.9 MB,是不是非常“环保”。
代码语言:shell复制# go-name docker images | grep python
soulteary/python-in-golang latest 8218d4d4b16b About a minute ago 48.9MB
python 3.7-alpine3.18 e4fbc12a05a9 11 days ago 47MB
使用镜像加速构建过程
为了能够让镜像构建速度加快,我们可以为 Python 和 Golang ,以及我们所使用的系统 Alpine 添加软件源镜像。
代码语言:shell复制# Base Images
FROM golang:1.20.4-alpine3.18 AS go-builder
FROM python:3.7-alpine3.18 AS builder
# Base Builder Env
COPY --from=go-builder /usr/local/go/ /usr/local/go/
ENV PATH="/usr/local/go/bin:${PATH}"
# Set Alpine Mirror
RUN sed -i 's/dl-cdn.alpinelinux.org/mirrors.tuna.tsinghua.edu.cn/g' /etc/apk/repositories
RUN python -m pip install --upgrade pip
# Set PyPi Mirror
RUN pip config set global.index-url https://pypi.tuna.tsinghua.edu.cn/simple
RUN apk add build-base pkgconfig
ENV PKG_CONFIG_PATH=/usr/local/lib/pkgconfig/
ENV CGO_ENABLED=1
# Set Golang Mirror
ENV GOPROXY="https://goproxy.cn"
# Copy source code
COPY app /app
WORKDIR /app
# Install deps
RUN pip install nameparser &&
go mod init human-name &&
go mod tidy
# Build the binary
RUN go build -o HumanName
# Run Image
FROM python:3.7-alpine3.18
# Copy Python Deps
COPY --from=builder /usr/local/lib/python3.7/site-packages/nameparser /usr/local/lib/python3.7/site-packages/nameparser
# Copy binary
COPY --from=builder /app/HumanName /HumanName
CMD ["/HumanName"]
最后
其实在 Golang 中运行 Python 除了本文的方法,以及在文章前面我们避免的方法之外,还有两种方案,有机会我们再展开聊聊。
好了,这篇文章,就先写到这里啦。
--EOF