如何把Go调用C的性能提升10倍？

2021-11-10 09:12:28

目前，当go需要和c/c++代码集成的时候，大家最先想到的肯定是cgo。毕竟是官方的解决方案，而且简单。

但是cgo是非常慢的。因为cgo其实一个桥接器，通过自动生成代码，cgo在保留了c/c++运行时的情况下，搭建了一个桥来沟通c/c++世界和go的世界。这就意味着，兼容性很好，但是对c的函数的调用，必须先把当前的goroutine挂起，并切换执行栈到当前的线程m的主栈(大小2mb)。如果不做这个操作，那么只能在goroutine的栈上执行c函数调用，可是，goroutine的栈一般都很小，很容易就导致了栈溢出了。

调用c函数的时候，必须切换当前的栈为线程的主栈，这带来了两个比较严重的问题：

线程的栈在go运行时是比较少的，受到p/m数量的限制，一般可以简单的理解成受到gomaxprocs限制;

由于需要同时保留c/c++的运行时，cgo需要在两个运行时和两个abi(抽象二进制接口)之间做翻译和协调。这就带来了很大的开销。

minio项目的一个副产品是 c2goasm 项目，这个项目也被 go-cv-simd 项目使用获得了很好的效果。

c2goasm 的角色是一个汇编语言转换器，输入是 clang输出的amd64汇编，输出是go汇编。而clang的输入是c/c++语言。限制是不能有rtti和异常。也就是说不能有c/c++运行时提供的高级功能。

c2goasm输出的go汇编，交给go的工具链可以直接生成go的可执行代码。

c2goasm和cgo比，最大的改进就是：

不再有c/c++运行时，也就没了在两者之间不停转换的逻辑开销;

不需要切换到线程的主栈来执行函数，因为c2goasm生成的是纯正的go函数，不需要线程的主栈就可以执行;

由此就极大的改进了性能，代价是兼容性和可移植性损失了。

作者：佚名

来源：51cto

如何把Go调用C的性能提升10倍？

继续阅读

C语言第四章自述2第四章选择结构程序设计

面试题:vector和map的区别，异同。空间分布，100万数据存哪个比较合适。一、迭代器区别二、vector三、Map、Set四、vector_map 为什么比map效率高五、如何选择六、容器选择原则七、效率对比

C++ 多线程用条件变量确定线程的执行顺序而不是使用 sleep(1)

POJ 1284 Primitive Roots (欧拉函数&原根定理)

CQ V1.0分词bates(基于双数组tire树)—应该是目前最快的中文分词算法

成员函数初始化列表

2021-08-13c++——类之操作符重载

swmm与lisflood-fp源码如何一起编译 CMake命令

Windows下VS开发环境环境安装工程项目设置关于Debug和Release的提示

一文看懂字符串的加减乘除

C++ 第十五周报告1--《冒泡法排序》

C++实现简单顺序表

C经典书籍笔记——C陷阱与缺陷②(语法陷阱之优先级)一、错误案列二、优先级规律

线性表之顺序表的实现

C++判断素数、求最大公约数代码判断一个数是否为素数求两个数的最大公约数

SequoiaDB巨杉数据库C++驱动概述