和从前单纯做项目不同,目前主要做产品实时性能优化, 简单说就是尝试哪种方式让桌面和手机程序跑得快,效率高就用让产品组用哪种。工作性质要求编程语言必须足够快,跑得快,写得也要快。 但很悲剧的是这俩目标基本是冲突的,所以实际中会用一个快的脚本作原型,而用编译型的语言写关键组件。目前主要用的3个编程语言是C/C++, LuaJIT还有Rust.
LuaJIT虽然公认的性能很高,编写效率也高,但时常在渲染效率上测试上出现不好的情况还是忍不住回头去怀疑语言有毛病,于是改成用Rust作一遍,再用C重作一遍,把OpenGL,Direct3D,Vulcan全部整过一轮,最终还是发现结果问题并不在语言上。
在用frida注入dll逆向动态分析其它商用产品的内部api流程时候,发现了tinycc也很好用, 因为它的缺点是没有优化过的一个编译器,于是顺便写了一个语言大比拼,比比最常用的情况:单线程,循环,递归,就用我的一台i3 (8G内存)的老机器计算斐波那契数列,看看谁的效率最高。
- C - , 计算fib(40) 基本稳定在500ms 上下波动3-40ms
// ex3.c
//运行: tcc -run ex3.c 40
#include <tcclib.h>
#include <windows.h>
int fib(n)
{
if (n <= 2)
return 1;
else
return fib(n-1) + fib(n-2);
}
int main(int argc, char **argv)
{
int n;
if (argc < 2) {
printf("usage: fib n\n"
"Compute nth Fibonacci number\n");
return 1;
}
n = atoi(argv[1]);
DWORD t0=GetTickCount();
int res=fib(n);
int t=GetTickCount()-t0;
printf("took %d ms , fib(%d) = %d\n", t, n, res );
return 0;
}
2 LuaJIT - 基本稳定在600-800ms之间,平均700ms
-- ex3.lua
-- 执行: luajit ex3.lua 40
ffi=require'ffi'
ffi.cdef[[
uint32_t GetTickCount();
]]
local function fib(n)
if n<=2 then return 1 end
return fib(n-2)+fib(n-1)
end
if #arg<1 then
print(arg[0]..' number')
return 0
end
function timeit(f)
local t0=ffi.C.GetTickCount()
local res=f()
local t=ffi.C.GetTickCount()-t0
print('took '..t..'ms to get result='..res)
end
timeit(function() return fib(tonumber(arg[1])) end)
3 Rust, 结果确实出乎了我的意料,无优化的情况是3个语言中最糟糕的,基本在850-1200ms之间,稳定区域是1000ms, 而优化后的情况,稳定在220-240ms, 这个结果对得起那么多的宣传. 所以:用rust要记住咯,编译的目标一定要优化!
//无优化编译:rustc -o ex3-rs-raw.exe ex3.rs
//带level2优化编译:rustc -O -o ex3-rs.exe ex3.rs
// 无优化执行(慢!):ex3-rs-raw 40
// 优化执行: ex3-rs 40
use std::env;
use std::time::Instant;
fn fib(n: i32) -> i32 {
return match n {
1 | 2 => 1,
3.. => fib(n - 1) + fib(n - 2),
_ => panic!("has to be positive"),
};
}
fn main() {
let args: Vec<String> = env::args().collect();
if args.len() < 2 {
println!("usage:{} number", args[0]);
return;
}
let now = Instant::now();
let res = fib(args[1].parse::<i32>().unwrap());
println!(
"took {} ms to get fib({})={}",
now.elapsed().as_millis(),
args[1],
res
);
}
另外好奇之下,我又分别写了nodejs和python的实现作对比。
4 NodeJS - 大约需要800-1000ms.
//ex3.js
//执行: node ex3.js 40
function fib(n)
{
return n<=2?1:fib(n-1)+fib(n-2)
}
const t0=new Date().getTime()
const res=fib(parseInt(process.argv[2]))
console.log('took '+(new Date().getTime()-t0)+" ms to get result:"+res)
5 Python - 太慢,计算fib(36)就已经需要5秒以上了,往上加1都要指数级变慢,实在没耐心等结果了。
# ex3.py
# 执行: python ex3.py 36
import time
import sys
def fib(n):
if n<=2:
return 1
return fib(n-1)+fib(n-2)
t0=time.time()
res=fib(int(sys.argv[1]))
print(f"took {int(1000*(time.time()-t0))} ms to get result:{res}")