天天看点

无protobuf协议情况下的反序列化------貌似无解, 其实有解!

        用过protobuf的人都知道, protobuf的序列化过程是:

        协议文件(.proto) + 原始数据 ====》 buffer

        反序列化的过程是:

        buffer + 协议文件(.proto) ===>原始数据

        那有没有办法实现: buffer ===》原始数据  呢?   这是一个貌似无解的问题, 其实有解。  

        如果在无协议的情况下, 能实现buffer到原始数据的转化, 那就具有非常重要的意义: 抓包后(抓16进制), 可直接转换成原始数据!!! Oh, my god,  效率呈现指数级提升!!! 着实让人兴奋

无protobuf协议情况下的反序列化------貌似无解, 其实有解!
无protobuf协议情况下的反序列化------貌似无解, 其实有解!
无protobuf协议情况下的反序列化------貌似无解, 其实有解!

         之前我学过h.264视频压缩, 原始的yuv数据经过h.264压缩后, 生成压缩视频, 每个字节都有其固定含义, 因此可解码。 类似地, 在protobuf序列化过程中, 也有这样的道理。 序列化后的每个字节都有固定含义, 那么自然就可以对这些有固定意义的字节进行解码, 我们来看看代码:

         test.proto内容:

package NS;  
message PointReq 
{  
    required int32 x=1;  
    required int32 y=2;  
}
[email protected] Desktop> 
           

        main.cpp内容:

#include <iostream>
#include <string>
using namespace std;

#include "test.pb.h"
using namespace NS;

// 16进制
string bufToHexStr(const char *pBuf, int bufLen)
{
        if(NULL == pBuf || bufLen < 0)
        {
                return "";
        }

        int i = 0;
        string sRet = "";
        for(i = 0; i < bufLen; i++)
        {
                char szTmp[3] = {0};
                snprintf(szTmp, sizeof(szTmp), "%02x", (unsigned char)pBuf[i]); 
                sRet += szTmp;
        }

        return sRet;
}

int main()
{
    PointReq point;
    point.set_x(10);
    point.set_y(20);

    string tmp;
    bool ret = point.SerializeToString(&tmp); // 这里要传地址
    if (ret)
    {
        printf("encode ok!\n");
    }
    else
    {
        printf("encode error!\n");
		return -1;
    }

    cout << bufToHexStr(tmp.c_str(), tmp.size()) << endl;
	
    PointReq point2;
    ret = point2.ParseFromString(tmp);
    if (ret)
    {
        printf("decode ok, %d, %d\n", point2.x(), point2.y());
    }
    else
    {
        printf("decode error!\n");
		return -2;
    }
	
    return 0;
}
           

       结果:

[email protected] Desktop> make 
g++   -c  -L/usr/local/lib   -lprotobuf   -o main.o main.cpp  
g++   -c  -L/usr/local/lib   -lprotobuf   -o test.pb.o test.pb.cc 
g++: -lprotobuf: linker input file unused because linking not done
g++: -lprotobuf: linker input file unused because linking not done
g++    -L/usr/local/lib   -lprotobuf   -o main main.o test.pb.o  
[email protected] Desktop> ./main 
encode ok!
080a1014
decode ok, 10, 20
           

       上面反序列化依赖于test.proto协议文件。 

        下面, 我们不依赖于test.proto协议文件(仅仅利用序列化的结果080a1014)来反序列化一下:

无protobuf协议情况下的反序列化------貌似无解, 其实有解!

        如果协议是嵌套的, 那么此处的展示结果也是嵌套的, 有缩进关系, 非常好看, 爽心悦目

无protobuf协议情况下的反序列化------貌似无解, 其实有解!

        这个无协议序反序列化工具是某哥开发的, 所以我就不贴源码了。 无协议反序列化真的很有创意

无protobuf协议情况下的反序列化------貌似无解, 其实有解!

我们工作中, 每个人每天都有多次使用。 

        当然, 在你的公司, 很可能不用protobuf, 而是用自己公司开发的序列化协议框架, 那也一样, 无协议时可反序列化。有兴趣的朋友可以试着写一下无协议时的反序列化代码(一个字节一个字节地抠), 代码量其实很少! 

继续阅读