5.15 vs2019 靜态編譯_淺析同一段C++代碼在Win X64, X86,MAC,Android ARM64平台編譯器優化之美...

背景：定位一些Crash崩潰時，由于缺少更多資訊，可能需要從反彙編的靜态代碼段推測對應的C++代碼，并結合寄存器值分析出具體原因。對于Release釋出版，由于編譯器的強行函數内聯和生成指令優化，會出現反彙編代碼和C++源碼差別較大，加大我們從彙編代碼反推C++難度，一但我們分析清楚優化點，可以很欣賞編譯器優化之美。

本文是從ARM64平台的一次crash反彙編分析經曆出發,發現編譯器能在我們根本沒寫判斷的情況下，自動增加條件判斷，啟用128位寄存器的NENO指令進行加速，這是我以前在PC平台從未見過的優化，驚歎之佘，忍不住在我手上僅有的多平台做進一步分析，寫一段簡單C++代碼，同樣的代碼在Windows下用VS2019選X64，X86，MAC家的XCode C++ 64位，Android Studio的ARM64，這四個平台都用Release版本生成,然後用IDA進行靜态分析對比，體驗一下編譯器的強大之處。

我簡單寫了一個測試樣例，C++字元串，加上測試，全部隻有60行。為了簡化，沒有專門的記憶體配置設定器，也沒有引入一些疊代器，萃取機制，為了簡化也有直接用strlen()取長度等不符合模闆泛型程式設計等，但這些不影響分析。無論在那個平台下，都用同樣的代碼，都會重點分析TestMyString()函數和生成以及差别最大的TCopy()函數。

template<typename T>
T* TCopy(const T* pStart, const T* pFinish, T* pDst)
{
    for (; pStart != pFinish; ++pDst, ++pStart)
    {
        *pDst = *pStart;
    }
    return pDst;
};

template<typename T>
struct TString
{
    ~TString()
    {
        if (_StartPtr) delete _StartPtr;
    }
    TString(const T* pcStr)
    {
        Assign(pcStr, pcStr + strlen(pcStr));
    }
    TString<T>& operator = (const TString<T>& rkRight)
    {
        if (&rkRight != this)
        {
            Assign(rkRight._StartPtr, rkRight._FinishPtr);
        }
        return *this;
    }
    void Assign(const T* pStart, const T* pFinish)
    {
        if (pStart == pFinish || nullptr == pStart)
        {
            _FinishPtr = _StartPtr;
            return;
        }
        int iLen = pFinish - pStart;
        int iSelfSize = _FinishPtr - _StartPtr;
        if (iSelfSize < iLen)
        {
            if (_StartPtr) delete _StartPtr;
            _StartPtr = new char[iLen + 1];
            _EndOfStrore = _StartPtr + iLen;
        }

        _FinishPtr = TCopy<T>(pStart, pFinish, _StartPtr);
        *((char*)_FinishPtr) = '0';
    }
    T* _StartPtr = nullptr;
    T* _FinishPtr = nullptr;
    T* _EndOfStrore = nullptr;
};
using MyString = TString<char>;

void TestMyString()
{
    MyString s1("HelloWrold");
    MyString s2("abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");
    s1 = s2;
}

windows X64平台：

我們先用VS2019在main函數調用TestMyString()，然後生成windows的X64平台可執行檔案，選Release，VS預設速度最快優化，，用IDA反編譯工具打開生成的exe，跳到main代碼段。好家夥，TestMyString()不見了，直接優化内聯展開，省去call，ret開銷，且TestMyString裡面子函數調用，也全部優化掉，比如

TString<T>& operator = (const TString<T>& rkRight);
void Assign(const T* pStart, const T* pFinish);
T* TCopy(const T* pStart, const T* pFinish, T* pDst);

變成内聯，一股腦的全放到main裡面了，這也是最常見的優化。