詞法分析器的工作過程分析

2022-12-18 13:25:10

Webkit中，有個詞法分析器--HTMLTokenizer，她是怎麼工作的呢，網頁位元組流是她的輸入，她的輸出是一個個的詞語Token，比如div，input，img，script等等HTML檔案中的标準元素(Element）。

前一篇文章關于DOM的建立裡說過，HTML元字元解析器（HTMLMetaChractorParser）和HTML詞法分析器（HTMLTokenizer）協同工作，一起分析、解析出詞語(HTMLMetaChractorParser取出所有的頁面中的字元，并調用HTMLTokenizer的nextToken函數處理它)：

詞法分析器的工作過程分析

下面這張圖，就是Tokenizer具體的工作過程，我們看的出來，她是個狀态機，先取<，再取>，就表示一個詞語(token)結束了，之後進入下一個狀态，周而複始。

詞法分析器的工作過程分析

詞法分析器的工作過程分析

繼續閱讀

Android 讀寫xml檔案

Mybatis源碼閱讀（二）：動态節點解析2.1 —— SqlSource和SqlNode

QQ協定分析（一）

spire.pdf修改pdf内容

[轉]android開發新浪微部落格戶端完整攻略 [新手必讀]

03-jQuery(一)1、jQuery介紹2、jQuery的初體驗3、jQuery核心函數4、jQuery 對象和 dom 對象區分5、jQuery選擇器（重點）6、jQuery元素篩選

RIAMeeting第六次活動

Android新浪微網誌OAuth授權認證

/etc/snmp/snmpd.conf

Linux 核心可用的字元串分割函數 strsep (String Split Function strsep in Linux Kernel)

DOM4J:Premature end of file

error C2143: syntax error : missing ';' before 'type' in Visual C++

jbpm的Token,node

JBPM的實作原理

jbpm的流程模型

jbpm學習筆記(2)_DB