天天看點

lua中關于取長度問題

   由上篇blog可知 lua5.2中沒有了getn函數。那麼常用的取長度方式為#

   而#的使用又有些需要注意的地方。

   首先要明确的是lua中有兩部分:數組部分和hash表部分。而基本上所有操作都是先數組後hash表。

 local test1 = { 1 , 2  , 3 , 4 , 5 }

 print(#test1)

 列印結果: 5

 local test1 = { 1, 3 , 5 , 2 , 4 }

 print(#test1)

 列印結果: 5   (好吧。。。。當然跟上面一樣,都是作為數組中的值。。。)

 local test1 = {[1] = 1 , [2] = 2 , [3] = 3 , [4] = 4 ,[5] = 5}

 print(#test1)

 列印結果: 5    (這裡table中沒有數組部分了,隻有hash表部分)

 local test1 = {[1] = 1 , [3] = 3 , [4] = 4 , [6] = 6 ,[2] = 2}

 print(#test1)

 列印結果: 6

for i = 1 , #test1 do

     print(test1[i])

end

如果全部列印出來, 1 2 3 4 nil 6

明明寫的table中隻有5個元素,怎麼會變成6那。。。。這裡的原因就要看下lua源碼實作

/*
** Try to find a boundary in table `t'. A `boundary' is an integer index
** such that t[i] is non-nil and t[i+1] is nil (and 0 if t[1] is nil).
*/
int luaH_getn (Table *t) {
  unsigned int j = t->sizearray;
  if (j > 0 && ttisnil(&t->array[j - 1])) {
    /* there is a boundary in the array part: (binary) search for it */
    unsigned int i = 0;
    while (j - i > 1) {
      unsigned int m = (i+j)/2;
      if (ttisnil(&t->array[m - 1])) j = m;
      else i = m;
    }
    return i;
  }
  /* else must find a boundary in hash part */
  else if (isdummy(t->node))  /* hash part is empty? */
    return j;  /* that is easy... */
  else return unbound_search(t, j);
}
           

還是先數組,數組沒有後hash部分。再來看下關于hash表部分的取長度

static int unbound_search (Table *t, unsigned int j) {
  unsigned int i = j;  /* i is zero or a present index */
  j++;
  /* find `i' and `j' such that i is present and j is not */
  while (!ttisnil(luaH_getint(t, j))) {
    i = j;
    j *= 2;
    if (j > cast(unsigned int, MAX_INT)) {  /* overflow? */
      /* table was built with bad purposes: resort to linear search */
      i = 1;
      while (!ttisnil(luaH_getint(t, i))) i++;
      return i - 1;
    }
  }
  /* now do a binary search between them */
  while (j - i > 1) {
    unsigned int m = (i+j)/2;
    if (ttisnil(luaH_getint(t, m))) j = m;
    else i = m;
  }
  return i;
}
           

j++保證j是hash部分的第一個值,從j開始,如果j位置是有值的,那麼将j擴大兩倍,再檢查兩倍之後hash表中是否可以取到值,直到找到沒有值的地方,這個值就在i 到 j這個區間中。然後再用折半查找找到 i 到 j之間找到的最後一個nil的,前面的就是它的長度了。 錯略看來。luaH_getint用來取值 

const TValue *luaH_getint (Table *t, int key)而它的聲明看來 ,第二個參數是key,通過key來取value, 而外面對傳入的key是++的操作  可知計算長度用來尋找的這個key一定是個整形,而且還得是連續的(不一定)。(當然這個是不深究細節實作錯略看下來的分析。。。。。)

再來驗證下:

local test1 = {1 , 3 , [4] = 4 , [6] = 6 ,[2] = 2}

print(#test1)

列印結果: 2

也就是上面源碼中,會先周遊數組部分,數組部分有就結束,沒有再周遊hash表部分

 local test1 = {[4] = 4 , [6] = 6 ,[2] = 2}

 print(#test1)

 列印結果:0

 數組之後的第一位是j++  如果value是nil,  i 是 0 ,j 是1 傳回值是0

 看兩個一起的:

 local test1 = {[1] = 1 , [2] = 2 ,[4] = 4 ,[6] = 6}

 print(#test1)

 local test1 = {[1] = 1, [2] = 2 ,[5] = 5 ,[6] = 6}

 print(#test1)

 兩個的輸出結果是6和2 ,而且要是将第一個列印出來 是1 2 3 4 nil 6   中間差一個就能打出來後面的,差兩個就不行了 why?

 就是因為上面源碼中得算法。

 舉個例子 

 local test1 = {[1] = 1 , [2] = 2, [3] = 3 ,[4] = 4 ,[6] = 6}

 第一個while循環結束, i == 4 ,j == 8, 通過下面的折半查找(具體細節還是拿筆算下吧。。。)  最後i == 6了

 而local test1 = {[1] = 1, [2] = 2 ,[5] = 5 ,[6] = 6}

 第一個while循環後, i == 2 , j == 4 , 折半查找後 i == 2

 恩  就是這樣了,如果不清楚這個的話,那麼在實際操作的時候,會遇到很奇怪的問題而浪費大量時間。。。。

 最後local test1 = { ['a'] = 1, ['b'] = 2 ,['c'] = 3}

 print(#test1)

 列印結果: 0  key必須是整形才能用#取。 

 其他取數組長度形式

 如果是字元串或者其他形式的,還是采用循環pairs這種形式去取為好

 關于ipairs和pairs的自己了解 請看我的這篇blog。。。。。