相同時間内,名為Sketch-a-Net的電腦程式識别草圖的正确率為74.9%,略高于人類的73.1%。
随着觸摸屏越來越普及,人們越來越頻繁地直接用手繪制草圖,是以這項發展成果有望為人類和計算機的新式互動奠定基礎。
使用這項程式,當你想要找一個特定圖像的時候,用手指把它畫出來,觸摸屏就能感覺到你正在畫什麼并進行檢索。當你想找家具或時尚配飾的時候,圖像檢索可比用關鍵字友善多了。而當警方鑒證人員将畫家根據描述繪制的罪犯畫像與照片或監控資料進行比對的時候,這項程式也能派上用場。
有關該程式的論文已經被英國機器視覺會議(the British Machine Vision Conference,BMVC)接收。這項研究也顯示出此程式善于識别草圖中的細節。比如,它能夠以42.5%的正确率辨識海鷗、飛鳥、站立的鳥和鴿子等特殊的鳥,而人類的正确率隻有24.8%。
對人類來說,草圖是種直覺的表達方式。無數年來,它都被用作交流工具。但因為随手畫的草圖很抽象,顔色也十分單一,辨認草圖頗具挑戰性。解決草圖辨認問題将會能幫助我們更好地認識人類的視覺感覺。
Sketch-a-Net是一套“深度神經網絡(deep neural network)”,這是一種模拟人類大腦的計算機程式。Sketch-a-Net善于分析利用草圖所獨有的特征,諸如筆畫的筆順等,進而獲得了更大的成功。這些資訊對辨識觸摸屏上的圖畫十分重要,但一直以來被人們所忽視。
這項研究作者之一,倫敦大學瑪麗女王學院電子工程和計算機科學的講師Timothy Hospedales說:“這項電腦程式能夠比人類更好地解決問題,我們對此十分激動。草圖是一個有趣的研究領域,因為它從史前時代到現在一直被用作交流工具。而随着草圖在觸摸屏上越來越頻繁的使用,它又将重新變成了一種常用的交流工具。這項程式能在警方驗證、觸摸屏的使用和圖像檢索方面産生巨大的影響,最終,它還會幫助我們從根源上認識視覺、了解視覺。”