天天看點

GitHub十周歲HanLP自然語言處理包使用者量超越CoreNLP

GitHub十周歲HanLP自然語言處理包使用者量超越CoreNLP

在本周,GitHub終于度過了屬于它自己的十周歲生日。這個在2008年由3個來自舊金山的年輕人建立的基于Git的代碼托管網站,先後超越了元老級的SourceForge和背景強大的Google Code,成為了全世界範圍内最受歡迎的代碼托管網站。

GitHub十周歲HanLP自然語言處理包使用者量超越CoreNLP

“十年前的今天,GitHub 正式上線。最一開始,我們隻有一個特别簡單的目标:連結所有的開發者,讓他們用Git更輕松地進行項目協作。”聯合創始人Chris Wanstrath在部落格裡寫道,“十年過去了,我們作為公司,作為平台都有了很大的變化,但GitHub存在的意義從未改變。”

截至到去年5月底,GitHub完成了第1億個PR合并請求指令。截至今天,GitHub上已經能夠擁有超過8000萬個repo,活躍使用者達到2700萬人,超過150萬家公司和機構進駐。大快搜尋的HanLp自然語言處理開源項目同樣進駐了GitHub。

GitHub團隊作為對十周年的紀念和慶祝,并沒有像大多數公司一樣選擇回顧公司的發展曆史,而是整理了一份過去十年的幾大裡程碑事件。這份光榮,不止屬于平台自己,更是屬于那些為了讓這個世界變得更好,通過Git、GitHub、用JS、Python和各種語言共享代碼的人們。

在GitHub十周年之際,大快搜尋AI研究小組的,自然語言處理專家Hancks所主持的HanLP開源項目,全球使用者量首次超過了斯坦福大學的CoreNLP,以及老牌的自然語言處理開包Ansj,成為全球範圍内最受開發人員喜愛的自然語言處理技術。

GitHub十周歲HanLP自然語言處理包使用者量超越CoreNLP
GitHub十周歲HanLP自然語言處理包使用者量超越CoreNLP

自2014年首次釋出,通過3年的不斷疊代,HanLP的分詞準确性和分詞速率得到了極大的提升。據阿裡楊尚川的一份測評報告顯示,HanLP的分次準确率在全球排名第三,分詞速度在全球排名第一。卓越的性能自然帶來了大量的使用者。終于,在太平洋時間10月25日,GitHub上HanLP的使用者量超過Stanford-CoreNLP。

GitHub十周歲HanLP自然語言處理包使用者量超越CoreNLP

自然語言處理是人工智能的一個重要分支,HanLP的使用者量證明了國産技術的高性能與可靠性,也再一次證明了大快搜尋用心做技術、專注于大資料與人工智能基礎軟體的決心。大快今後也将開發出更多元件用于建設大資料與人工智能生态,繪出人工智能與大資料的中國智慧。

����T���|�