聯通研究院霍龍社博士深度解析“AI項目到底适不适合開源”

近年來，AI開源逐漸成為衆多開發者談論的核心，但也出現了不少“AI不适合開源”的聲音，那麼，AI項目到底适不适合開源呢？

為了解答這個專業問題，9月19日，OpenI啟智社群特邀聯通研究院教授級進階工程師、OpenI啟智社群精品開源項目“CubeAI智立方”負責人霍龍社博士做客OpenI啟智社群與InfoQ聯合打造的《人工智能開源錄》直播欄目，深度解讀“AI項目到底适不适合開源”。

本場直播訪談由InfoQ資深編輯魯冬雪擔任主持，與霍博士就“人工智能技術到底适不适合開源”、“開源AI算能服務平台CubeAI智立方的開源曆程”、“人工智能行業未來的發展”等AI開源相關話題展開訪談。直播線上觀看使用者量達到了近7000人，使用者對霍博士的AI見解表示受益匪淺，更對OpenI特邀的每期嘉賓表示非常期待。

人工智能技術到底适不适合開源？

無關适不适合，更是願不願意

針對AI到底适不适合開源這個話題，霍博士認為它沒有一概而論的标準答案，需要根據項目的實際情況而定。而且，開源無關适不适合，更是願不願意的問題。

對于開發者來說，開源能讓他們在開發過程中快速的給一個項目打好基礎，提高代碼品質和開發效率。從公司的角度來說，開源更是一把雙刃劍。公司代碼是否選擇開源，要從公司的經營利益以及市場競争方面考慮正面和負面的影響，開源是否影響到公司的技術生态環境，又或者是否會讓競争對手漁翁得利，都需要站在公司的角度去考慮。

而“開源不适合AI”的聲⾳是一種以偏概全的觀點。比如，超大模型的開源對模型本身和開發者其實都是互相成就的過程，開發者可以從模型代碼的思路、架構汲取優秀的想法，同時，也能激發開發者們給開源項目提供更好的建議。另外，借助開源算法，AI技術在落地方面可以得到更高效的推動，開發效率能夠達到事半功倍的提高。對于實際生産營運的AI項目，在開源代碼上進行二次開發，能夠更高效的促進AI技術落地。

CubeAI智立方的開源曆程

源于開源，回饋開源

1、CubeAI源于開源，回饋開源

2019年，中國聯通為推動5G與AI融合創新，釋出了CubeAI智⽴⽅平台。而CubeAI選擇開源的原因，霍博士概括為“源于開源，回饋開源”。

因為在項目初期，團隊通過學習借鑒美國AT&T的開源代碼思路而開發出CubeAI的架構。是以團隊希望将CubeAI智立方平台開源，也能夠給業界生态帶來積極正向的影響。

2、CubeAI為打破模型開發與實際應用壁壘而生

從⼈⼯智能⾏業發展來看，AI模型開發與實際⽣産應⽤之間存在不少壁壘。比如，大部分模型項目方的精力都集中在模型的訓練開發上面，對模型的傳遞和使用者使用體驗卻并未投入太多關注，以至于使用者在模型使用上的體驗非常糟糕。

而作為開源AI算能服務平台的CubeAI智立方卻很好地解決了這些問題。據霍博士介紹，CubeAI平台不需要使用者了解任何伺服器雲端封裝的基本原理和程式設計知識，隻要通過平台提供的模版，就能把模型一鍵部署到雲端，以服務化API的方式對使用者提供服務。

CubeAI不僅實作了與市場上一些優秀的模組化平台的對接功能，其AI模型共享還能很好幫助使用者收藏部署模型。相比Github必須先下載下傳才能後修改的靜态代碼，CubeAI的AI模型共享是能夠将代碼直接部署到雲端的活體程式。同時，它的AI能力開放平台能夠讓使用者對模型進行更好的管理，互動可視化。

而關于CubeAI後續的規劃，霍博士認為作為平台型的開源軟體，要想真正發揮作用，還需要做好面向公衆網際網路的營運。目前，CubeAI正處于開源孵化的階段，使用者群體主要面向個體AI開發者和中小型開發團隊，并沒有在網際網路上得到實際的應用。後續，團隊将根據實際的營運需求，把CubeAI打造成一款能夠真正投入實用的産品。

3、CubeAI在OpenI開源孵化後的經驗與感受

在談到進入OpenI啟智社群孵化的CubeAI時，霍博士認為啟智社群為項目提供了一個非常好的代碼托管平台，之前CubeAI的代碼一直托管在github，但團隊在使用了一段時間啟智的AI協作平台後，很快就都喜歡上了這個平台，仿佛發現了新大陸，從此，CubaAI項目的所有代碼全部被切換到了啟智平台。

提到OpenI啟智社群，霍博士對啟智的平台性能、使用者體驗和社群活動都大為贊歎：第一，啟智AI協作平台速度快，代碼送出很流暢。第二，使用者界面很友好，所有的互動都非常清晰明了。第三，平台本身也是疊代開源項目，兩個禮拜會有一次更新，每次更新都會有更好的體驗。另外，啟智社群對CubeAI項目等孵化項目也提供了很多展示和宣傳的機會。同時，霍博士還開心地提到前一段時間在OpenI啟智社群無意中參與“我為開源打榜狂”活動并獲獎的經曆，隻要送出代碼達到一定次數就能拿獎金。總之，霍博士安利OpenI是一個對AI開發者非常友好的平台。

人工智能行業未來的發展

除了開源，更要多措并舉

1、人人如何可以都做AI開發

如今開源AI平台越來越多，AI技術應用門檻不斷降低，出現了一種“人人都可以做AI開發”的趨勢。霍博士從AI應用開發的層面分析了形成這種趨勢的幾方面因素。

第一，是因為人工智能技術本身的發展。跟傳統的機器學習相比，基于神經網絡的深度學習有一個最大的優勢是不需引進人工特征提取，就可以進行端到端的學習。在模型設計和算法研究層面不需要開發者和專家的參與，降低了技術層面。

第二，是因為各類開源架構的出現普及讓複雜的操作和重複的計算可以被代碼封裝起來，制作成通用的API接口來構模組化型訓練和推理操作，大大降低了模型開發的難度和技術門檻。

第三，在開源架構的基礎上，誕生了利用通用資料集訓練的預訓練模型。不同應用領域的開發者能夠使用自己的資料集來進行增強或者優化預訓練，得到更适合自己領域的模型參數。這樣就降低了應用型模型開發的技術門檻。

第四，各類AI開源平台的出現。這些平台面向各類應用開發者直接提供訓練好的模型。開發者隻要進行簡單的參數配置或者編排組裝後就可以調用。對于應用開發者的話，他們甚至不需要學習和掌握AI的基礎理論就可以進行開發應用了。

總的來說，霍博士認為想要得到良好的發展，還必須借助開源的應用生态環境，吸引大量的人來參與開發建設，而降低技術門檻是吸引開發者的必要條件。同時，降低門檻可以讓大家站在巨人的肩膀上，助力AI行業發展得更好。

2、國産AI開源架構現狀與未來

近幾年，國内不少廠商都開源了自己的AI架構，但能做到在業界有名氣的開源項目并不多或影響力不夠大。霍博士認為這其中有幾點主要原因：一是跟使用者的使用習慣和學術生态有關。讓習慣了使用國外的TensorFlow或者PyTorch架構的AI研究者轉向使用國内新興的AI開源架構不僅有很高的學習成本，且基于新的架構很難在國際學術環境上别人交流。二是因為AI開源不是一件輕松的事情，除了大量的持續創新開發人才，還要宣傳營運團隊，以及有強大的算力支援。長期以往的消耗，很多公司的項目無法持續下去。三是AI科學項目需要一個持續的創新。如果技術缺乏持續創新，項目将逐漸失去人們的關注，進而失去信心，也就無法堅持下去了。

盡管很難成功，霍博士認為國内廠商争相建構開源架構也能帶來不同的創新和進步，大家互相學習借鑒，取長補短，能形成一種百花齊放的局面。在相應政策和市場的影響下，國内不少優秀的機構和項目都在友好合作，朝着帶動國産AI開源走向行業領頭的方向努力。

3、開源是促進人工智能發展的一種舉措

提到行業裡存在哪些技術挑戰時，霍博士以CubeAI為例，介紹項目的重心主要是解決模型的釋出和部署，但對于将來的部署和營運具體以什麼形态呈現、如何讓開發者、營運者和使用者都能得到最大的實惠和便利這些方面的技術挑戰仍舊在探索。希望将來能做到技術與算法解耦合，讓開發者更好的專注算法研發，而不用擔心技術和硬體層面的問題。至于開源，霍博士認為它隻是解決這些技術挑戰中需要借助和依賴的一個機制和手段，是解決這些問題其中的一環，光靠開源遠遠不行，更要多措并舉。

以上就是霍博士在“AI項目到底适不适合開源”為主題的訪談中分享的主要觀點。在直播過程中，霍博士也熱心與觀衆互動并解答相關問題。

OpenI啟智社群（免費的GPU/NPU算力）

OpenI啟智社群是在鵬城實驗室的支撐下，以鵬城雲腦科學裝置及軟體開發群智範式為基礎，由新一代人工智能産業技術創新戰略聯盟（AITISA）組織産學研用協作共建共享的開源平台與社群。

聯通研究院霍龍社博士深度解析“AI項目到底适不适合開源”

人工智能技術到底适不适合開源？

CubeAI智立方的開源曆程

人工智能行業未來的發展

繼續閱讀

K-近鄰算法以及圖像分類應用

小i機器人受邀赴韓交流，CFO首爾亞洲金融論壇演講

吳恩達deeplearning

吳恩達logistic回歸實作

【人工智能行業大師訪談1】吳恩達采訪 Geoffery Hinton

吳恩達機器學習筆記（3）

吳恩達j機器學習之過拟合

吳恩達機器學習(一) 介紹

深度學習模型分析人類複雜疾病的準确性

疾病研究：重症肌無力

人工智能如何有效地運用于自然語言處理

新聞 | Mapbox 牽手阿裡，飛豬旅行上線六大城市地圖功能

[HTML5]自定義屬性 data-* 和 jQuery.data 詳解

2021-2025年中國運動療法（KT）帶行業市場供需與戰略研究報告

2021年危險化學品經營機關安全管理人員考試題庫及危險化學品經營機關安全管理人員考試技巧

無人機--飛控科普