機器學習第一次作業

1.人工智能領域的前沿技術介紹

深度強化學習

深度強化學習将深度學習的感覺能力和強化學習的決策能力相結合，可以直接根據輸入的圖像進行控制，是一種更接近人類思維方式的人工智能方法。深度學習具有較強的感覺能力，但是缺乏一定的決策能力；而強化學習具有決策能力，對感覺問題束手無策。是以，将兩者結合起來，優勢互補。

2013年，谷歌DeepMind團隊提出了一種DRL方法，在一些遊戲上的實驗效果接近或超過人類遊戲玩家，成果發表在2015年的《Nature》上。2016年，相繼發表了所開發的基于DRL的圍棋算法AlphaGo，以5:0戰勝了歐洲圍棋冠軍和超一流圍棋選手李世石，使人工智能的水準達到了一個前所未有的高度。2017年初，AlphaGo的更新程式Master，與60名人類頂級圍棋手比賽獲得不敗的戰績。在不完全資訊博弈中，2017年初，阿爾伯塔大學采用了與AlphaGo相似的原理，開發的德州撲克人工智能DeepStack取得了驕人的勝績，論文發表在《Science》上，标志着人工智能的又一個裡程碑事件。2017年10月，DeepMind團隊在《Nature》上發表的論文中提出了AlphaGo Zero，完全不用人類圍棋棋譜而完勝最高水準的AlphaGo，再次重新整理了人們的認識。DRL在視訊遊戲、博弈、自動駕駛、機器人、自然語言了解、智能醫療等領域的應用日益增多。

2.我國人工智能發展戰略

2017年7月，國務院釋出《新一代人工智能發展規劃》，人工智能終于進入國家戰略規劃期，作為一項重要的國策。人工智能對各個産業的推動能力被擴大。新的人工智能一共分三步走的戰略目标計劃，在我國各領域展開。

第一步：中國智能制造

現在國家會将現有的傳統工業系統與現代的智能化和資訊化的技術進行結合，利用深度的神經網絡，将傳統的工業進行改革創新。

第二步：正式進入網際網路+的時代

我國将會把傳統的商業生産，帶動全民經濟，鼓勵企業的創新和改造。允許不同企業在産品上進行拓展。，2018《政府工作報告》中提出：“發展壯大新動能。做大做強新興産業叢集，實施大資料發展行動，加強新一代人工智能研發應用，在醫療、養老、教育、文化、體育等多領域推進‘網際網路+’。發展智能産業，拓展智能生活。運用新技術、新業态、新模式，大力改造提升傳統産業。”

第三步：國家戰略規劃期

國家進行戰略規劃發展，人工智能技術的應用将會進行不斷開發應用在生活的各個方面，關于人工智能的應用和科技人才的相關指導意見與落地政策紛紛頒布。各行各業也将與人工智能互相結合作為發展第一要務如何實作人工智能産業自身的創新？”，以及“如何将其應用到具體場景中？”，将會是各行業發展的關鍵點。