天天看點

推薦一份優質機器學習資料清單怎麼避免“從入門到放棄”Step 1:剛邁腳上車,然後要幹嘛Step 2:站久了該找個座啦Step 3:聽聽懂路的老司機報下站Step 4:看看别人怎麼開車最後:一手+高質+深度的資訊feed

人工智能最近火到炸裂,不看吧擔心和時代脫節,看吧每天資訊多到想哭,資訊過載心好累腫麼辦?

來<( ̄︶ ̄)↗跟着GitHub上的資深使用者BAILOOL走,看看他們每日追蹤的資訊源,拿到第一手的學術進展和行業動态,不用再追着不同的網站看啦。

以下是原文

怎麼避免“從入門到放棄”

不少童鞋發現人工智能很火,産生牆裂的學習興趣(主要是工資高dei不dei),是以現在想上車學習,于是開始到處看“一文看懂”系列,或者開始修AI領域大牛的課程。

結果卻發現,看完之後什麼也沒看懂。或者課程聽起來很吃力,慢慢覺得自己智商跟不上,不像是這塊料,就放棄了。

上車姿勢不對啊童鞋們!知道大家剛開始控制不住寄幾,疲于奔命地到處搜羅入門資料和課程,GitHub上的好心人就整理一份機器學習上車指南,包含精挑細選的一手資訊、經無數人驗證的教程和高品質的資訊源。

Step 1:剛邁腳上車,然後要幹嘛

下了決心要轉行AI,就等于一隻腳上了車,不過一上來也别給自己整太大壓力,上來就看大磚頭的書或者報一門課程。

先來點簡單的,好培養自己的興趣和耐力,比如說,泡泡論壇。特别是如果你現在啥也不太懂,建議你每天打開電腦之後,别和妹紙聊微信了,别看農藥解說的直播了。克制一下自己内心的及時行樂

好好在Reddit這幾個論壇上泡一會,泡它一個早上:

  • machine_learning

    (https://www.reddit.com/user/techrat_reddit/m/machine_learning/)

  • MachineLearning

    (https://www.reddit.com/r/MachineLearning/)

  • computervision

    (https://www.reddit.com/r/computervision/)

  • learnmachinelearning

    (https://www.reddit.com/r/learnmachinelearning/)

還有,Quora上的這幾個闆塊也有很多料,:

  • Machine Learning

    (https://www.quora.com/pinned/Machine-Learning)

  • Computer Vision

    (https://www.quora.com/pinned/Computer-Vision)

  • Deep Learning

    (https://www.quora.com/pinned/Deep-Learning)

  • Reinforcement Learning

    (https://www.quora.com/pinned/Reinforcement-Learning)

Step 2:站久了該找個座啦

等到什麼時候,你看論壇的内容吃不飽,覺得自己需要更高階的知識充電,就可以轉戰去arXiv讀論文了。

簡單介紹一下(以下資訊來自Wiki),arXiv呢,是個收集實體學、數學、計算機科學與生物學的論文預印本的網站。将預稿上傳到arvix作為預收錄,可以防止自己的idea在論文被收錄前被别人剽竊。

是以arXiv是個可以證明論文原創性(上傳時間戳)的文檔收錄網站。現今的很多科學家習慣先将其論文上傳至arXiv.org,再送出予專業的學術期刊。

  • Computer Vision and Pattern Recognition

    (https://arxiv.org/list/cs.CV/recent)

  • Artificial Intelligence

    (https://arxiv.org/list/cs.AI/recent

  • Learning

    (https://arxiv.org/list/cs.LG/recent)

  • Neural and Evolutionary Computing(https://arxiv.org/list/cs.NE/recent)

不過arXiv有個缺點,就是自己搜尋相應的論文很麻煩。

是以有個大神,Andrej,建立了一個論文自動推送網站arxiv-sanity.com,使用者在上面建立一個自己的賬号之後,往上丢幾篇感興趣的文章,這個網站就可以自動推送從arXiv上搜來且符合使用者興趣方向的相關論文。

Step 3:聽聽懂路的老司機報下站

如果讀完論文之後,感覺一臉大寫的懵✘,辣可以上ShortScience.org那轉轉。

這個網站是專門的論文讨論網站,上面有很多大牛點評同行的工作,或者讀paper時做的筆記。大家看paper時也喜歡紮堆在ShortScience上發表自己的觀點和看法。

特别适合剛上車的新手,如果自己讀paper功力不太夠,get不到重點,需要有人導讀啥的,那麼可以上這個網站去看看其他大牛對這篇論文的評論(有點兒像看完電影,總是習慣性上豆瓣看影評的趕腳)

Step 4:看看别人怎麼開車

另外,還有個把paper和code整理到了一起的網站GitXiv.com,看名字就知道相當于GitHub和arXiv的合體。

在這個圈子裡,已經形成了一股趨勢,學術上一有最新進展,科學家都會把paper往arXiv上扔,然後沒幾天開發者們就把完成需求的開源代碼搶發在GitHub上,大家執行力都超強的說。

不過,兩個出處的連結沒有個統一的地方可以關聯在一起,不友善大家檢索,也不友善大家橫向比較和讨論,是以産生了這麼個根據地GitXiv,供大家紮堆,還可以同行打分評論。

至于怎麼上手自己開車,第5步之後就要靠大家去摸索啦,最後分享幾個高質的資訊源給大家。

最後:一手+高質+深度的資訊feed

到現在這個階段,可能一般的資訊流已經滿足不了你了。扔幾個我們圈内人都會鎖定的頻道:

  • HackerNews

    (https://news.ycombinator.com/news)

    矽谷技術圈和投資圈都會關注的新聞網站,資訊不僅和AI有關,還會涉及到創業和資訊安全,需要自己篩選。

  • DataTau(datatau.com)

    專門給資料科學家看的HackerNews。

  • AITopics

    (https://aitopics.org/search)

    可以自己設定訂閱規則或者訂閱源的資訊閱讀器。

油管上有幾個頻道做得也不錯,可以挑一個跟就好:

  • 3Blue1Brown

    (https://www.youtube.com/channel/UCYO_jab_esuFRV4b17AJtAw)

  • Two Minute Papers

    (https://www.youtube.com/channel/UCbfYPyITQ-7l4upoX8nvctg)

  • Robert Miles

    (https://www.youtube.com/channel/UCLB7AzTwc6VFZrBsO2ucBMg)

  • Siraj Raval

    (https://www.youtube.com/channel/UCWN3xxRkmTPmbKwht9FuE5A)

幾家AI巨頭的官方部落格也挺值得跟,可以扔進訂閱源裡:

  • Google

    (https://research.googleblog.com/)

  • Facebook

    (https://research.fb.com/blog/)

  • Nvidia

    (https://blogs.nvidia.com/blog/category/deep-learning/)

  • Apple

    (https://machinelearning.apple.com/)

更新頻率有點兒低,不過每次更新都是猛料的:

  • Google Scholar

    (https://scholar.google.com/)

  • ResearchGate

    (https://www.researchgate.net/)

  • Distill

    (https://distill.pub/)

推特上活躍的領域大牛必須關注一波(什麼?你還沒有推特?那你怎麼活在AI圈子裡!快,别墨迹,現在就去搞一個賬号):Deep Learning Hub;Marshall Kirkpatrick;Lynn Cherny;Top-N;Top 10 AI;Text Data, Vis & Art。

這裡就提這麼幾個人,等你到推特上之後關注完,推特會自己再給你推相關的大神的。

最後,有幾個私人部落格我覺得資訊篩選的品質都符合我平時閱讀的标準,大家挑一個喜歡的就好:

  • The Wild Week in AI

    (https://www.getrevue.co/profile/wildml)

    周更,上面時不時還會有初創團隊招人資訊放出來,比較适合找工作的孩紙。

  • inFERENCe(inference.vc)

    不定期更,部落客是隔了三年沒碰機器學習,然後重新撿回來相關的研究進展。這個博是他個人的一個學習機器學習的成長記錄地。

  • The Morning Paper

    (https://blog.acolyer.org/)

    日更,這個部落格是一個原本什麼都不懂的VC開的,初心是想開始積累自己在ML領域的認知,資訊的選取更多是從投資者的角度出發。

  • Inside AI

    (https://inside.com/ai)

    Inside網站旗下的AI話題闆塊,專注于資訊的深度。現在大多數新聞都是為了流量,吸引讀者的眼球,而很少考慮讀者的收獲,導緻優質新聞的産出和占道越來越少,很難到達渴望深度内容的讀者。是以,Inside AI希望經過他們的篩選,訂閱使用者能重新擷取有價值的新聞資訊。

最後,附上原文連結:

https://github.com/BAILOOL/DoYouEvenLearn/blob/master/README.md