天天看点

推荐!国外程序员整理的机器学习资源大全

计算机视觉

MLPack

DLib

ecogg

shark

Closure Toolbox—Clojure语言库与工具的分类目录

go-porterstemmer—一个Porter词干提取算法的原生Go语言净室实现

paicehusk—Paice/Husk词干提取算法的Go语言实现

snowball—Go语言版的Snowball词干提取器

Go Learn— Go语言机器学习库

go-pr —Go语言机器学习包.

bayesian—Go语言朴素贝叶斯分类库。

go-galib—Go语言遗传算法库。

Hadoop—大数据分析平台

Spark—快速通用的大规模数据处理引擎。

Impala —为Hadoop实现实时查询

Twitter-text-js —JavaScript实现的推特文本处理库

NLP.js —javascript及coffeescript编写的NLP工具

natural—Node下的通用NLP工具

Knwl.js—JS编写的自然语言处理器

通用机器学习

Topic Models —Julia下的主题建模

Text Analysis—Julia下的文本分析包

Lua

NLP —一个Matlab的NLP库

OpenCVDotNet —包装器,使.NET程序能使用OpenCV代码

Emgu CV—跨平台的包装器,能在Windows, Linus, Mac OS X, iOS, 和Android上编译。

numl —numl这个机器学习库,目标就是简化预测和聚类的标准建模技术。

Math.NET Numerics— Math.NET项目的数值计算基础,着眼提供科学、工程以及日常数值计算的方法和算法。支持 Windows, Linux 和 Mac上的 .Net 4.0, .Net 3.5 和 Mono ,Silverlight 5, WindowsPhone/SL 8, WindowsPhone 8.1 以及装有 PCL Portable Profiles 47 及 344的Windows 8, 装有 Xamarin的Android/iOS 。

Sho — Sho是数据分析和科学计算的交互式环境,可以让你将脚本(IronPython语言)和编译的代码(.NET)无缝连接,以快速灵活的建立原型。这个环 境包括强大高效的库,如线性代数、数据可视化,可供任何.NET语言使用,还为快速开发提供了功能丰富的交互式shell。

SimpleCV—开源的计算机视觉框架,可以访问如OpenCV等高性能计算机视觉库。使用Python编写,可以在Mac、Windows以及Ubuntu上运行。

SciPy —基于Python的数学、科学、工程开源软件生态系统。

NumPy—Python科学计算基础包。

Numba —Python的低级虚拟机JIT编译器,Cython and NumPy的开发者编写,供科学计算使用

NetworkX —为复杂网络使用的高效软件。

Pandas—这个库提供了高性能、易用的数据结构及数据分析工具。

Open Mining—Python中的商业智能工具(Pandas web接口)。

PyMC —MCMC采样工具包。

zipline—Python的算法交易库。

PyDy—全名Python Dynamics,协助基于NumPy, SciPy, IPython以及 matplotlib的动态建模工作流。

SymPy —符号数学Python库。

statsmodels—Python的统计建模及计量经济学库。

astropy —Python天文学程序库,社区协作编写

matplotlib —Python的2D绘图库。

bokeh—Python的交互式Web绘图库。

plotly —Python and matplotlib的协作web绘图库。

vincent—将Python数据结构转换为Vega可视化语法。

d3py—Python的绘图库,基于D3.js。

ggplot —和R语言里的ggplot2提供同样的API。

Kartograph.py—Python中渲染SVG图的库,效果漂亮。

pygal—Python下的SVG图表生成器。

pycascading

自然语言处理

Ruby Machine Learning —Ruby实现的一些机器学习算法。

Machine Learning Ruby

jRuby Mahout —精华!在JRuby世界中释放了Apache Mahout的威力。

CardMagic-Classifier—可用贝叶斯及其他分类法的通用分类器模块。

Neural Networks and Deep Learning—《神经网络和深度学习》一书的示例代码。

数据分析/数据可视化

MLlib in Apache Spark—Spark下的分布式机器学习库

Scalding —CAscading的Scala接口

Summing Bird—用Scalding 和 Storm进行Streaming MapReduce

Algebird —Scala的抽象代数工具

xerial —Scala的数据管理工具

simmer —化简你的数据,进行代数聚合的unix过滤器

PredictionIO —供软件开发者和数据工程师用的机器学习服务器。

BIDMat—支持大规模探索性数据分析的CPU和GPU加速矩阵库。

继续阅读