<b>本文讲的是[译]Functor 与 Category (软件编写)(第六部分),</b>
所谓 functor(函子),是能够对其进行 map 操作的对象。换言之,functor 可以被认为是一个容器,该容器容纳了一个值,并且暴露了一个接口(译注:即 map 接口),该接口使得外界的函数能够获取容器中的值。所以当你见到 functor,别被其来自范畴学的名字唬住,简单把他当做个 “mappable” 对象就行。
“functor” 一词源于范畴学。在范畴学中,一个 functor 代表了两个范畴(category)间的映射。简单说来,一个 范畴 是一系列事物的分组,这里的 “事物” 可以指代一切的值。对于编码来说,一个 functor 通常代表了一个具有 <code>.map()</code> 方法的对象,该方法能够将某一集合映射到另一集合。
上文说到,一个 functor 可以被看做是一个容器,比如我们将其看做是一个盒子,盒子里面容纳了一些事物,或者空空如也,最重要的是,盒子暴露了一个 mapping(映射)接口。在 JavaScript 中,数组对象就是 functor 的绝佳例子(译注:<code>[1,2,3].map(x => x + 1)</code>),但是,其他类型的对象,只要能够被 map 操作,也可以算作是 functor,这些对象包括了单值对象(single valued-objects)、流(streams)、树(trees)、对象(objects)等等。
对于如数组和流等其他这样的集合(collections)来说,<code>.map()</code> 方法指的是,在集合上进行迭代操作,在此过程中,应用一个预先指定的函数对每次迭代到的值进行处理。但是,不是所有的 functor 都可以被迭代。
在 Haskell 中,functor 类型被定义为如下形式:
fmap 接受一个函数参数,该函数接受一个参数 <code>a</code>,并返回一个 <code>b</code>,最终,fmap 完成了从<code>f a</code> 到 <code>f b</code> 的映射。<code>f a</code> 及 <code>f b</code> 可以被读作 “一个 <code>a</code> 的 functor” 和“一个 <code>b</code> 的 functor”,亦即 <code>f a</code> 这个容器容纳了 <code>a</code>,<code>f b</code> 这个容器容纳了 <code>b</code>。
使用一个 functor 是非常简单的,仅需要调用 <code>map()</code> 方法即可:
一个范畴含有两个基本的定律:
同一性(Identity)
组合性(Composition)
由于 functor 是两个范畴间的映射,其就必须遵守同一性和组合性,二者也构成了 functor 的基本定律。
如果你将函数(<code>x => x</code>)传入 <code>f.map()</code>,对任意的一个 functor <code>f</code>,<code>f.map(x => x) == f</code>。
functor 还必须具有组合性:<code>F.map(x => f(g(x))) == F.map(g).map(f)</code>
函数组合是将一个函数的输出作为另一个函数输入的过程。例如,给定一个值 <code>x</code>及函数 <code>f</code>和函数 <code>g</code>,函数的组合就是 <code>(f ∘ g)(x)</code>(通常简写为 <code>f ∘ g</code>,简写形式已经暗示了<code>(x)</code>),其意味着 <code>f(g(x))</code>。
很多函数式编程的术语都源于范畴学,而范畴学的实质即是组合。初看范畴学,就像初次进行高台跳水或者乘坐过山车,慌张,恐惧,但是并不难完成。你只需明确下面几个范畴学基础要点:
一个范畴(category)是一个容纳了一系列对象及对象间箭头(<code>-></code>)的集合。
箭头只是形式上的描述,实际上,箭头代表了态射(morphismms)。在编程中,态射可以被认为是函数。
对于任何被箭头相连接的对象,如 <code>a -> b -> c</code>,必须存在一个 <code>a -> c</code> 的组合。
所有的箭头表示都代表了组合(即便这个对象间的组合只是一个同一(identity)箭头:<code>a->c</code>)。所有的对象都存在一个同一箭头,即存在同一态射(<code>a -> a</code>)。
如果你有一个函数 <code>g</code>,该函数接受一个参数 <code>a</code> 并且返回一个 <code>b</code>,另一个函数 <code>f</code> 接受一个<code>b</code> 并返回一个 <code>c</code>。那么,必然存在一个函数 <code>h</code>,其代表了 <code>f</code> 及 <code>g</code> 的组合。而 <code>a -> c</code>的组合,就是 <code>f ∘ g</code>(读作<code>f</code> 紧接着 <code>g</code>),进而,也就是 <code>h(x) = f(g(x))</code>。函数组合的方向是由右向左的,这也就是就是 <code>f ∘ g</code> 常被叫做 <code>f</code> 紧接着 <code>g</code> 的原因。
函数组合是满足结合律的,这就意味着你在组合多个函数时,免去了添加括号的烦恼:
让我们再看一眼 JavaScript 中组合律:
给定一个 functor,<code>F</code>:
下面的两段是等效的:
译注:functor 中函数组合的结合率可以被理解为:对 functor 中保存的值使用组合后的函数进行 map,等效于先后对该值用不同的函数进行 map。
一个 endofunctor(自函子)是一个能将一个范畴映射回相同范畴的 functor。
一个 functor 能够完成任意范畴间映射: <code>F a -> F b</code>
一个 endofunctor 能够完成相同范畴间的映射:<code>F a -> F a</code>
在这里,<code>F</code> 代表了一个 functor 类型,而 <code>a</code> 代表了一个范畴变量(意味着其能够代表任意的范畴,无论是一个集合,还是一个包含了某一数据类型所有可能取值的范畴)。
而一个 monad 则是一个 endofunctor,先记住下面这句话:
“monad 是 endofunctor 范畴的 monoids(幺半群),有什么问题?”(译注:这句话的出处在该系列第一篇已有提及)
现在,我们希望第一篇提及的这句话能在之后多一点意义,monoids(幺半群)及 monad 将在之后作介绍。
下面将展示一个简单的 functor 例子:
显然,其满足了 functor 定律:
现在,你可以对存在该 functor 中的任何数据类型进行 map 操作,就像你对一个数组进行 map 时那样。这简直太美妙了。
上面的代码片展示了 JavaScript 中 functor 的简单实现,但是其缺失了 JavaScript 中常见数据类型的一些特性。现在我们逐个添加它们。首先,我们会想到,假如能够直接通过 + 操作符操作我们的 functor 是不是很好,就像我们在数值或者字符串对象间使用 <code>+</code> 号那样。
为了使该想法变现,我们首先要为该 functor 对象添加 <code>.valueOf()</code> 方法 —— 这可被看作是提供了一个便捷的渠道来将值从 functor 盒子中取出。
现在代码更漂亮了。但是如果我们还想要在控制台审查 <code>Identity</code> 实例呢?如果控制台能够输出 <code>"Identity(value)"</code> 就太好了,为此,我们只需要添加一个 <code>.toString()</code> 方法即可(译注:亦即重载原型链上原有的 <code>.toString()</code> 方法):
现在,我们的 functor 还能这样工作:
假如你想借助 <code>Identity(n)</code> 来返回包含了 <code>n+1</code>,<code>n+2</code> 等等的 Identity 数组,这非常容易:
但是,如果你想上面的操作方式能够应用于任何 functor,该怎么办?假如我们规定了每种数据类型对应的实例必须有一个关于其构造函数的引用,那么你可以这样改造之前的逻辑:
假如你还想知道一个值是否在一个 functor 中,又怎么办?我们可以为 <code>Identity</code> 添加一个静态方法 <code>.is()</code> 来进行检测,另外,我们也顺便添加了一个静态的 <code>.toString()</code> 方法来告知这个 functor 的种类:
现在,我们整合一下上面的代码片:
注意,无论是 functor,还是 endofunctor,不一定需要上述那么多的条条框框。以上工作只是为了我们在使用 functor 时更加便捷,而非必须。一个 functor 的所有需求只是一个满足了 functor 定律 <code>.map()</code> 接口。
说 functor 多么多么好不是没有理由的。最重要的一点是,functor 作为一种抽象,能让开发者以同一种方式实现大量有用的,能够操纵任何数据类型的事物。例如,如果你想要在 functor 中值不为 <code>null</code> 或者不为 <code>undefined</code> 前提下,构建一串地链式操作:
你可以使用自己喜欢的 curry 化方法(译注:Underscore,Lodash,Ramda 等第三方库都提供了 curry 化一个函数的方法),或者使用下面这个之前篇章提到的,基于 ES6 的,充满魅力的 curry 化方法来实现参数的部分应用:
现在,我们可以自定义 <code>map()</code> 方法:
functor 是能够对其进行 map 操作的对象。更进一步地,一个 functor 能够将一个范畴映射到另一个范畴。一个 functor 甚至可以将某一范畴映射回相同范畴(例如 endofunctor)。
一个范畴是一个容纳了对象和对象间箭头的集合。箭头代表了态射(也可理解为函数或者组合)。一个范畴中的每个对象都具有一个同一态射(<code>x -> x</code>)。对于任何链接起来的对象 <code>A -> B -> C</code>,必存在一个 <code>A -> C</code> 的组合。
总之,functor 是一个极佳的高阶抽象,能然你创建各种各样的通用函数来操作任何的数据类型。
未完待续……
<b></b>
<b>原文发布时间为:2017年4月18日</b>
<b>本文来自云栖社区合作伙伴掘金,了解相关信息可以关注掘金网站。</b>