今日播报!Monoid 和 Foldable
又要工作了……
(资料图片仅供参考)
Monoid
Monoid 在 Haskell 中有很多应用,且和折叠操作比较相关,值得学习。
幺半群 Monoid,或者说半群 with 幺元,那首先得了解半群和幺元是什么玩意。
半群 Semigroup 是这样一种数学结构,对非空集合 S,对 S 上的二元运算·: S x S -> S
,其满足结合律(即对集合 S 上的元素 a,b,c,有a · (b · c) = (a · b) · c
),则二元组(S, ·)
为半群;幺半群则在半群的基础上添加了一个幺元 identity element——任何元素对其作运算·仍旧得到它自身,这是说假如令幺元为 e,则对 S 上任意元素 a,有a · e = a = e · a
,三元组(S, ·, e)
为幺半群。
数学定义抽象且无聊,但幺半群的几个实例是非常明显的:
(Int,+, 0)
是幺半群——结合律:1 + (2 + 3) = (1 + 2) + 3
, 幺元:1 + 0 = 0 + 1 = 1
(Int,*, 1)
是幺半群——结合律:1 * (2 * 3) = (1 * 2) * 3
, 幺元:2 * 1 = 1 * 2 = 2
([a], ++, [])
是幺半群——结合律:[1,2] ++ ([3] ++ [4]) = ([1,2] ++ [3]) ++ [4]
,幺元:[1,2] ++ [] = [] ++ [1,2] = [1,2]
(String,++, "")
是幺半群,同上
结合律允许以任意顺序去执行这样的运算,这允许对其去并行计算。
Haskell 中定义了相应的 typeclass 用来表示幺半群:
实现其只需要指定二元运算(在半群实例中)和幺元即可,下面定义数字加法幺半群:
Monoid 的实例需要满足下面的定律:
容易发现,(Bool, &&, True)
和(Bool, ||, False)
也是幺半群:
应用
Monoid 的定义很简单,但其的使用的地方还是很多的,下面列一些可能常用的:
0. 列表是 Monoid。
1. Data.Text 是更高性能的字符串,其也是 Monoid 的实例,其无法像[Char]
一样使用++去拼接,因此需要使用半群的<>
去进行拼接:
2. Data.Monoid 包下定义了 newtype First
和 Last
,用于将Maybe m
视为 Monoid,二元运算为取第一个或最后一个 Just 值,取不到则为 Nothing(Nothing 为幺元);其特别适用于“取变量 x,如果 x 为 null,取变量 y”的需求(更抽象地说,对于变量 a,b,c,d,e…,从前往后或从后往前取第一个非 null 的变量):
注意,Data.Semigroup 包下也定义了 First 和 Last,但其行为和 Data.Monoid 包下的同名 newtype 不同,Semigroup 包下的 First 和 Last 仅是半群且和 Maybe 无关,二元运算为取前者或后者!(坑啊!
First 也可以直接用类型类Alternative
中的<|>
替代,这样更清晰些:
顺便,对于Maybe m
,若类型变量 m 是 Semigroup,则Maybe m
为 Monoid,二元运算行为是将包含的值进行拼接,其中 Nothing
为幺元:
3. Ordering
类型,即 compare 函数的返回值类型,也是 Monoid,其幺元是EQ
,二元运算的行为类似 First,其非常适合这种需求——先比较 x,如果 x 相等,比较 y。比如这里写一个函数比较两个字符串的长度大小,其中规定若两个字符串等长,则比较两个字符串内容:
同伦映射
乘法有一个所谓的分配律,这是说对实数 a,b,c,有 a * (b + c) = a * b + a * c
,定义f(x) = a * x
,有f(b + c) = f(b) + f(c)
,又能看到,f(0) = 0
,这时称函数 f 是一个加法幺半群到加法幺半群上的同伦映射 Homomorphism,抽象地说,对于 Monoid a 和 b,有:
如,length 是([a], ++, [])
到(Int, +, 0)
的同伦映射:
这玩意有什么用呢?简单来说,若有变量 a,b 是一个幺半群的元素且二元运算为+,求f(a + b)
的值,若 f 是同伦映射,就可以并行地计算f(a)
和f(b)
,然后使用对应二元运算得到结果。
但或许更有趣的地方是,Monoid 和折叠操作相关。
Foldable,但是 foldMap
Foldable 是列表的折叠操作的一般化,从而使任意类型具有折叠的能力。要实现 Foldable,需要实现 foldr 或者 foldMap,foldr 是老朋友了,foldMap 是何方神圣?
foldMap 的类型签名是foldMap :: (Foldable t, Monoid m) => (a -> m) -> t a -> m
,这是说,对于可折叠类型 t,如果有将其中元素映射成为某 Monoid 类型 m 的映射,就能把 t 折叠成 m。how?
考虑foldr f z [a, b, c]
,其可以表述为a `f` (b `f` (c `f` z))
,若令f = (<>), z = mempty
,就得到了a <> (b <> (c <> mempty))
,这正好是 mconcat 的定义:
可以看到,对于一个幺半群的列表,总是有一种方式去对它进行折叠操作,即是使用幺元作为初始值,使用二元运算作为操作符;将这泛化一步——若某列表中的元素能映射成为特定幺半群,则这个列表可以使用这个幺半群的方式去折叠,这就是 foldMap——先映射成为特定幺半群,再折叠:
foldMap 有一些非常有趣的玩法,比如定义 sum,product,all,any 等:
因为 mconcat 可以由 foldr 定义(实际上对左折叠也行,因为半群的结合性,但二元运算可能需要flip一下——半群不要求二元运算满足交换律),所以 foldMap 可以由 foldr 定义。这是对折叠操作的一种新的视角——先把列表元素类型映射成幺半群,再用二元运算去 concat 成一个值。
这里去使用 foldMap 去实现一个 reverse,同时也给出 foldr 的版本:
foldMap 的这种对折叠操作的看待方式相当有趣——每次进行列表或其它结构的折叠操作的时候,实际上都是定义了一个新的幺半群,将结构中的值映射到幺半群的类型,并使用幺半群的二元运算去做拼接。那么,是否有可能根据 foldMap 去定义折叠操作?
观察 foldr 的签名:
考虑折叠操作a -> b -> b
,为返回值加上括号得到 a -> (b -> b)
……唔姆唔姆,从这个角度上看 foldr,我们就是把列表中的元素 a 映射成为b -> b
,然后将其不断地应用在初始值 b 上,得到最终结果,于是,如何处理列表b -> b
和初始值 b?
好玩的地方来了:函数本身也是幺半群,幺元是 id,二元运算是函数组合,所以,我们可以先把b -> b
列表折叠成一个b -> b
,再应用它到初始值 b上,下面是定义:
这说明可以用 foldMap 去实现 foldr,前面又用 foldr 去实现 foldMap,它们可以互相实现;Haskell 中提供折叠操作的类型类是 Foldable,其允许仅定义 foldMap 或 foldr 去实例化它,这里给出列表的递归的 foldMap 实现:
Foldable 中还有许多有趣的玩意,比如用 foldr 去实现 foldl,foldr1 等,以及转换到列表,检查是否为空,获取容器长度,求最大最小值等:
toList 非常有趣,其证明任何可折叠的类型都可以转换成为列表,这借用了列表是幺半群这个特性:
toList reflects the fact that lists are the free monoid for Haskell types. “Free” here means any value can be promoted to the monoid in a way which neither adds nor erases any information (we can convert values of type a to [a] lists with a single element and back through (\x->[x]) and head in a lossless way)
应用
所以,在什么情况下 foldMap 会比 foldr 更香?
考虑二叉树:
能对这个树做什么操作呢?比如,对每个子树都应用相同操作,比如获取它以及所有子树的和,获取它的最大深度……
后两个操作显然都是折叠操作,所以,树是可以折叠的!那如何折叠呢?如果尝试去编写 foldr,那代码会显得比较(或者相当?)繁琐,但若使用 foldMap 的话,则会很容易:
定义了 Foldable 的实例后,定义 sumTree 就很简单了:
问题在于,maxDepth 无法使用这个 foldMap 去表述——从中无法抽象出合适的幺半群(是否真的如此??)。为什么如此呢?天知道。解决方案是编写一种树专属的折叠函数,其对每个值先做一次映射,再对每个子树进行合并,参数带上根结点和左右子树的值:
Bonus
下面在 typescript 里利用 foldMap 去实现了 sum 和 groupBy,使用了 type class 模式,比较有趣:
参考资料
https://en.wikibooks.org/wiki/Haskell/Monoids
https://en.wikibooks.org/wiki/Haskell/Foldable
《Haskell 趣学指南》
标签: NOTHING HASKELL LAST REVERSE FLIP FIRST COMPARE Alternative TypeScript TRUE JUST NULL STRING MAYBE WITH FALSE 简单来说 FREE 什么玩意 最后一个 什么情况 解决方案 HTTPS