零知识证明引论(三)

安比技术社区 2021-01-25 20:16


在之前的文章中,我们介绍了零知识证明的基础概念以及构造 zkSNARK 的基本思想和方法。从本文开始,我们将逐一介绍目前最热门的 zkSNARK 方案。文章旨在让读者理解这些方案的基本原理。为了方便叙述并容易理解,在叙述方案时,我们会做一些简化处理,重在传达方案的核心思想。


本文介绍的是 Groth16 方案。Groth16 方案,顾名思义,就是 Groth 在 2016 年发表的一篇论文 [Gro16] 中提出的方案。目前为止,Groth16 是在实践中使用最广泛的 zkSNARK (没有之一)。特别一提的,Zcash 目前使用的 zkSNARK 方案就是 Groth16。从性能上,Groth16 的 Verifier 性能是所有 zkSNARK 中最快的,其证明字符串也是最短的。

而 Groth16 的最大缺点就是它需要对每个电路都执行一次可信初始化。

在介绍 Groth16 之前,简单回顾一下 zkSNARK 所要解决的问题。我们称这个问题为“计算验证问题”。


计算验证问题


任何计算都可以描述为一个算术电路。一个算术电路可以对数字进行算术运算。电路由加法门、乘法门以及一些常数门组成,如下图所示:

Image

这个例子中的电路包含了 15 个门。这个电路所描述的计算过程需要输入五个数字 ,输出四个数字。
给定一组输入的数字,需要把这个电路中的每个门都计算一遍,才能计算出这个电路的输出。在这个例子中,如果输入是 ,则电路的输出为 ,如下图所示:

Image

计算验证问题是指,如果一个验证者——不妨叫做 Verifier——只拿到了电路的一组输入和输出,如这个例子中的 ,它该如何验证这是一对合法的输入和输出呢?最简单粗暴的方法就是把这个输入重新扔进电路算一遍。如果电路很大的话,这个验证方法最大的缺点就是效率问题。

Image

有些场景下,效率还不是唯一的问题。例如,输入可能包含 Verifier 不能知道的秘密信息。假设上例中的 是秘密输入,Verifier 只能看到 ,如下图所示。此时 Verifier 要验证的问题就变成了“是否存在 使得电路在输入 的时候的输出是 ”。这个场景下,即使是简单粗暴的重新计算也不再可行。

Image

一句话概括计算验证问题:Verifier 能否在不知道秘密输入的情况下,高效地验证计算结果?



从电路到 R1CS 问题

一个 zkSNARK 就是对上述问题的一个解决方案。使用 zkSNARK,一个证明者,叫做 Prover,可以为计算过程生成一个简短的证明字符串。Verifier 读取这个字符串,就可以判断给定的公开输入和输出是否合法。

Groth16 是众多 zkSNARK 构造方案中的一种。接下来,我们介绍 Groth16 是怎么解决计算验证问题的。

首先,我们重新审视一下 Verifier 的任务:我们只知道电路的前两个输入是 ,我们的目标是要判断是否存在一组合法的秘密输入,使得电路的输出是 。如果我们换个角度看这个问题,它其实可以描述为:给一个电路,上面有些空格可以填数字,有些空格已经填上了数字,请问是否存在一种填法,能够同时满足每个门的逻辑?

从这个新的角度,计算验证问题被转换成了一个类似于数独那样的填数字游戏:有一些空格,一部分已经填上,请你填上另外一些空格,满足一些限制条件。

接下来,我们再把这个填数字游戏变成一个数学问题。这个转换其实就是列方程,用到的是小学时就学过的技巧:如果你想要求出一个数字,就把它设为 。只不过,遵循零知识证明领域的规范,这里我们把没有填的空格命名为变量 ,而把已经知道的空格命名为变量 。如下图所示,我们把值已经公开的空格标记为绿色,待求的空格标记为蓝色:

Image


然后,我们为每一个要满足的条件列一个方程。这里,每个要满足的条件其实就是一个门的逻辑:加法门的输出等于两个输入之和,乘法门的输出等于两个输入之积。于是,原来的填空游戏就变成了一个多元方程组。上述例子转化得到的方程组如下:

最后,我们对这个方程做一些整理,使得它能够写成矩阵和向量的形式,更加整齐和简洁。我们把每个方程都写成 的模式。尽管并不是所有方程中都有乘法,但我们可以给没有乘法的式子乘上一个 。于是方程组变成了下面这个样子:

此时,每 中都只包含加法,而不包含乘法。确切地说,每个 都是若干变量的相加,有时可能会加上一个常数。更进一步地说,每个 都是所有变量 和常数 的线性组合。于是,设向量 为所有变量以及常数 组成的向量。那么,每个 都是 与另外一个常向量的内积。例如,,这里用 表示内积。于是,每个方程都可以写成  的形式,其中 , 是方程组中第 个方程对应的三个常向量。

把所有方程合到一起,就得到了原方程组的矩阵表示

其中 的行向量就是所有的 ,矩阵 也类似。这里 表示向量的逐项相乘。这三个矩阵 的值完全取决于电路的结构。

我们把最终得到的这个矩阵向量方程叫做一个 Rank-1 Constraint System (R1CS)

至于名字中的 "Rank-1" 是怎么来的,如果你感兴趣的话,可以这么理解。每个方程 的等号右侧可以写成 ,其中 就是一个秩为 的矩阵。

总结一下,这一节中我们把计算验证问题转化成了数学问题 R1CS。

在计算验证问题中,Verifier 知道一个电路,拿到公开部分的输入,以及电路的输出,判断它们是否合法。

而在 R1CS 问题中,Verifier 知道三个矩阵 ,并拿到向量 的一个前缀,判断是否存在一个完整的 ,满足

Image

从 R1CS 问题到 QAP 问题

在零知识证明领域,R1CS 基本上就是电路的代名词。许多 zkSNARK 把 R1CS 问题作为目标问题。不过,大部分 zkSNARK 不会直接对 R1CS 下手,而是把 R1CS 问题继续转化,得到一个等价的多项式问题,再对这个多项式问题设计证明方案。Groth16 也不例外。不同的 zkSNARK 选择的多项式问题各不相同,Groth16 选择的是一个叫做Quadratic Arithmetic Programming (QAP)的问题。

这一节中介绍一下怎样把 R1CS 问题转化为等价的 QAP 问题。

首先,把矩阵和向量的乘积看做对矩阵的列向量的线性组合,这个线性组合的系数由被乘的向量决定。从这个角度看,R1CS 问题就是:给定三个向量集合 (也就是 的列向量),判断是否存在一个线性组合 (也就是 ),使得 的列向量分别组合起来 (也就是 ),逐项乘积等于 的列向量的组合 (也就是 )。如下图所示

Image

然后,我们把这些列向量换成多项式,使得多项式方程和原先的向量方程等价。
把向量转化成多项式的一种方式是使用多项式插值。

多项式插值

多项式插值可以把向量 (例如 ) 转化成多项式 ,使得 在一个点集 (例如 ) 上面的取值刚好是 ,也就是说 。我们称 在插值域 上的多项式插值。
给定一个插值域 ,向量 可以插值为很多不同的多项式。不过,其中次数低于 的多项式有且仅有一个。如果不特别说明,当我们说起 的多项式插值时,默认说的就是这个唯一的次数低于 的多项式。
很容易看出,多项式插值是线性的,也就是说,如果 分别是 的多项式插值,那么对任意的数字 也是 的线性插值。

Image

 QAP 问题

现在,我们直接把 R1CS 矩阵中的列向量换成它们的多项式插值,得到的结果如下图所示。

Image

因为多项式插值是线性的,把各个矩阵的列向量插值得到的多项式经过 线性组合之后,得到的 ,就是向量 各自的多项式插值。
在 R1CS 问题中,我们要求 ,这等价于说对插值域中的每个 。注意,这并不等于说多项式方程 成立。实际上,因为 的次数比 更高,它们并不相等。我们只能推出, 都是多项式 的根。这等价于多项式 整除
总结一下,一个 QAP 包含如下信息
  1. 三个多项式集合 , ,其中每个多项式次数都小于
  2. 一个 次多项式
有了一个 QAP 之后,我们说一个 QAP 问题是指,给定 的长度为 的前缀,判断是否存在 的完整赋值,使得下面的多项式被 整除
我们用一个表格总结一下上文中提到的所有问题。

已知信息秘密信息满足条件固定信息
电路
电路
电路的部分输入以及输出
电路所有线路上的值
所有门的逻辑
R1CS
矩阵
的前缀
完整的

QAP
多项式集合 以及
的前缀
完整的
整除由 计算得到的一个很复杂的多项式
为什么要越搞越复杂,把电路问题转化为 QAP 问题呢?一个简单的回答:就是为了引入多项式!多项式是一个强大的工具。多项式的作用,可以理解为一个“杠杆”,或者叫“误差放大器”。如果我们要检查两个长度为 10000 的向量是否相等,一定需要检查 10000 次,哪怕检查过了 9999 个点都是一样的,也不能保证最后一点是相同的。而两个 10000 次的多项式,哪怕非常接近,比如说它们的系数有 9999 个都相同,或者它们在 这些点上的取值都相等,但只要有一个点不同,这两个多项式就截然不同。这意味着,如果在一个很大的范围内,例如 当中均匀随机选一个点,两个不同的多项式在这个点上相等的机会只有 。检查两个多项式是否相等,比检查同样规模的向量要快得多,这几乎是所有 zkSNARK 提高 Verifier 效率的根本原理。


为 QAP 问题构造 zkSNARK

QAP 问题就是 Groth16 要用来构造 zkSNARK 的最终问题了。不过,在解释 Groth16 的构造细节之前,我们先准备一些工具。

 准备工具

我们假设读者对椭圆曲线群的基本特性和应用有所了解,并采用加法群的记号来描述椭圆曲线群中的点和运算。椭圆曲线群中的元素可以用来表示多项式,并限制 Prover 必须使用给定的多项式来进行线性组合。这正是 QAP 所需要用到的特性。

我们看一下椭圆曲线是怎么用来表示多项式的。

KoE 假设

考虑一对点 ,如果它们满足 ,我们说 是一个 -对。根据离散对数假设,从 是难以计算出 来的。

如果不告诉你 ,只告诉你一个 -对 ,请问,你要怎样制造出另一个 -对?
一个显而易见的方法是,把 同时乘上一个整数倍数 ,那么 也是一个 -对。
直觉告诉我们,这是从已知的 -对产生新的 -对的唯一方式。换句话说,如果你有能力输出一个 -对 ,那么,你一定“知道”一个倍数 使得 以及 。这个“知道”的含义是,你的计算过程一定“蕴含”了 。如果把你计算 的过程全部记录下来,这个记录中要么包含了 ,要么包含了一些数据,从这些数据中可以轻易地推导出 来。
更一般地,如果你已经有了一组 -对,例如 , , , ,那么产生一个新的 -对的唯一方式,是计算它们的线性组合。也就是说,如果你输出了一个新的 -对 ,你必须“知道”它们之间的组合系数,即 使得 以及
然而,上述直觉并不能从离散对数假设严格地证明而来。所以,只能把它作为一个新的安全性假设来用。这个假设就叫做 Knowledge-of-Exponent (KoE) 假设。
KoE 假设怎样应用到 QAP 问题上呢?那就是,KoE 允许我们使用椭圆曲线点来表示多项式,并且迫使 Prover 只能从已知的多项式线性组合产生新的多项式。
首先,怎样用椭圆曲线点表示多项式呢?假设 是椭圆曲线群中的一个点, 都是秘密的数字。Prover 拿到了 -对:,那么,根据 KoE 假设,在 Prover 的计算能力范围内,它所能够产生的所有 -对,就是这些已知的 -对的线性组合,其关于 的倍数恰好是 的一个 次多项式,不妨记为
注意到,对于任意多项式 ,它对应的 对是唯一的,也就是 。但反过来,对于任何 -对 ,使得 的多项式