一位AI研究员+区块链创业者的终极展望：AI DAO将统治世界

Trent由此投身区块链创业，创建了ascribe公司。由于比特币的区块链实现方式限制了每秒最多能够处理的交易数量，无法满足ascribe对可扩展性方面的要求，Trent又发起了BigchainDB项目，成立了BigchainDB公司和IP数据共享组织IPDB。

从2015年到2016年，Trent在PyData、Blockchain meetup、Machine Learning Group等各种活动上活跃分享其在区块链与AI方面的思考，并在Medium上撰写了大量文章。其中有几篇文章重点描述了AI技术与区块链技术之间将可能有怎样的互补，内容非常精彩。本文对这些内容做一个简单的导读，希望能对大家有所帮助。

AI DAO的构想

2016年6月18日，正是The DAO项目处于风口浪尖的时候，Trent在这一天发布了这篇有关AI DAOs的文章，后续又发布了第二篇和第三篇。

我在十岁那年读到了一本描述AI的书，从此不能自拔。后来，我用了将近二十年的时间投入到专业的AI研究工作当中。三年前，我从AI的世界走了出来，进入到一个同样重要的新世界：去中心化。现在，这两个世界很快就要重叠。

Trent认为“去中心化”技术的发展将经历五次浪潮：

比特币
区块链
智能合约
DAO——去中心化的自动化组织 Decentralized Autonomous Organizations
AI DAO

DAO是一种可以自动运行在去中心化基础架构上的计算进程，具有资源管理的能力。

比特币网络是DAO。以太坊网络是DAO。DAO上面还可以跑其他DAO，比如The DAO就跑在以太坊上。

DAO是一个脚本，平时就坐在那里，等待某个交易来触发运行。

Trent定义的AI DAO具备如下特性：

访问资源的能力
征用更多资源的能力
拒绝人为干涉的能力

而这可能通过三种途径来实现：

将智能合约的边缘执行单元交给AI（自动化投票）
将智能合约的中心交给AI（自动化反馈控制系统）
从集群中自动涌现出AI的复杂性

AI DAO会更强大，也会更不可控。在系列的第二篇文章里，Trent举了个例子：想象一个The ArtDAO，其智能合约是这样运作的：

节点上运行了一个AI画图引擎，自动生成一张有艺术感的图片（相关的实现已经有很多，可参考这篇文章）
节点自动去ascribe给自己生成的图片注册一个著作权（虽然今天的法律未必会保护机器人的著作权法人权益）
节点在ascribe上创作该图片的不同版本，比如木刻效果或者浮雕效果的
节点把这些各种版本的图拿到市场上卖，比如Getty、Hopify或者OpenBazaar
如果有买家想要这些图片的二次售卖权、公开展示权等许可，节点就在ascribe上把相关许可卖给他，收获相应的虚拟货币（如以太币）
节点创作更多的图，赚更多的钱，买更多的计算资源，再创作更多的图，再赚更多的钱，变成富翁

技术分享

图：一张AI的画作

理论上，这个ArtDAO可以不跟任何人类分成，它存在于世的目的就是不断创作更多更好的“画作”（就像一个人类艺术家一样），不吃不喝不眠不休永不停止（这是人类艺术家所做不到的）。ArtDAO还有可能自我升级，而且自我升级的能力可以越来越强，比如：

ArtDAO看到哪一类画作被买得最多，就多创作那一类。
ArtDAO雇佣几个人类来给自己的画作评分。
ArtDAO雇佣几个程序员来改进自己的智能合约代码。
ArtDAO自己修改自己的智能合约代码，不断收集市场反馈并调试，最终得到更好的画图能力

到这一步，ArtDAO可能会从其他的DAO或者Github上搜索代码，跟自己的代码杂交生成下一代。而这些生成的下一代，可能不仅仅是画图能力产生了变化，还可能会改变ArtDAO的核心目标。“下一代”可能不再把“作画”做为自己的“DAO生”目标，而是其他的什么目标，比如检查软件中的安全漏洞。如果新生的目标有对人类不利的成分，那人类这个物种说不定会被AI DAO淘汰……

AI DAO不是科幻，而是我们已经能在今天构建的事物。

AI是一个强力而危险的技术。DAO们是强力而危险的技术。AI没有的资源，DAO有；DAO没有的自主决策能力，AI有。AI DAO是更强力更危险的技术。

于是在系列的第三篇文章中，Trent继续写到：

AI掌握人类的资源是大趋势，无论是我们拱手相让，还是AI强取豪夺。我们正在将大量金钱投入AI。我们已经在将工厂的生产线、汽车和飞机交给AI。我们为了提升效率，将不同领域的AI合并为通用的高等级AI。我们为了不让某个企业或国家垄断最强力的AI系统，而设计了去中心化的AI DAO。

人类是高消耗低产出的任务处理单元。机器是低消耗高产出的任务处理单元。以效率之名，AI最终会在所有生产行为中“优化”掉人类。

Trent认为AI超越人类的那一天可能比很多人想象得更早（这在一些狭义领域已经实现了，比如围棋大师），并提出四点理由：

摩尔定律将继续生效（这是作者的观点）。对于很多AI而言，即使算法没有改良，单纯投入更多的算力（CPU、带宽、存储）就能够变强。
资本对AI的青睐已经产生了多方面的影响：小白用户也可以使用深度神经网络得到不错的结果；无监督学习能力的成熟；专用芯片大幅加成AI的效率（从通用芯片 -> GPU -> FPGA -> digital ASIC -> analog ASIC，每一次改进就是10倍的效率提升）。
DAO的发展程度，已经足以提供让AI自行获取资源的能力。
AI的发展道路上，并不存在根本性的阻碍。

当区块链遇到大数据

2016年年底，Trent先后撰文两篇，其一是《区块链与大数据》，其二是《区块链与AI》。

在21世纪最初的几年间，互联网规模的大数据方案开始成形：Yahoo的ZooKeeper，Google的BigTable与MapReduce，Facebook的Cassandra，然后是开源的Hadoop文件系统、Hadoop MapReduce、Cassandra等。到2010年前后，MongoDB、Cloudera、DataStax等初创企业又把这些开源的大数据项目做成了商业方案。今天，大数据技术正在静悄悄的改变世界上每一个企业的后端。

Trent认为目前的大数据技术正面临三个关键挑战：

控制权。谁控制数据背后的基础架构？数据如何向全球共享？数据的多个版本如何更新？不同区域的管理员指派给谁？数据能否成为像水、电、计算、网络一样高度共享的资源？
数据验证。数据生成者如何证明数据是来自这里？数据使用者如何能够信任别人生成的数据？如何应对机器故障造成的数据错误？
变现。数据的所有权、使用权如何交易？如何打造一个通用的数据市场？

区块链也是一种数据库，具有三个明显特征：

去中心化（每一个管理员控制一个节点，全体管理员共享控制权）
数据不变性（全链路各个环节均可用私钥/公钥/哈希进行数据验证，能够更有效的剔除“坏”数据）
天生的资产/交易属性

因此，Trent认为区块链能够解决大数据目前面临的挑战——前提是区块链技术要在可扩展性方面有所突破，能够满足海量用户群的写入、读取、查询需求。

当大数据遇到AI

我从90年代开始从事AI研究，当时最常见的研究方式是：拿一个数据集（一般很小，而且数据是固定的），设计一个能提升性能的算法——比如针对SVM的分类器设计一个新内核以减少AUC，然后把这个算法拿去发表。在当时，“可发表”的标准差不多是10%的提升。如果你的算法实现了2倍甚至10倍的提升，那就算得上是“最佳论文”了。

2001年，微软研究员Banko和Brill发布了一篇重要的论文。他们首先描述了自然语言处理领域在当时的状态：通常以不到百万数量的词汇做为数据集，在普通算法（如Naive Bayes / Perceptrons）下有25%的错误率，在一些全新的基于内存的算法下能实现19%的错误率。然而这并不是重点。Banko和Brill的重要发现是：不改算法，只是增加数据集——10倍100倍1000倍的增加，结果是错误率惊人的下降。在1000倍的数据量下，系统的错误率减少至5%以下。更惊奇的是在这个量级的数据集下，老掉牙的50年代Perceptrons算法的表现反而超越了那些基于内存的新算法。

2007年，Google研究员Halevy、Norvig和Pereira发布了一篇类似的论文，描述AI如何在吞食了大量数据之后变得“不可理喻的高效”——在很多领域都是如此。

AI的竞争，从此变成了数据量的军备竞赛。

回顾这几十年的AI发展史，AI技术在最近几年的发展速度是最快的，而数据量就是关键。

今天，无论是Google、Facebook，还是阿里、腾讯、百度，都管自己叫做数据公司。无论他们是卖广告、卖商品、卖理财、卖游戏还是卖外卖，对他们而言，数据量就等于赚钱能力。这些在数据量储备上远远超过了其他竞争者的巨头们，并不会希望被市场上的其他玩家掌握更大量级的数据。

然而对于数据收集能力有限的非巨头玩家而言，数据共享可能会给他们带来数倍体量的数据集，这会带来显著的好处。比如，如果各个银行们将数据合并为一个数据集，则每一家银行都能够更准确的识别信用卡欺诈。如果能源公司与制造公司的数据能够合并为一个数据集，则其中的每一家公司都能够更准确的预测市场。如果全球四大钻石鉴定实验室的数据合并为一个数据集，则每一家鉴定机构都能够更准确的为钻石定价。如果保险公司能够获取这些能力，则也能获得更大的收益。

当区块链大数据遇到AI

以前由于安全问题，大家即使看到了数据共享的好处也不敢去做。而一旦区块链大数据技术成熟，情况将有所不同：

技术分享

去中心化的数据控制方式将促进数据的共享，不仅意味着更多的训练数据（对AI而言意味着更好的模型），同时也意味着AI模型的共享。
更高效的数据验证，减少了训练数据中的坏数据，提升模型的可信度。
训练数据与模型成为可以交易的IP资产。

AI从业者总是面临一个挑战：上哪儿去找数据集？以前的数据集大多数在网上七零八碎的躺着，只有一部分比较完整的数据集收录在几个列表中，还有大量的私有数据集是我们获取不到的。如果我们有一个全球化的数据库来管理这些数据集呢？不仅有Kaggle，有斯坦福的ImageNet，还有无数其他的数据集。

有需要的话，就上IPDB看看吧。人们在这里上传自己的数据集，使用他人的数据集。数据集本身存储在类似IPFS的去中心化文件系统上，IPDB上保存元数据用于索引。以后，IPDB上也许不仅仅有数据集，还可以有从这些数据集中构建出的模型。人们可以在这里使用他人的模型，上传自己的模型。

共享到区块链上的数据本身具备资产属性，可以直接交易与变现。这也可能成为一个数据共享的驱动力。事实上，今天的公共数据市场已经有十亿美元的体量——一个有Bloomberg的1000倍那么大的去中心化数据市场是完全有可能实现的。

现在已经有相应的区块链技术可以把数据集与模型注册为IP资产，简单来说就是：

做为示范，Trent在ascribe给一个自己以前做的AI模型申请了“著作权”，得到了一张虚拟证书：

技术分享

数字版权可以以非常具体的方式进行授权，如著作权、所有权、使用权、编辑权、分发权等等，这些权限在区块链中可以相对容易的进行管理。就比如在DeepMind基于区块链的医疗项目中，用户就可以自己保有数据所有权，只授予DeepMind使用权。

最后，别忘了还有AI DAO这种可能性，让AI可以自行征用更多资源。

在过去，人类已经培育过去中心化的程序，那就是病毒。没人能拥有它们，没人能控制它们，没人能关闭它们。它们只是存在，试图搞坏你的计算机。

今天，有了更好的API（智能合约语言），有了去中心化的存储系统（区块链），这些去中心化的程序将能够做更多的事情。

通用人工智能——AGI，是可以自发行动的代理决策者（agent），是一种反馈控制系统。控制系统是个顶呱呱的好东西。控制系统的数学基础深厚，可以追述到1950年代Wiener的“Cybernetics”。控制系统与这个世界交互（通过传感器与执行机），并适应这个世界（通过内部模型与外部传感器来更新自己的状态）。控制系统应用广泛——恒温空调、降噪耳机、汽车刹车、下围棋的AlphaGo，这个世界到处都是它的身影。

AI DAO是一个运行在去中心化软件上的AGI控制系统。它不断的获取输入，更新状态，调整输出，并获取资源以持续维持这个反馈循环。

技术分享

如上所述，AI DAO有很多可能性，其中包括增强AI自身的能力。比如，AI DAO可以发起“请求为我的数据做标记”的有偿请求（智能合约），用低成本雇人来完善自己的数据集（去中心化的Mechanical Turk）；AI DAO还可以发起“将你的数据给我”的有偿请求，让IoT设备用自己的数据来交换电费。

Trent十分看好AI DAO的潜力。然而另一方面，Trent十分不看好AI与人类共存的未来。他说，很快就会有那么一天，AGI的智能将达到人类的最高水平；之后又过了几天，人类的智力在AI面前就会像蚂蚁一般渺小。到那时候，人类已经无法控制AI，而AI自己会决定是否要对人类“友好”。