推特访谈:刘智聪——CYFS架构师 DMC博弈性共识机制的提出者


最近,DMC中文社区组织了好几场Twitter Space,邀请到的都是DMC Foundation创始团队和技术大咖来给大家做精彩分享和讲解。最近大家其实对DMC有了进一步或者说更深层次的理解了。在之前一期有DMC基金会主席Victor Chen跟大家一起聊了两个小时,这一期请到的是CYFS架构师,DMC博弈性共识机制的提出者——刘智聪!同时还有大V总的陪同一起参加了这期DMC中文社区的AMA,真的是非常幸运能够与这些大咖可以同频道交流和学习,更加了解DMC的发展路线和未来价值。


在开篇主持人有仔细的介绍到刘总刘智聪的个人经历,我这里摘取小部分:


2007年刘智聪在加入迅雷不久后,对迅雷5.9的整体架构做了大量的创新,首个采用该引擎成功开发的产品迅雷7,在2010年展现出了远超时代的交互效果,引起了互联网同行的广泛关注。这次重大的技术革新,年仅26岁的刘智聪在入职3年后成为了迅雷最年轻的首席工程师。

  

2010年正值移动互联网兴起。在1314年的时候,他完成了对比特币整个系统的研究,开始思考开始思考下一代互联网。当时迅雷的玩客云是一款成功的产品,相关系统在刘智聪为首的基础研发部门内完成孵化后,应用于星域CDN业务,为小米、爱奇艺、熊猫直播、bilibili提供更便宜的优质带宽。


2015年,他开始构思了一个演进的思路,先把完全中心化的云计算提供的功能分散到一个半中心化的网络,或者把节点分布得更广泛的一个边缘计算网络里面去,能让网络提供跟中心化的云计算类似的功能,同时给所有的节点提供一些激励。玩客云二代开始涉足“去中心化存储”。而数据对用户来说非常重要。所以意识到数据存储的重大责任后,开启为实现一个真正的去中心的下一代互联网,为梦想续航,创办巴克云。


在面对分布式系统CAP定理时,巴克云也逐渐意识到,下一代互联网底层必须是云计算+区块链,它更应该是互联网基础协议的升级,可以让数据的采集、存储、传输、计算更为一体。


2020年初,刘智聪开创了“数据交换合约”理论,让可行计算从链上转到链下,并做了系统的设计。同年10月第一次开发布会,向外界透露了CYFS就是Web3,当时很多人都对此没有什么概念。


目前CYFS基金会正着力海外布局,其中的一个重磅级生态伙伴Fog Works,刚刚获得Draper DragonOKX Ventures Limited、领沨资本、蓝驰资本等投资。该企业将会推出面向普通用户的非金融性去中心存储产品。在刘智聪看来,目前Web3的应用还比较偏金融属性,无论是NFT交易还是DeFi。而最为急迫解决的核心问题就是去中心化存储,这关系到数据产权的归属和数据的安全存储,它是Web3整个大厦的地基。


以上是简短的刘总10年职业生涯的跨度与建树。


以下是在刘总在Twitter SpaceDMC中文社区小伙伴的介绍:


刘智聪:

我其实算是在中国互联网上的信息比较多。在迅雷从07年一直做到16年,直到做巴克云,10年时间还是做了比较多的东西。迅雷本身算是国民软件,到今天仍然是大家装机必备的软件。在迅雷期间也做了边缘计算等,其实整个区块链行业都可以分到边缘计算行列里去,边缘计算对应的是云计算,比如一个去中心的系统。其实之前做玩客云也是在行业比较早的,除了Token以外也是可以解决真正问题。因为这套系统之前叫PCDN,今天的P2P协议叫CDN,这个技术就是大家能够流畅去看Youtube、优酷、爱奇艺等视频非常流畅都仰仗这个技术的发展。我们在这两个方向可以说作出过一些比较开创性工作。


对于我自己可以说是一个传统的架构师,写程序也比较早。其实在迅雷10年到12年上一次巨大转型,从PC到移动互联网,那时候迅雷在PC互联网算是第一梯队的公司。我们非常热衷把迅雷下载技术从PC上往手机端去移。比如会有个软件叫手机迅雷,简称手雷。但是两年后发现这是反人性的,大家没有必要把PC端下载到手机里,它可能并不很适合移动互联网。因为我们是个很偏技术的团队,最早在PC互联网时代比优酷,土豆,爱奇艺等数据都要好,当发现在移动互联网的车赶不上了,那应该走向何方?


通过在移动互联网的观察,我是一个比较深层次的协议的信仰者,我坚信互联网最重要的价值是连接。其实进入了移动互联网我感觉到互联网变成了一个个的孤岛,就是每一个超级应用都巴不得你把所有的时间都放在一个应用里面,能够满足你所有的需要,害怕你去别的平台,其实这不是互联网发展的初衷。互联网早期有个人站点,在互联网上看到很多,但是能够留下来的很少。比如发布的热门信息几天内似乎全网都在聊,但是过一两个月再去找这个热门信息又打不开找不到了,所以网络尤其缺乏储存的能力。当然这个最根本的根源是中心化,中心化平台看来用户创造的东西根本没有价值,他们只关心商业。所以我在那个时候开始萌生,同时也是受到中本聪很大的启发,BTC对于整个技术架构,他把经济学引入到分布式系统里对于我们传统技术人来说震撼非常大的。我从这时候开始思考做下一代互联网了。那个时候说Web3.0很多人不以为然,但是到今天渐渐被广为流传。即使到今天我们也是一个坚定的web3最早的从业团队。这是个简单经历做web3的起源。


16年创业以后,那个时候认为web3从云计算转变过来的。公司名字叫巴克云,做了大量的云计算,包括传统的云计算技术,我们渴望基于现在的这种分布式系统的技术可以渐渐把它改造从中心化变成半中心化到最后的去中心化。在2019年碰到很大的障碍,发现此路并不好走,我们又回看比特币白皮书和代码,包括中本聪的言论,这些堪称我们行业的圣经,可以反复咀嚼,一些想法和答案都在其只言片语里。那个时候意识到我们必须从最低层开始实现去中心化,我把它称之为有激励去中心化系统,意思是说你需要在最底层引入激励机制之后你才有机会去建造一个真正的去中心网络,那这个网络节点就是两种,一是给出激励,第二种是接受激励。所以这个理论也是支撑DMC共识的最基本原理。


19年以后就放弃以前做的所有事情,从头去设计协议——CYFS协议,大家可以理解为更好的IPFS协议,这是最简单的理解方式。


大家都在做一个ContentBase的下一代互联网协议,我们的目标是做下一代HTTP协议。在设计的时候做了与HTTP很多兼容的地方,我们跟IPFS协议最大的不同,在于我们的Content Base的协议是两段式的,IPFS只是一段,就是内容的Hash,即Content ID,他是通过DHT网络,(DHT也是一个特别古典的技术),他能去做寻址,这也是改良。CYFS两段式的链接,我们除了有Content ID之外,还有Content Owner ID,即拥有者ID,拥有者ID在区块链世界里就是DID,毫无疑问就是大家的公钥了。有了DID之后我们再基于现在标准的Blockchain Smart Contract的技术构建的num systerm系统,域名简析系统,可以说通过一跳的方法把这个请求跳转到用户的parterner servers,我们叫OOD上,就是个人服务器,在CYFS里面我们做了大量设计,但是里面最重要的基础设施就是每个人都有一个自己的服务器,这个服务器用来保存自己的数据,同时也运行自己的服务。我们基于这样的理论去构建这个CYFS,这整个逻辑就比较简单了。


如果大家做过开发者,可以了解CYFS整个的SDK,原理上讲跟HTTP协议差别不太大,因为还是保留了HTTP的经典流程。CYFS其实就是协议,跟HTTP是一样的,并没有在最底层就去引入经济激励层,但我们说,你有一个自己的个人服务器,你肯定要考虑到这台服务器在物理上损坏的原因,那么网络上提供基础的一套不被任何公司控制的备份系统,你只需要花一些Token你就可以把数据备份在别人的服务器里。那反过来,你也可以把自己闲置的空间给别人用。但我们不是像过去传统P2P协议里的那种“人为我我为人人”精神,这个里面就引入了一个Token,站在原理上讲CYFS的理论里的Token跟底层是结耦合的,可以说现在最符合这个设计理念的就是DMC TokenDMC在这个设计里跟CYFS备份的这套机制最Match的系统。所以说,简单讲,整个过去十年都是在做Web3领域,在做去中心化的传输协议,做协议升级,做协议改进,同时也在思考怎么用这些基础协议做真正的实现一个可靠可用的去中心化存储系统。



CYFSDMC的未来:


因为是工程师出生,都会有比较理性和客观的思维角度。大家有一个非常重要的——共识,在这个行业我们也做了10年了,但在前年有了比较大的变化就是Token的项目从crypto进入web3了,这只是一种时髦。其实在我们技术眼里有一个根本的不同,就是crypto其实就是Token,但99%Token就是一个筹码,赌博的性质很重,很多时候crypto就是在讲一个故事,让大家为这个故事买单,这就是讲的共识的力量。但如果所有人都去做crypto,那肯定是有问题的,故事太多了但没东西落地。Web3讲的就是基于现在的设施,这个包含crypto,我们应该要让普通人有所应用的。


我有个很基本的观点,任何web3的应用,他要解决的第一个问题就是存储的问题。就是说我们今天在去中心化的世界里我们只有经济系统(钱),超级应用,比如说大家手机里只有支付宝,那是很奇怪的,进入移动互联网(比如手机),对于普通人最重要的应用其实是照相机,可以随时随地记录生活,另外一个应用就是社交,SNS,可以跟朋友随时随地分享。比如微信就是有支付系统同时也包含社交功能。如果要实现,可以看手机所有的非支付应用,你任何的一个应用,最核心的内容仍然是来源手机的摄像头,所以说存储和传输系统一定是去中心化的互联网服务的基石。


从我的角度,我虽然不是DMC直接的研发团队,我是DMC主要理论提供者,但也跟DMC研发团队讨论在开源的规则下讨论具体实践的问题,但是对DMC各种机制也会有疑问和想法。但这个世界都是多元化的,我仍然相信在去中心化存储这个赛道上,DMC仍然代表行业最高水平。为什么这么说?


这个行业从技术逻辑上看,Filecoin也好,Arweave也好,其实之前大家认为把数据存在去中心化最重要的是大家认为的副本证明,就是我有一个数据,我通过非常复杂的密码学算法,或者零知识证明的算法,我能证明这个数据在这个网络里有多个副本,因为我们想让数据有更高的可靠性和可用性,背后本质就是这个数据在互联网上有很多份,这是大家纠结的地方。那DMC理论博弈型共识里面,就不再纠结于这个副本证明,其博弈型共识核心设计叫做存在证明,我们每个人都有自己的个人服务器了,而且是私有的数据,我自己的私有数据肯定不希望暴露在公网上的,80%数据都不愿意暴露出来的,那就是加密。加密的原理就是你有个原始数据,就是用不同的秘钥加密你就会得到不同的副本,这个副本其实对持有副本的秘钥有意义,没有秘钥的人就没有任何意义。这样来讲,我手上有原始数据,我把他用不同的秘钥加密变成三份,对我来讲,只要这三个加密后的数据副本存在,不管是一份还是十份都无所谓,对我来讲只要这个加密的原始数据是三个副本都存在,那这个数据就是可靠的,因为互联网上有三个副本,所以说DMC在博弈型共识理论指导下,这个存储证明从副本证明进化到了存在证明,有了存在证明之后,就可以实现更低的成本。


传统意义上说,有很多同学做过Filecoin,他这个零知识证明的副本证明是需要消耗大量的显卡计算的,就是要消耗大量的资源,那这个大量资源消耗情况下理性来看大家就明白这个道理,硬成本很高,如果保存一个副本的硬成本很高,那存储系统对于普通人是根本用不起的。但是在DMC里面只是多做了一个加密和解密的动作,某种意义上讲,他跟你在这个数据吞吐时候的带宽相比,他的成本可以忽略不计。这个时候就让整个DMC构建的存储系统,虽然是去中心化的,但他的成本结构也跟今天的中心化的系统相似,还是主要成本,除了硬件成本之外,主要大头就是在带宽上。以前迅雷做过离线下载的事情,其实就是把所有权,全世界的数据都在云端存一份,开始觉得项目主要成本是硬盘,最后发现还是带宽。那么DMC挖矿,DMC矿场建设时候开始发现挖DMC似乎需要更多的带宽,这才符合正常存储系统被日常使用起来的系统。


回到主题,第一点,从赛道上讲,DMC的去中心化存储赛道是web3最核心也是最基础的赛道之一。这个赛道一定能跑出来一个能应用的项目,然后被所有的项目所依赖;


第二点,DMC走了一条跟其他项目不同的基础道路,这条道路让DMC本身在提供真正的存储服务这块,他并没有和中心化存储相比没有明显劣势,基本是对标的,在这样的赛道和理论基础之下,我相信DMC会有很大的一个机会。



V总补充:


DMC设计出经济模型白皮发布本身的定位就是去推进在web3空间的真实有效的数据存储。那最终的目的其实是为了把web3的数据存储的这个底层打好基础,最终希望在web3上有更多更好的应用这个应用不仅仅是一虚拟货币的传递,或者虚拟货币挖矿,金融方面基本上就是在这个区块链的账本上维系,我们希望做到真正的应用,在web3上其实可以做的应用很多,但是最底层的数据存储是一个基础Web3的存储除去中心化特点还有确权特点也要能够不管是在成本上和在使用体验上能够满足未来下一代互联网的需求。CYFS作为我们的一个核心的创始的合伙生态建设者,CYFS的设计和我们的需求是不谋而合,DMC通过技术评估得出结论,如果去中心化存储的基础上能够实现满足DMC未来最合适的生态应用要求,其实从底层协议上最合适的生态就是CYFS所以这也是为什么,从这个DMC项目刚开始的时候我们就和巴克云团队,包括刘总在内一直在同力的合作


刚才刘总也提到了,DMC不管是从经济模型算法上面,实际上对现有的数据存储在区块链上的数据存储赛道上面应该都是有一些创新。我也想请刘总说下,玩客云也是在P2P的存储基础上做了一个很成功的项目,玩客云的角度看和DMC做一个比较DMC在玩客云的这个经济模型上面有些什么样创新


刘总:从玩云的角度来看DMC的话,我觉得应该说DMC也是一个行业进步的一个核心点首先第一个区别还是在Token经济学即通证经济学。其实之前玩云的通证经济学是非常单薄的,它并没有做特别复杂的设计因为最早的时候玩客云它的前身叫赚钱宝,它是一个人民币项目这个项目最早是用人民币结算。在结算的时候是一个典型的工资模型,就相当于说它是一个半中心化的系统每一个节点,他的系统里面提供了存储带宽,他会把一些日志记下来,然后会把这个日志报到一个中心服务器上去进行结算整个的经济模型里面,它会倾向于有个整体的平整和调节,今天有特别多的这个类似的系统比如像美国去年很火的像这种发工资的系统,它其实都倾向于这种中心化的协调。因为他总是觉得靠自己就能平衡下来。其实是一个非常旧的设计DMC里特别创新的一点是什么呢?不知道大家对DMC黄皮书看的深不深,我觉得DMC的整个设计里最有趣的一点就在于他的经济模型里有一个需求方挖矿就我们传统意义上的挖矿都是供给方。你做矿工,你其实这个系统提供了资源才有人能够参加挖矿,你去使用这个系统,通常都是要交手续费的。第二它的经济模型里面,我们都知道存储得有一个数据的需求方,比如你手上有16G的数据要存,你把数据存到矿工,可能是一个矿工,可能好几个矿工。就是说整个系统其实是需要有一个需求方来发起的那么今天DMC的经济系统里面,它通过一些参数,让这个需求方也参与到了这个经济模型的分配里来,最终的结果就是他通过这种博弈实现供需平衡,通过经济系统来实现了全网资源的配置和调节。这个站在之前做客云的设计上比较,我觉得是最大的一个改变之前所有类似玩客云项目都没有去真正彻底改变的一能够通过一套博弈的系统,而不是通过一个所谓的非常聪明的算法来解决这个系统资源分布的这个平衡问题。我觉得是第一个,也是我认为最重要的一个。



第二DMC本身解决问题的难度是比玩客云大的玩客云是建立在一套存储系统上的CDNP2P层层的推荐,其实我们之前并没有实现P2P系统上的可靠存储。我们在这个节点上面保存的都是缓存数据,并且每个月都会有流失所以我们其实所有数据的可靠性都是靠一个中心化的存储系统来保证的,会不断的去通过这套中心化系统来给P2P这套缓存系统去填补数据所以说在这个技术层面上来讲,DMC在理论上存在证明,真正意义上实现了在P2P网络里数据的可靠存储,这也是我想讲的一个很重要的一个点站在用户的角度来讲,大家可说想要的可靠,就是说数据存上去之后,我这辈子都丢不了。其实很多厂家特别喜欢提供这种承诺,但实际上这个可靠,从我们做工程来讲,这只是一个百分比,就他永远不会是100%可靠,它是99.99999%之类的东西。比如大厂提供99的概率百分比。一旦落到了那个小概率事件里面,你还是会丢数据的。但今天你可以看到苹果的iCloud在也在每年都会有丢数据的案例发生。在DMC网络里的可靠,它是一种透明的可靠。用户可以通过经济经济模型,换句话讲,就是通过自己想付多少钱,选择自己的数据有多少个副本,你觉得这个数据对你重要,你就可以多花点Token,那这个数据有更多备份,那这可靠性更高如果你觉得这个数据对你来讲不是特别重要,那你就存两张副本,加上你自己可能有六个9所以说,DMC不但真正意义上实现了在P2P网络的可靠,而且他没有做虚假程诺大家千万不要信那些给你说是永久的人所以说DMC其实是一个透明的可靠用户,对自己的可靠是心知肚明的,一定要用成本换的。就是DMC允许非均制的可也是跟AR最典型的区别,AR它的所有的数据都是一个均制的可靠,所有的数据它都是一视同仁,最终结果就是到矿工成本高,因为AR所有的数据保证这么高的可靠性,你又不能够说让存储成本变得特别高,最终结果就是没人用了,那这个系统也没价值。

第三个生态的问题迅雷毕竟是一家商业公司,它这个系统为什么是半中化,就是因为它从经济学到系统,到矿机的生产都是完全一家说了算其实有很多人也在这个模式,这个好处是他的效率比较高,推出东西速度很快,缺点也非常明显,一旦任何一个环节出问题有可能是全盘的问题,它的韧性不高。但我觉得对存储系统来讲,它可以慢一点,但它的韧性一定要足够好。因为用户一旦把数据放到上面来,你的责任是非常大,这个系统的责任非常大。


所以说现在DMC专注在做经济模型上,它的挖矿也是开放的矿机的生产,看得懂黄皮书其实应该都可以做,因他对协议的支持,既可以说用的CYFS协议,用CYFS协议进行数据交互的好处就是你的矿机可以放在net后面了。你可以用传统HTTP协议交互,原则上也可以用IPFS协议交互其实DMC生态的设计上来讲,会比之前玩客云韧性更强。我认为在存储这个赛道上,韧性是比效率更重要。