DxChain
DxChain
Aug 13, 2018 · 16 min read

金色直播间第二期邀请了DxChain创始人Allan Zhang与BlockVC 创始人Kevin Hsu、Node Capital 合伙人Leon三位嘉宾,对DxChain项目以及区块链存储与计算、区块链与AI以及大数据结合的相关话题进行了探讨。

DxChain是一个去中心化的大数据存储和计算网络,是一个将区块链的去中心化特性运用到存储和计算领域的开放性公链。DxChain 提供两种基础功能:基于区块链的数据存储和分布式计算,极大降低用户的数据存储和计算的门槛。 打破当今只有少数中心化大型公司能够负担昂贵的硬件设备进行规模化的数据运算,带来的对用户数据的占有和垄断。

直播内容整理如下:

Leon-Node Capital:DxChain架构和技术相对比较复杂,请Allan用简明语言介绍下。

Allan|DxChain:好的,我先来介绍一下项目情况。我们可以先讲讲区块链的瓶颈,我们认为区块链目前是有瓶颈的,因为即便是在以太坊和比特币这两个区块链最成功的应用里,都没有没有存储和计算能力,这也造成目前区块链的应用都局限在转账、物流信息追溯这样的领域,其它领域几乎无法涉及,也就是说,区块链的世界里面缺少一个真正好的提供和存储和计算的基础公链。

说了瓶颈,就很好理解DxChain这个项目了,DxChain是以区块链存储和计算为核心的下一代技术公链。简单来说,DxChain试图通过区块链技术让算力和存储共享成为现实,从而降低算力和存储成本。在同时拥有了存储和算力之后,DxChain还可以为数据需求的双方搭建数据交易市场,让对高质量数据有需求的企业可以以更低成本更高效地获得数据,而用户也无需担心自己的隐私泄漏,还可以获得价值回馈,这是一个双赢。

总而言之,我们提供区块链存储、也提供区块链计算,并以二者为基础提供数据交易和BI数据分析。

现在我来说说我们团队情况,我自己是连续创业者,我自己是DxChain创始人,同时我还创立过一家公司叫Trustlook,过去十多年,我都在负责移动安全和网络漏洞与威胁等方向的研究和开发,十五年以上互联网安全方面的经验。

Wei Wang (美国)

AT&T区块链研究首席科学家,Hortonworks Hadoop大数据以及人工智能研究首席科学家。哥伦比亚大学医疗信息学硕士,匹兹堡大学人工智能硕士。他在卡内基梅隆大学研究曾被CBS60分钟专访。王伟具有多年区块链以及大数据分布式系统研究经验。

James Li

nCircle网络安全公司首席安全工程师,Lucent资深开发人员,Tripwire首席安全构架师。5年区块链系统安全设计以及防护经验。超过20年网络安全经验。

这是项目和团队的基本情况。

Leon-Node Capital:DxChain想同时解决存储和计算的问题,但是我们看到已经有单独解决存储或计算问题的项目,而且通常项目体量都比较大,如何看待DxChain和其他的存储&传输公链及协议之间的竞争?

Allan|DxChain:从存储上来说,DxChain和IPFS的存储做法非常接近 — — 一个文件上传后打散成小块,随机分布在不同的矿机上,至于随机分布在哪些矿机上,这些数据就存储在区块链上。换句话说,对比比特币和以太坊,DxChain的数据本身是不存储在链上,而是写在去中心化的分布式文件系统里面,我们的链上存的是原数据(Meta data),即去哪儿找数据的数据,这样的话存储是更为高效的。

比Filecoin的优势在于,DxChain有计算,但Filecoin是没有计算的。我们认为未来区块链应用应该扩展到互联网的各个领域,因此必须同时解决存储和计算的基础设施问题。即便是现有的存储来说,比如亚马逊的AWS,也都是计算能力的。

Leon-Node Capital:另外一个问题:DxChain未来将会建一个数据交易平台,而且非常好的地方在于通过提供存储功能,解决了数据来源问题。但是你们如何实现数据的结构化,以及保护用户隐私?也就是对数据的细颗粒操作,具体是怎么做的?

Allan|DxChain:比特币使用区块链来存储网络中所有交易记录,以达成共识,而这一共识需要超过半数的活跃节点同意。为了保证计算共识,在区块链中存储所有计算状态是不可能的。但DxChain采用了多链架构,有一条主链和两条侧链,能够把每笔细分的交易,即细分的存储和计算需求都写在了侧链上,主链执行完整计算和存储和任务,这样DxChain的每笔交易都可追踪,但由于有侧链分担细分存储和计算任务,主链性能得到了保证。

相比计算领域的其他项目,DxChain有自己的努力方向。我们的数据结构化是采用数据模型(Data Model) 来实现的。

去中心化的AI市场要想见效,你需要能够保证个人和公司所提供的任何数据都是以完全私密的方式进行处理的,这就不得不谈到隐私问题。对于隐私问题,业界公链采用了几种形式,比如同态加密(Homomorphic encryption),还有多方计算(Multi-Party Computation),这两种都是通过计算去加密保护隐私,目前常见的还有SGX,这是通过硬件去加密。

DxChain采用的是一种更实际的解决方案 — — 对关键数据信息加密,从而做到隐私保护。

由于我们能够做到对数据细密度的操作,数据入链时都是有结构的,比如数据形成一个表格,有一列是人的姓名,我们就对人名这一列关键信息加密,但是其他的信息公开,不是把整个文件都加密,这种叫做数据模型支持的数据加密。

除此之外,DxChain还用到差分隐私。差分隐私可以降低一个用户倾斜查询结果的概率,也就是降低让信息可以追溯到某个用户的概率。如果只是为统计分析提供数据,比如平均值,DxChain可以有工具方便用户在提交文件到网络之前运行差分隐私。

三是矿工存储加密。每个本地节点使用存储矿工的公钥对数据块进行加密。可以保护网络免遭入侵。四是把文件进行切分。一个大文件根据不同策略切分成小块,只获取其中一个部分不会泄漏整体信息。最后是在文件传输过程中加密。文件复制到存储矿工之前,使用矿工的公钥加密。

Leon-Node Capital:嗯,相当于对数据做脱敏处理。

徐英凯 Kevin:好多技术词汇,好专业,我问一个比较偏向商业落地的问题:DxChain未来应用场景能不能简单说一下?

Allan|DxChain:未来落地场景,首先是和AI的结合,人工智能极大地改变了我们经济生活的各个领域,包括广告、金融、医疗、交通、消费者、自动化、能源、物流和航空航天。DxChain由于有存储和计算能力,一方面通过链来鼓励人们共享存储和算力,降低成本,另一方面通过经济模型来鼓励人们分享数据,这种三管齐下,极大地能够促进AI的发展,未来可以让人工智能厂商在很多方面受益,生态系统开发人员可以利用DxChain构建自己的机器学习Dapp。

又比如智慧城市构建。智慧城市是一组为住宅在基础设施层面提供便利的智能解决方案。到2020年,这个市场的价值可能会达到1.565万亿美元。DxChain用户可以直接在传感器每天生成的数据集上运行机器学习和数据分析,并生成可操作的商业智能报告来指导他们业务的日常决策。

医疗保健领域也会是一个重要领,DxChain可以使生态系统开发人员利用DxChain来构建自己的大数据和机器学习平台。因为存储数据和流量的成本将大大降低,这将有助于降低医疗费用。更重要的是,让病人通过分享数据,在不伤及隐私的情况下获利,让研究机构获得病人有用的数据做疾病研究突破。

徐英凯 Kevin:我们知道DxChain刚刚完成了白名单注册,即将登陆交易所,能不能简单介绍一下你们白名单注册的情况以及后续的募集安排?

Allan|DxChain:白名单注册热度的确远远超过我们预期,DxChain自从7月9日开放白名单注册以来,一周之内参与人数就超过2万,此后参与人数持续攀升,参与者主要来自俄罗斯、韩国、印度、越南以及澳大利亚、英国、德国等100个国家和地区。我们昨天刚刚统计出来白名单最终数据,一共有59,257人参与了这次白名单注册,26,109人通过了优质投资者(KYC)验证,按照DxChain预设的规则,完成KYC验证并且在7月27日之前加入DxChain社区的,最终能够被列入白名单的人数达到16,703人。

接下来几天我们会完成公募安排,还有联系并合作几家交易所。

徐英凯 Kevin:可以介绍一下目前DxChain已经参与的投资人情况吗?

Allan|DxChain:@徐英凯 Kevin 私募还是公募?

徐英凯 Kevin:私募。

Allan|DxChain:我们私募投资人,包括Kevin你在的BlockVC、还有节点资本, 分布式等等。 下面这张图是个详细列表:

徐英凯 Kevin:我这边的问题问完了。

Leon-Node Capital:阵容有点强大!

徐英凯 Kevin:阵容空前强大!

Leon-Node Capital:那我再问一下大家都特别关心的问题,先在的开发进度如何?

Allan|DxChain:经过了历时4个月的设计、开发,DxChain的MVP于2018年7月12日正式上线,DxChain所承诺的区块链的存储能力,在这个MVP中得到了展示。

DxChain是一个致力于区块链存储和计算的大数据网络,按照DxChain的开发路线,我们先开发存储部分,再开发计算部分,目前,我们的MVP展示了区块链存储的基本功能,包括区块的产生、文件的上传以及下载。

MVP是最小可行产品(Minimum Viable Product),就是产品实现了最基本的功能。

在这个MVP中,我们使用了5个节点来构建一个测试网络,本次测试演示了DxChain的区块产生,在这个里面我们设置了每30秒出块,然后上传了一个15字节的测试文件,并且下载了这个文件。这演示的功能,展示了DxChain作为存储的基本功能。

这是我们MVP Demo

目前这个进度是完全按照我们时间表进行的,下一个发布就会是我们的主链测试网的Beta版本上线。

Leon-Node Capital:开发进度就是最好的信仰!所以,现在的社区建设状况如何?

Allan|DxChain:我们能够成长成为这么大的社区,最大的经验就是真诚地对待我们社区支持者,任何问题,通告在第一时间通知粉丝。另外,我们是一个以技术为主的项目,社区里面有很多懂技术的粉丝,和我们有足够的交流以后,理解我们的项目以后,会自发的帮助我们。

另外我开发了全套的机器人系统,电报群运维,公募和社区激励机制等等。比如最近的公募, 我们就是完全自己开发的系统, 全部通过我们电报群机器人来完成,期间我们的社区团队只负责用户问题解答。

目前DxChain的Youtube关注人数已经超过1万人,Twitter的粉丝数奖金4万人,而Telegram社群人数已经接近18万!

Leon-Node Capital:一方面是运营,当然最重要的是项目质量。所以,DxChain有哪些技术创新,吸引到这么多社区参与者?

Allan|DxChain:我最愿意谈我们技术创新了!

我们的创新包括架构上的创新,也从工业界十多年来被验证的传统存储计算模式上借鉴经验:

架构创新。

DxChain采用了“三链合一”的系统架构来解决数据的计算、存储和隐私问题。所谓三链,即一条主链、计算链和存储链两条侧链,三链在DxChain的网络体系里各司其职各行其是:计算链负责的是运行并行计算执行,从而解决大数据通用计算的问题,最终达到机器学习并且提供BI支持;存储链主要负责提供大数据存储并解决大数据存储及隐私问题,同时给计算链提供相应支持;主链负责提供交易相关的操作,同时协调两条侧链计算链和存储链。

我们的模型参考了Hadoop架构。

过去十多年,Hadoop解决了一个机构、公司内部的数据分布式存储,但如何在不同机构和参与者之间达成信任,从而实现分布式存储,Hadoop解决不了,但区块链则提供了完美的解决方案。

我们将Hadoop的技术优点,这些优点是过去十多年在工业界被反复验证过的,与区块链特有的机制结合起来,解决了去中心环境下的分布式存储计算的问题。

Leon-Node Capital:我们当初在投资DxChain的时候DD阶段比较痛苦,因为DxChain的技术部分相当复杂,很高兴看到Allan一步一步把架构方案变成现实。

直播间网友提问:

@闲闲鸭:项目的技术思路非常好,但是项目完成度,上交易所是不是过早了?

Allan|DxChain:上交易所后,能让DX实现更好的实现代币的流通,也可以让团队获得多资金来支持后续的开发和社区建设。存储和计算开发起来确实难度非同一般,比如Filecoin在2017年完成了一次公募,募集到了2.54亿美金,虽然没有上交易所,但是他们代币也在某种程度上在公开市场上流通。

@鱼临渊:开发路线是怎样规划的呢?下一步比较大的项目进度大概是什么方面,什么时候完成?

Allan|DxChain:我们把整个开发的大任务拆解成小任务,一步一步实现。下一个大milestone是年底的testnet上线。

@WYW:能不能用简单句话说明你们自己认为DxChain的不适用场景 i.e. 你们认为这个算法和数据结构的worst case是什么,以及和其它产品相比有什么数量上对比的优劣?

Allan|DxChain:这是一个好问题,因为没有任何一个产品适合所有场景。DxChain不适合time sensitive的环境,对于时效要求高的环境不适合。因为这个是系统层面的设计,不会把一个很小算法的复杂性去当成主要的考虑点。目前市场上还没有任何一个产品能够同时处理大数据存储和计算的项目。

@Blade:您好,现在市面上已经有许多数据市场,但是实际效果都不好,买卖双方都没有很强的意愿在数据市场上交易。我想很问一下Dxchain的数据交易市场未来规划如何落地?怎么吸引别人来数据市场上交易?希望您能从实际的角度给我解答一下,谢谢。

Allan|DxChain:我们觉得区块链天然就是一个数据交易平台,我们预留了48%DX代币来吸引矿工、吸引数据的提供者和交易者,来到平台上交换数据。

一个最典型的例子就是,当一个病人手握了自己数据,我们平台能够提供较好的隐私保护,在我们平台上分享数据一方面能够让他们帮助研究机构做病理研究,一方面让他们获利,我想能够吸引到人们来交易数据。

Leon-Node Capital:帮Allan补充一下,并不是买卖双方不愿意交易,而是以往的平台无法支撑顺畅、安全、低成本高效的交易方式。当摩擦足够低的时候,交易自然会发生,因为数据的交换天然在创造价值。

@zsk:请问病例数据的标准化怎么解决?

Allan|DxChain:医疗数据标准会采用hl7,icd9等标准格式,这两个是国际标准医疗数据格式,我们数据都会用这个标准化数据工具来做。

@Yvonne@金色财经:区块链和AI的结合一直是行业讨论的热点,我们看到DxChain在白皮书里有提到了AI,能不能简单介绍一下DxChain怎样将区块链和AI结合的?

Allan|DxChain:AI是非常中心化的,AI仅掌握在少数公司手里,主要是Google、苹果、Facebook以及Amazon(“GAFA”)以及中国的互联网巨头阿里巴巴、腾讯和百度(“BAT”)。

区块链的出现可以看作是对这种垄断的一种反抗,在技术上提供了可能性。这个想法大概是这样:我们所有人,都会受到经济模型的激励,来提供个人数据和专业数据。在知道这些数据可以安全保证安全和隐私的情况下,我们对共享敏感数据(开支、健康信息)会感到更加放心。跟GAFA掌握的那些相比,随着时间转移,市场会积累了越来越多的大量数据,数据的质量也会越来越高。

除了数据,人工智能还需要算力和存储。对于财力不雄厚的中小公司来说,这也是一个很高的门槛。而区块链正好带来去中心化的算力和存储共享服务,可以通过激励算力和存储矿工贡献自己的服务,从而降低成本。

回到我们DxChain这个项目上,正是通过区块链技术,为数据需求的双方搭建数据交易市场,让对高质量数据有需求的企业可以以更低成本更高效地获得数据,而用户也无需担心自己的隐私泄漏,还可以获得价值回馈,这是一个双赢。

同时,DxChain还努力通过区块链技术让算力和存储共享成为现实,从而降低算力和存储成本,让大数据和机器学习等更专注于算法的完善,模型的迭代,加速人工智能的发展。

@WYW:@Allan | DxChain 谢谢回答。time sensitivity也是hadoop的缺点,你有特别提到有hadoop的优点,那么hadoop的其它缺点是不是也会在dxchain上出现?

Allan|DxChain:比如对大量小文件支持不佳,只能做batch process,没有计算图,no cache etc,我们认为没有任何一个项目能够适用于所有场景,Hadoop里面确实有一些缺点,比如您提到的大量小文件支持不佳,我们做法就是把小文件打包成大文件。

@闲闲鸭:@Allan | DxChain 我是个圈外人。想问一下,您刚才提到了在项目低完成度期发币为项目募集资金。这个项目是一个高开发难度的项目,那如果因为各种原因开发失败了,团队有没有相应的处理预案。

Allan|DxChain:我们认为任何一个区块链开发都可能面临失败,但我们会采取阶段性开源,和其它技术社区实现深度技术沟通,即使遇到最坏的情况,开发没能成功,其它团队都能够借鉴我们团队代码砥砺前行,这就是区块链精神所在。

由于团队已经有了多年大数据工程是实战经验,对于各种突发问题有了应对准备。目前已经完成MVP,所有项目进展按照计划进行。

我们DX马上要上交易所,开发也在进行当中,欢迎大家到社区里面来实时跟进我们项目开发进度,来支持我们。

谢谢大家的时间。

Leon-Node Capital:存储、算力、传输三大网络基础设施,DxChain搞定两个,好期待DxChain主网上线!

关于DxChain:DxChain是一个去中心化的大数据存储和计算网络,是一个将区块链的去中心化特性运用到存储和计算领域的开放性公链。

官网:http://www.dxchain.com/

Telegram:https://t.me/DxChainGroup

Twitter:https://twitter.com/DxChainNetwork

DxChain中文

Big Data Meets Blockchain

DxChain

Written by

DxChain

http://www.dxchain.com — decentralized big data and machine learning network powered by a computing-centric blockchain

DxChain中文

Big Data Meets Blockchain

Welcome to a place where words matter. On Medium, smart voices and original ideas take center stage - with no ads in sight. Watch
Follow all the topics you care about, and we’ll deliver the best stories for you to your homepage and inbox. Explore
Get unlimited access to the best stories on Medium — and support writers while you’re at it. Just $5/month. Upgrade