比推特更开放的软件(比推特更开放的软件,ni开头的)

投稿用户 • 2023年1月11日 pm1:18 • 创业项目 • 阅读 223

以上资料，免费领取，领取地址：https://vip.f6sj.com

作者：Scott Shi

简介

11月13日，马斯克为Twitter做了超过1000个RPC来渲染用户的主页时间线而道歉。乍一看，如此高的RPC数量似乎很荒谬。今天，Twitter为2.6亿月度活跃用户提供服务，并能以接近实时的方式进行。为了解决在亚秒级延迟下的大规模采用，Twitter开创了许多解决方案，包括Apache Storm、Heron、DistributedLog和Aurora；是Scala的主要贡献者，包括finagle RPC框架，以及lambda架构、Snowflake ID和Segcache等创新。那么，为什么像Twitter这样一个创新的全球性公司需要这么多调用来获取用户的时间线数据呢？

Twitter所面临的问题让我们想起了目前Web3的成长之痛：开发人员往往被迫逐一串行调用许多API，以获得用于组装业务逻辑的数据。这导致了不可靠和不可预测的性能，即使是最简单的用例，如获取用户的交易历史。而在增长方面，前10名区块链的交易在两年内翻了100倍。在图1中，我们展示了每秒推文量（2006-2013年，蓝色）和每秒Web3交易量（2017-2022年，红色，不包括非用户交易）的对比。如果Web3继续沿着图中描绘的轨迹发展，那么今天的大多数Web3数据基础设施解决方案将没有能力处理这种增长。

图1：推文和Web3前10名链之间的早期写入流量QPS比较。

在这篇博文中，我们强调了Web3可以从Twitter的规模解决方案中学习到的东西。具体来说，我们讨论了以下几点：

我们概述了Twitter的时间线基础设施之旅，认为他们目前的架构对于特定的用例确实是有意义的，并得出结论，一些批评（例如Elon Musk最近在推特上为渲染主时间线的大量RPC道歉）可能是错误的。
我们深入研究了Twitter和Web3之间的技术相似性，并探讨了前者的解决方案如何有利于后者的解决方案。
我们分析了当前Web3的增长趋势，以及现有的高性能数据基础设施解决方案的缺乏，并得出结论，如果我们想支持实时的Web3数据访问，就需要进行重大的升级，以及ZettaBlock解决方案如何帮助开发者减少70%的开发时间并提高10倍的性能。

推特的数据基础设施之旅

一开始，Twitter是用Vanilla MySQL开始的。这很快就成了一个问题，因为在最初的几年里，推文的数量同比增长了10倍。从2007年到2012年，Twitter的月活跃用户从几千人增长到超过1.38亿人。已知的水平和垂直分片的智慧无法为Twitter提供处理带给平台的高水平流量的性能，特别是在渲染主时间线方面。

时间线是Twitter的主要平台功能之一。一般来说，Twitter的时间线有两个主要操作，列举如下：

写作路径：这个路径是为用户发布Tweet时使用的。在2012年，Twitter平均每秒钟处理4600次写请求，或在高峰期处理12000次RPS。
读取路径：这条路径是为用户请求他们的时间线。在2012年，Twitter每秒处理约30万个读取请求。

为了更好地理解Twitter是如何渲染时间线的，让我们深入了解图2所描述的渲染流程。当一个Twitter用户今天发布一条推文时，Twitter首先将其写入Manhattan，这是一个分布式的键值数据库，用于存储用户的推文、直接信息、账户细节等。这条推文会在时间线缓存中向该用户的所有追随者扩散。虽然这增加了写入放大率，从每秒4600次请求增加到每秒345000次请求，但它也大大减少了用户的读取延迟。因此，时间线渲染没有在关注者和推文之间做一个连接表，而只是从一个表中获取缓存中的推文。这些扇出操作通常在5秒内完成。通过分配被写入的数据，系统通过移除表的连接，在超增长中存活下来。因此，读取延迟被提高到几百毫秒，这是在99%的范围内。

图2：Twitter的时间线渲染流程。请注意，时间线中的每条推文至少需要一个RPC。

前面提到的渲染流程可能对绝大多数用户来说是足够的（在大多数情况下，写入放大率<100），但 “超级枢纽用户”呢？超级枢纽用户是指拥有许多追随者的用户（几十到几百万）。所描述的扇出模式，在超级枢纽用户的情况下，可以被放大1.2亿倍以上这就是为什么在Twitter的早期，有专门为贾斯汀-比伯准备的服务器机架。为了满足超级中枢用户的需求，使用了一项名为Earlybird的特殊服务。通过Earlybird，对超级中心和普通用户的推文进行不同的提取，并分别进行处理。这个过程在下面的图3中描述。

图3：左边描述的是Twitter用户的混合时间线的抽象图，右边描述的是相应的阅读SQL。

既然我们已经描述了提供实时Tweet时间线背后的复杂性，就很清楚为什么单条时间线的渲染需要许多RPC。例如，对于一个只有100条推文的时间线，RPC调用很容易超过1000次，因为仅仅获取一条推文就需要多次RPC调用。这个解决方案乍一看可能并不直观，但这是一个刻意的权衡，为终端用户提供优化和可预测的读取性能。

Twitter实施的最终结果是非常积极的：延迟的第99百分位数只有大约几百毫秒。在过去的10年里，这种基础设施被证明是可靠的，可以处理Twitter流量的超速增长，而没有发生重大变化。

请注意，我们忽略了Twitter时间线的一些其他方面，包括评分、排名和水作用。关于这方面的更多细节，请看本帖末尾列出的参考文献。

Web3和Twitter数据的相似之处

图4：Twitter和Web3数据的相似性

Twitter和Web3生态圈之间有很多相似之处：

Web3自然是一个社交图谱，推文类似于交易，而回复类似于日志。这在图4中得到了描述，图中比较了顺序的时间线渲染和顺序的区块链区块。
Web3协议和Twitter存在超级枢纽效应。最受欢迎的NFT平台的交易量比第10个平台多1000倍。
Web3和twitter都是开放平台，对所有用户可见，并允许某些API访问。

如果我们再放大一点，Twitter和Web3之间有更多的数据访问模式的相似之处：

读取量大，但每条记录都非常小。在EVM链上，日志和事务的平均大小只有几KB。
最近的数据会被更频繁地浏览，其中大部分的浏览来自于发布后的前几个小时。
数据在很短的时间内是不可改变的。链上数据可以通过reorg对最新的区块进行还原。同样地，现在的用户可以在发布后的有限时间内编辑推文。

Web3可以从Twitter的架构中学到什么

与2020年早期相比，前10名区块链的交易量已经增加了近100倍。Web3数据基础设施的现状类似于2008年左右的早期Twitter时代，当时大部分流量依赖于不同供应商的水平分片数据库。因此，随着Web3的不断发展，现有的Web3数据基础设施将很难提供对数据的高性能访问。

Twitter的扇出服务就是把相关数据同时放在同一个地方（如内存）。因此，当一个请求到来时，系统可以很容易地在一个地方找到相关的数据，这导致数据已经被预处理并准备使用。这使得系统具有可扩展性，并具有可预测的性能。

遵循当前现状的Web3应用程序缺少一个重要的组成部分来有效地聚合相关数据。具体来说，开发人员必须一个一个地调用API来获取数据。这导致了不可靠和不可预测的性能，即使是最简单的用例，如获取用户的交易历史（如图5所示）。

图5：目前的Web3应用程序如何需要串行调用许多不同的API，即使是简单的事务聚合。

由于所有的Web3数据都是公开的，ZettaBlock已经建立了一个最先进的数据基础设施，为所有的Web3开发者处理扇出部分。一个应用程序的开发者只需要指定他们想通过一个API查询哪些相关数据，并让ZettaBlock汇总所有相关数据。这在图6中得到了描述。通过使用ZettaBlock，开发时间和API延迟分别减少70%和90%。请看我们的演示，https://demo.zettablock.dev/。更多的技术细节将在未来分享。

图6：与图5相比，ZettaBlock将多个Web3数据集抽象为一个单一的、用户友好的、高效的API。

总结

在这篇博文中，我们剖析了Twitter的架构，并将其数据模型与Web3进行了比较，发现了许多相似之处。如果我们能从中得到一个信息，那就是许多现有的Web3数据基础设施解决方案，就像Twitter的早期一样，将无法跟上未来的数据需求。

这就是我们建立ZettaBlock的原因。ZettaBlock是一个全栈式的Web3数据基础设施平台，提供实时、可靠的API和分析，在几分钟内为你的应用程序提供动力。前面提到的扇出过程（将相关数据同时放在同一个地方）只是ZettaBlock上提供给开发者和企业的众多功能之一。我们得到了Polygon、Crypto.com、Circle等领先的web3公司的信任。我们的愿景是成为web3数据基础设施的首选平台。

参考文献

规模化的时间线：https://www.infoq.com/presentations/Twitter-Timeline-Scalability/
Twitter如何使用redis来扩展105TB的内存：http://highscalability.com/blog/2014/9/8/how-twitter-uses-redis-to-scale-105tb-ram-39mm-qps-10000-ins.html
Twitter使用什么数据库？https://scaleyourapp.com/what-database-does-twitter-use-a-deep-dive/
Twitter的数据存储和处理: https://ankush-chavan.medium.com/twitter-data-storage-and-processing-dd13fd0fdb30#:~:text=That%20equals%20to%2084,time%20the%20request%20is%20made

本文内容由互联网用户自发贡献，该文观点仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容，请发送邮件至 630371849@qq.com 举报，一经查实，本站将立刻删除。
如若转载，请注明出处：https://www.po4.xyz/20564.html

Twitter Web3

投稿用户

338(3385cc_co)

上一篇 2023年1月11日 pm1:08

okr管理(okr管理是什么意思)

下一篇 2023年1月11日 pm1:28

小S最新采访视频曝光，透露三个重要信息，称大S经常给女儿奢饰品这一次，47岁的李小冉，终于走到了这一步（小s女儿采访）

近日，小S曝光了一个新的采访，并且从中谈到了几个女儿们的消费观，还一个不小心牵扯到了姐姐大S，提到了三个比较重要的信息，让人感觉他们这一家子真的是无论如何都不会消停。广告胆小者…

创业项目 2023年11月5日
100 0
高价进口支架失踪，医生承认支架没放进去，怕丢脸，伪造病历成功（支架进口多少钱一个）

近日，一起医疗事故引发公众广泛关注。江苏宿迁市一位患者的父亲因突发严重脑梗症状送医抢救，然而术后家属发现，之前医生宣称成功植入的高价进口支架竟然”消失”了。…

创业项目 2023年7月11日
148 0
医生为了面子，在手术失败的情况下，谎称为患者成功植入支架肖战《玉骨遥》首波口碑出炉！观众的打分和评价都“一针见血”（医生为了挣钱不断让做手术）

江苏宿迁，一老人因突发严重脑梗症状送医抢救，但不幸的是，老人最终还是因抢救无效死亡。可让老人家属万万没想到的是，老人之前植入到颅内血管价值47000元的进口支架，竟然“消失”了。事…

创业项目 2023年7月11日
141 0
创业项目

巨搞笑又简短的小品剧本巨搞笑又简短的小品剧本四人

男一：服务员，哎哟我，这么老多人呢，哎呀，哎哟，哎哟，哎哟我去，这什么凳子，这上面这么还有根钉子，服务员，哎哟我，太吓人了还有凶器。排队。男二：啊，啊哦，啊哦，哎哟，哎呀。男一…

2022年9月10日
288 0
创业项目

一家超火的港风烧烤店，带你回到“90”年代，一大桌只要38块（港式烧烤店装修效果图大全图片）

半夜11点，依然苦等一小时~这人气真的绝了象门口有一个柠檬奶茶店，我真的怀疑是同一个老板，大树底下好乘凉，敢问在这大热天门口等着，谁不想去买一杯柠檬鲜榨喝喝!抱着实在太热了先搞个酸…

2023年10月30日
134 0
创业项目

谷歌联手联发科打造AI芯片？联发科否认：错误报道，误导投资人（谷歌框架一直闪退）

打开凤凰新闻，查看更多高清图片联发科否认与谷歌联手来打造AI芯片。 6月19日，联发科发布澄清公告称，台湾经济日报相关报道是基于市场传言未经全面核实的错误报道，影响公司及投资人权…

2023年6月21日
179 0
创业项目

阳光家园计划残疾人居家托养服务（2021年阳光家园计划）

党员联户红益坊创新服务新模式为进一步补充基层治理力量，发挥党员先锋模范作用，创新基层服务方式，关爱弱势群体，形成多方力量参与的基层治理大格局，德城区城隍庙社区在前期组织开展以老…

2022年5月5日
412 0
创业项目

王牌女飞行员刘宇环退役后航空公司抢破头,成最贵民航女机长（刘宇环个人资料简介）

“……今天你在飞机上坐了几个小时了？” “14个小时了，本来我们计划时间是5点40落地的，然后我们在空中的时候让我们调速，广州雷雨覆盖……” 这段对话出自央视特别栏目《走基层·在岗…

2023年6月16日
168 0
创业项目

网上如何做生意（如何做生意起步）

　　花钱的技巧是什么？在游戏中，赚钱才是真正的王道~为了让玩家感受到满满的快乐，《醉红楼》建立了完善有趣的商业运行系统！玩家不仅可以参与“帮跑生意”为帮派赚取利润，还可以为自己赚一…

2022年8月21日
312 0
创业项目

我和对联的故事（8）：联都人物（我和对联的阅读理解答案）

联都论坛注册会员几万，高手如云，除了我之前写过的康师傅，周大烟袋，我还想介绍三个人。一、百草霜百草霜是位小姑娘，人如其名，高冷寡言、独来独往。发帖后，便不再回复别人的留言。因为…

2023年6月21日
154 0