分布式系统
0 人感兴趣 · 80 次引用
- 最新
- 推荐
技术看点:基于多副本的 IO 负载均衡思考
分布式存储解决了传统存储的很多卡脖子的问题,其中包括可让数据均匀地分散在设备上存储,从而保障了某个节点宕掉的话还有其它节点可用让业务连续。
阿里云机器学习 PAI 发布基于 HLO 的全自动分布式系统 TePDist,并宣布开源!
TePDist是阿里云PAI团队自研的基于HLO IR层的全自动分布式深度学习系统,它不仅仅是一个分布式Compiler,还拥有自己的分布式Runtime,有效地解决了深度学习模型并行策略的自动搜索与分布式策略实施问题。
架构师日记 - 为什么数据一致性那么难
在现代大型分布式软件系统中,有一个绕不过去的课题,那就是如何保证系统的数据一致性。著名的Paxos算法(Megastore、Spanner),Raft协议(ETCD、TiKV、Consul ),ZAB协议(ZooKeeper)等分布式一致性解决方案,都是在此背景下而诞生的
分布式系统 -CAP 理论
在前一篇分布式系统–拜占庭将军问题(The Byzantine Generals Problem) 我们理解了共识问题的背景,这一节主要讨论如何解决或者理解自己系统中的共识问题,通过什么来分辨自己的系统需要哪一种共识。
Chaos 测试下的若干 NebulaGraph Raft 问题分析
作为分布式系统的基石 Raft 有非常明显的优势,但这也伴随着不小的挑战 —— Raft 算法的实现及其容易出错,同时算法的测试和调试也是一项巨大的挑战。
技术分享| 分布式系统中服务注册发现组件的原理及比较
在分布式架构的系统中,服务发现简单来讲就是通过服务名找到提供服务的实例地址和端口,主要用于解决如何获取服务实例地址问题。
FIXP vs SSL/TLS,谁更安全?
FIXP和SSL/TLS谁更安全?这是一位LAXCUS分布式应用软件开发者提出来的问题。其实以前也有人问过,今天写篇文章正式回答一下。我先说结论:SSL/TLS实现的作业流程和技术原理,FIXP同样拥有,但是FIXP包含的某些技术和作业流程,SSL/TLS却没有提供。下面就来仔
搜索引擎分布式系统思考实践
本篇文章主要是对搜索引擎分布式的设计和落地做了总结,主要的几个重要部分是,如何设计一套有状态的分布式系统,其中最主要的核心部分是如何对各个节点的状态变化做处理,以及合理的对数据进行分片和处理。
深入解析分布式文件系统的一致性的实现
本文作者为中国移动云能力中心大数据团队软件开发工程师冯永设,文章从分布式系统CAP理论出发,详细介绍了分布式一致性共识系统的功能架构、选举机制,以及三种可以实现一致性的数据复制机制,供大家参考。
TLA+ 入门教程(1):形式化方法简介
本次 TLA+ 入门教程系列将分为几个部分,帮助你从零掌握 TLA+ 语言的基本知识,欢迎关注公众号和知乎“多颗糖”。
InfoQ 极客传媒 15 周年庆征文|分布式系统解决之道:目录、消息队列、事务系统及其他
分布式系统是一个由很多进程组成的整体,这个整体中每个成员部分,都会具备一些状态,比如负载情况,对某些数据的掌握等等。而这些和其他进程相关的数据,在故障恢复、扩容缩容的时候变得非常重要。