Galaxy是一个数据中心操作系统,目标是最大化资源的利用率与降低应用部署运维代价,
支持万台集群资源调度与管理,目前主要服务于百度网页搜索离线架构业务,解决分布式文件系统,分布式表格系统,以及上层计算模块运维与部署问题。
架构图
特点
支持google kubernets pod概念,每个pod一个 initd进程管理任务
基于initd架构支持agent热升级
多master主备
支持多调度器
注:内容翻译自 Clustering Guide 概述 启动 etcd 集群要求每个成员知道集群中的其他成员。在一些场景中,集群成员的 IP 地址可能无法提前知道。在这种情况下,etcd 集群可以在发现服务的帮助下启动。 一旦 etcd 集群启动并运行,通过 运行时重配置 来添加或者移除成员。为了更好的理解运行时重配置背后的设计,建议阅读 运行时重配置的设计。 这份指南将覆盖下列用于启动 etcd
注: 内容翻译自 Versioning 服务版本 etcd 使用 semantic versioning。新的小版本可能增加额外功能到API。 使用 etcdctl 获取运行中的 etcd 集群的版本: ETCDCTL_API=3 etcdctl --endpoints=127.0.0.1:2379 endpoint status API 版本 在 3.0.0 发布值偶 v3 API 应答将不会更
注:内容翻译自 Performance 理解性能 etcd 提供稳定的,持续的高性能。两个定义性能的因素:延迟(latency)和吞吐量(throughput)。延迟是完成操作的时间。吞吐量是在某个时间期间之内完成操作的总数量。当 etcd 接收并发客户端请求时,通常平均延迟随着总体吞吐量增加而增加。在通常的云环境,比如 Google Compute Engine (GCE) 标准的 n-4 或者
注: 内容翻译自 Maintenance 概述 etcd 集群需要定期维护来保持可靠。基于 etcd 应用的需要,这个维护通常可以自动执行,不需要停机或者显著的降低性能。 所有 etcd 的维护是指管理被 etcd 键空间消耗的存储资源。通过存储空间的配额来控制键空间大小;如果 etcd 成员运行空间不足,将触发集群级警告,这将使得系统进入有限操作的维护模式。为了避免没有空间来写入键空间, etc
注: 内容翻译自 Configuration flags etcd可以通过命令行标记和环境变量来配置。命令行上设置的选项优先于环境变量。 对于标记 --my-flag 环境变量的格式是 ETCD_MY_FLAG。 适用于所有标记。 正式的ectd端口 是 2379 用于客户端连接,而 2380 用于伙伴通讯。etcd 端口可以设置为接受 TLS 通讯,non-TLS 通讯,或者同时有 TLS 和
注: 内容翻译自 Security Model TBD……
注: 内容翻译自 Run etcd clusters inside containers 下列指南展示如何使用 static bootstrap process 来用rkt和docker运行 etcd 。 rkt 运行单节点 etcd 下列 rkt 运行命令将在端口 2379 上暴露 etcd 客户端API,而在端口 2380上暴露伙伴API。 当配置 etcd 时使用 host IP地址。 ex
用 upstart 控制 Ceph 用 ceph-deploy 把 Ceph Cuttlefish 及更高版部署到 Ubuntu 之后,你可以用基于事件的 Upstart 来启动、关闭 Ceph 节点上的守护进程。 Upstart 不要求你在配置文件里定义守护进程例程。 用下列命令列出 Ceph 作业和例程: sudo initctl list | grep ceph 详情参见 initctl 。