TerarkDB

兼容 RocksDB 的 KV 存储引擎
授权协议 Apache 2.0
开发语言 C/C++
所属分类 数据库相关、 NoSQL数据库
软件类型 开源软件
地区 国产
投 递 者 微生毅
操作系统 Linux
开源组织
适用人群 未知
 软件概览

TerarkDB 是字节跳动开源的 RocksDB 的替代品,具有优化的尾部延迟、吞吐量和压缩等。在大多数情况下,你可以将现有的 RocksDB 实例迁移到 TerarkDB,没有任何问题。

  • TerarkDB 仅在 Linux 平台下测试和生产就绪
  • 除 C/C++ 之外的语言绑定尚未完全测试。
  • 现有数据可以直接从 RocksDB 迁移到 TerarkDB,但不能迁移回 RocksDB。
  • TerarkDB 是从 RocksDB v5.18.3 分支出来的

性能概览

  • RocksDB v6.12
  • 服务器
    • Intel(R) Xeon(R) Gold 5218 CPU @ 2.30GHz(2 插槽,32 核 64 线程)
    • 376 GB 动态内存
    • NVMe TLC 固态硬盘(3.5 TB)
  • 工作台工具和工作负载
    • 利用 db_bench
    • 10 个客户端线程,每个线程 20GB 请求
    • 键 = 24 字节,值 = 2000 字节
    • heavy_write 意味着 90% 的写操作
    • heavy_read 意味着 90% 的读取操作

用法

  • 基于块的表(BlockBasedTable
#include <cassert>
#include "rocksdb/db.h"

rocksdb::DB* db;
rocksdb::Options options;

// Your options here
options.create_if_missing = true;
options.wal_bytes_per_sync = 32768;
options.bytes_per_sync = 32768;

// Open DB
auto status = rocksdb::DB::Open(options, "/tmp/testdb", &db);

// Operations
std::string value;
auto s = db->Put(rocksdb::WriteOptions(), "key1", "value1");
s = db->Get(rocksdb::ReadOptions(), "key1", &value);
assert(s.ok());
assert("value1" == value);

s = db->Delete(rocksdb::WriteOptions(), "key1");
assert(s.ok());

或手动设置表格格式和表格选项:

#include <cassert>
#include "rocksdb/db.h"
#include "rocksdb/options.h"
#include "rocksdb/table.h"

rocksdb::DB* db;
rocksdb::Options options;

// Your db options here
options.create_if_missing = true;
options.wal_bytes_per_sync = 32768;
options.bytes_per_sync = 32768;

// Manually specify target table and table options
rocksdb::BlockBasedTableOptions table_options;
table_options.block_cache =
    rocksdb::NewLRUCache(32ULL << 30, 8, false);
table_options.block_size = 8ULL << 10;
options.table_factory = std::shared_ptr<rocksdb::TableFactory>
                          (NewBlockBasedTableFactory(table_options));

// Open DB
auto status = rocksdb::DB::Open(options, "/tmp/testdb2", &db);

// Operations
std::string value;
auto s = db->Put(rocksdb::WriteOptions(), "key1", "value1");
s = db->Get(rocksdb::ReadOptions(), "key1", &value);
assert(s.ok());
assert("value1" == value);

s = db->Delete(rocksdb::WriteOptions(), "key1");
assert(s.ok());
  • Terark 压缩表格(TerarkZipTable
#include <cassert>
#include "rocksdb/db.h"
#include "rocksdb/options.h"
#include "rocksdb/table.h"
#include "table/terark_zip_table.h"

rocksdb::DB* db;
rocksdb::Options options;

// Your db options here
options.create_if_missing = true;
options.wal_bytes_per_sync = 32768;
options.bytes_per_sync = 32768;

// TerarkZipTable need a `fallback` options because you can indicate which LSM level you want to start using TerarkZipTable
// For example, by setting tzt_options.terarkZipMinLevel = 2, TerarkDB will use your fallback Table on level 0 and 1.
std::shared_ptr<rocksdb::TableFactory> table_factory;
rocksdb::BlockBasedTableOptions blockbased_options;
blockbased_options.block_size = 8ULL << 10;
table_factory.reset(NewBlockBasedTableFactory(blockbased_options));

rocksdb::TerarkZipTableOptions tzt_options;
// TerarkZipTable requires a temp directory other than data directory, a slow device is acceptable
tzt_options.localTempDir = "/tmp";
tzt_options.indexNestLevel = 3;
tzt_options.sampleRatio = 0.01;
tzt_options.terarkZipMinLevel = 2; // Start using TerarkZipTable from level 2

table_factory.reset(
    rocksdb::NewTerarkZipTableFactory(tzt_options, table_factory));

options.table_factory = table_factory;

// Open DB
auto status = rocksdb::DB::Open(options, "/tmp/testdb2", &db);

// Operations
std::string value;
auto s = db->Put(rocksdb::WriteOptions(), "key1", "value1");
s = db->Get(rocksdb::ReadOptions(), "key1", &value);
assert(s.ok());
assert("value1" == value);

s = db->Delete(rocksdb::WriteOptions(), "key1");
assert(s.ok());

实际性能改进

TerarkDB 已经部署在字节跳动的许多应用程序中,在大多数情况下,TerarkDB 可以帮助减少延迟峰值并极大地提高吞吐量。

磁盘写入(Disk Write

获取延迟(Get Latency )

  • 使用TerarkDB提升MyRocks的性能 ——随机读场景下的 MySQL性能优化 雷鹏 peng@ CTO 大纲 l MyRocks简介 l 为什么选择 MyRocks l 传统数据库的块压缩 l 硬件的发展趋势 l TerarkDB 和 MyRocks 的关系 l TerarkDB 的原理、优势、劣势 l 新的问题,以及优化建议 MyRocks简介 l MyRocks=MySQL+Rocks

  • 1. 安装并启动 TerarkSQL 2. 创建测试所需的数据库以及表 下载测试程序以及创建测试所需要表的 SQL 脚本 wget http://terark-downloads.oss-cn-qingdao.aliyuncs.com/docker_assets/ycsb-terarksql-test.tar.gz tar zxvf ycsb-terarksql-test.tar.gz 创建测试表

 相关资料
  • 我将一些电子邮件附件保存到Azure Blob中。 我现在正在尝试编写一个Azure Functions应用程序,它将连接到blob存储,运行一些脚本并重新保存文件。 但是,在为函数选择存储帐户时,我无法选择我的blob存储帐户。 我上了网站,上面写着: 创建函数应用时,必须创建或链接到支持 Blob、队列和表存储的常规用途 Azure 存储帐户。某些存储帐户不支持队列和表。这些帐户包括仅 blo

  • 问题内容: 我无法在Google Container Engine中使用“应用程序默认凭据”。这些文档说,它们是为App Engine和Compute Engine设计的,但是有人告诉我,它们应该透明地传递给在Container Engine上运行的容器。 这是失败的代码: 失败的错误: 期望Application Default Credentials与Container Engine一起使用是

  • MinIO JavaScript Client SDK提供简单的API来访问任何Amazon S3兼容的对象存储服务。 本快速入门指南将向您展示如何安装客户端SDK并执行示例JavaScript程序。有关API和示例的完整列表,请参阅JavaScript客户端API参考文档。 本文假设你已经安装了nodejs 。 使用NPM下载 npm install --save minio 下载并安装源码 g

  • RocksDB 是一个来自 facebook 的可嵌入式的支持持久化的 key-value 存储系统,也可作为 C/S 模式下的存储数据库,但主要目的还是嵌入式。RocksDB 基于 LevelDB 构建。关于 RocksDB 的性能说明。

  • 问题内容: 我有一个在MySQL 5.6上运行良好的存储过程。在最近的服务器迁移中,我们升级到MySQL 5.7.19。 我的存储过程现在抛出错误: 我已经设置了对通过文件,重新启动mysql服务,并通过控制台,以确认登录的通过是空白 尽管如此,当我尝试运行存储过程时,我仍然收到上述错误。 接下来,我该怎么办才能继续排除错误的出处? 问题答案: 根据文档,MySQL使用创建该过程时处于活动状态的s

  • MinIO Go Client SDK提供了简单的API来访问任何与Amazon S3兼容的对象存储服务。 支持的云存储: AWS Signature Version 4 Amazon S3 MinIO AWS Signature Version 2 Google Cloud Storage (兼容模式) Openstack Swift + Swift3 middleware Ceph Objec