Redshift(Redshift)
Amazon Redshift是云中完全托管的数据仓库服务。 它的数据集范围从100千兆字节到1千兆字节。 创建数据仓库的初始过程是启动一组称为nodes的计算资源,这些计算资源被组织成称为cluster 。 之后,您可以处理您的查询。
如何设置Amazon Redshift?
以下是设置Amazon Redshift的步骤。
Step 1 - 使用以下步骤登录并启动Redshift群集。
登录AWS管理控制台并使用以下链接打开Amazon Redshift控制台 - https://console.aws.amazon.com/redshift/
使用屏幕右上角的“区域”菜单选择要创建群集的区域。
单击“启动群集”按钮。
“群集详细信息”页面打开 提供所需的详细信息,然后单击“继续”按钮,直到查看页面。
将打开确认页面。 单击“关闭”按钮完成,以便群集在“群集”列表中可见。
在列表中选择群集,然后查看群集状态信息。 该页面将显示群集状态。
Step 2 - 配置安全组以授权客户端与群集的连接。 授权访问Redshift取决于客户端是否授权EC2实例。
按照以下步骤操作EC2-VPC平台上的安全组。
打开Amazon Redshift Console,然后单击导航窗格上的Clusters。
选择所需的群集。 其配置选项卡打开。
单击“安全”组。
安全组页面打开后,单击“入站”选项卡。
单击“编辑”按钮。 如下所示设置字段,然后单击“保存”按钮。
Type - 自定义TCP规则。
Protocol - TCP。
Port Range - 键入启动集群时使用的相同端口号。 Amazon Redshift的默认端口为5439。
Source - 选择自定义IP,然后键入0.0.0.0/0。
Step 3 - 连接到Redshift群集。
有两种方法可以直接或通过SSL连接到Redshift群集。
以下是直接连接的步骤。
使用SQL客户端工具连接群集。 它支持与PostgreSQL JDBC或ODBC驱动程序兼容的SQL客户端工具。
使用以下链接下载 - JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar
用于64位机器的ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip或http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip
使用以下步骤获取连接字符串。
打开Amazon Redshift控制台,然后在“导航”窗格中选择“群集”。
选择所选群集,然后单击“配置”选项卡。
将打开一个页面,如以下屏幕截图所示,其中包含Cluster Database Properties下的JDBC URL。 复制URL。
使用以下步骤将Cluster与SQL Workbench/J连接。
打开SQL Workbench/J.
选择“文件”,然后单击“连接”窗口。
选择创建新的连接配置文件并填写所需的详细信息,如名称等。
单击管理驱动程序和管理驱动程序对话框打开
单击“创建新条目”按钮并填写所需的详细信息。
单击文件夹图标并导航到驱动程序位置。 最后,单击“打开”按钮。
将“类名”框和“示例URL”框保留为空。 单击确定。
从列表中选择驱动程序。
在URL字段中,粘贴复制的JDBC URL。
输入各自字段的用户名和密码。
选择“自动提交”框,然后单击“保存配置文件列表”。
Amazon Redshift的功能
以下是Amazon Redshift的功能 -
Supports VPC - 用户可以在VPC内启动Redshift,并通过虚拟网络环境控制对群集的访问。
Encryption - 在Redshift中创建表时,可以加密和配置存储在Redshift中的数据。
SSL - SSL加密用于加密客户端和Redshift之间的连接。
Scalable - 只需点击几下,就可以根据需要在Redshift数据仓库中轻松扩展节点数量。 它还允许扩展存储容量而不会降低性能。
Cost-effective - Amazon Redshift是传统数据仓库实践的经济高效的替代方案。 没有前期成本,没有长期承诺和按需定价结构。