Redshift(Redshift)

优质
小牛编辑
140浏览
2023-12-01

Amazon Redshift是云中完全托管的数据仓库服务。 它的数据集范围从100千兆字节到1千兆字节。 创建数据仓库的初始过程是启动一组称为nodes的计算资源,这些计算资源被组织成称为cluster 。 之后,您可以处理您的查询。

如何设置Amazon Redshift?

以下是设置Amazon Redshift的步骤。

Step 1 - 使用以下步骤登录并启动Redshift群集。

  • 登录AWS管理控制台并使用以下链接打开Amazon Redshift控制台 - https://console.aws.amazon.com/redshift/

  • 使用屏幕右上角的“区域”菜单选择要创建群集的区域。

  • 单击“启动群集”按钮。

启动群集
  • “群集详细信息”页面打开 提供所需的详细信息,然后单击“继续”按钮,直到查看页面。

群集细节
  • 将打开确认页面。 单击“关闭”按钮完成,以便群集在“群集”列表中可见。

群集关闭
  • 在列表中选择群集,然后查看群集状态信息。 该页面将显示群集状态。

群集状态

Step 2 - 配置安全组以授权客户端与群集的连接。 授权访问Redshift取决于客户端是否授权EC2实例。

按照以下步骤操作EC2-VPC平台上的安全组。

  • 打开Amazon Redshift Console,然后单击导航窗格上的Clusters。

  • 选择所需的群集。 其配置选项卡打开。

雪犁
  • 单击“安全”组。

  • 安全组页面打开后,单击“入站”选项卡。

安全组
  • 单击“编辑”按钮。 如下所示设置字段,然后单击“保存”按钮。

    • Type - 自定义TCP规则。

    • Protocol - TCP。

    • Port Range - 键入启动集群时使用的相同端口号。 Amazon Redshift的默认端口为5439。

    • Source - 选择自定义IP,然后键入0.0.0.0/0。

编辑入站规则

Step 3 - 连接到Redshift群集。

有两种方法可以直接或通过SSL连接到Redshift群集。

以下是直接连接的步骤。

  • 使用SQL客户端工具连接群集。 它支持与PostgreSQL JDBC或ODBC驱动程序兼容的SQL客户端工具。

    使用以下链接下载 - JDBC https://jdbc.postgresql.org/download/postgresql-8.4-703.jdbc4.jar

    用于64位机器的ODBC https://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_08_04_0200.zip或http://ftp.postgresql.org/pub/odbc/versions/msi/psqlodbc_09_00_0101x64.zip

  • 使用以下步骤获取连接字符串。

    • 打开Amazon Redshift控制台,然后在“导航”窗格中选择“群集”。

    • 选择所选群集,然后单击“配置”选项卡。

    • 将打开一个页面,如以下屏幕截图所示,其中包含Cluster Database Properties下的JDBC URL。 复制URL。

簇
  • 使用以下步骤将Cluster与SQL Workbench/J连接。

    • 打开SQL Workbench/J.

    • 选择“文件”,然后单击“连接”窗口。

    • 选择创建新的连接配置文件并填写所需的详细信息,如名称等。

    • 单击管理驱动程序和管理驱动程序对话框打开

    • 单击“创建新条目”按钮并填写所需的详细信息。

管理驱动程序
  • 单击文件夹图标并导航到驱动程序位置。 最后,单击“打开”按钮。

红移
  • 将“类名”框和“示例URL”框保留为空。 单击确定。

  • 从列表中选择驱动程序。

  • 在URL字段中,粘贴复制的JDBC URL。

  • 输入各自字段的用户名和密码。

  • 选择“自动提交”框,然后单击“保存配置文件列表”。

选择连接配置文件

Amazon Redshift的功能

以下是Amazon Redshift的功能 -

  • Supports VPC - 用户可以在VPC内启动Redshift,并通过虚拟网络环境控制对群集的访问。

  • Encryption - 在Redshift中创建表时,可以加密和配置存储在Redshift中的数据。

  • SSL - SSL加密用于加密客户端和Redshift之间的连接。

  • Scalable - 只需点击几下,就可以根据需要在Redshift数据仓库中轻松扩展节点数量。 它还允许扩展存储容量而不会降低性能。

  • Cost-effective - Amazon Redshift是传统数据仓库实践的经济高效的替代方案。 没有前期成本,没有长期承诺和按需定价结构。