当前位置: 首页 > 软件库 > 程序开发 > 常用工具包 >

amazon-kinesis-client-python

Amazon KCL 的 Python 库
授权协议 Apache
开发语言 Python
所属分类 程序开发、 常用工具包
软件类型 开源软件
地区 不详
投 递 者 朱天逸
操作系统 跨平台
开源组织 Amazon
适用人群 未知
 软件概览

amazon-kinesis-client-python 提供了一个到 Amazon Kinesis Client Library(KCL)接口,它是 Amazon KCL for Java 的一部分。开发者可以用 Amazon KCL 建立可处理大规模流数据的分布式应用程序。Amazon KCL 照顾了很多与分布式计算相关的复杂任务。这个接口管理着 MultiLangDaemon 的交互,所以开发者可以专注于实现他们可执行的记录处理器。

示例代码:

    #!env python
    from amazon_kclpy import kcl    import json, base64
    class RecordProcessor(kcl.RecordProcessorBase):
            def initialize(self, shard_id):
            pass

        def process_records(self, records, checkpointer):
            pass

        def shutdown(self, checkpointer, reason):
            pass

    if __name__ == "__main__":
        kclprocess = kcl.KCLProcess(RecordProcessor())
        kclprocess.run()
  • 1.创建自己的应用目录,cd进入目录 2.Kinesis增加应用: cp ~/amazon-kinesis-client-python-master/samples/sample_kclpy_app.py . cp ~/amazon-kinesis-client-python-master/samples/sample.properties . 拷贝后将上面二文件编辑修改AWS相关信息及应用Ap

  • 大数据ETL 系列文章简介 本系列文章主要针对ETL大数据处理这一典型场景,基于python语言使用Oracle、aws、Elastic search 、Spark 相关组件进行一些基本的数据导入导出实战,如: oracle使用数据泵impdp进行导入操作。 aws使用awscli进行上传下载操作。 本地文件上传至aws es spark dataframe录入ElasticSearch 等典型数

  • 1.新建一个空目录kclimage 2.Java官方下载: jdk-8u191-linux-x64.tar.gz 到 kclimage目录 3.下载amazon-kinesis-client-python-master.zip文件到kclimage目录 4.vim Dockerfile 文件内容如下: FROM 使用你的基础镜像,需有python(如: FROM defaultimage:late

  • 通过 Kinesis Firehose 将传输到 Kinesis Stream 中的 CW log 发送到 ES时,需要使用到 Lambda 中的 蓝图 kinesis-firehose-cloudwatch-logs-processor 和 kinesis-firehose-cloudwatch-logs-processor-python 。 而其中最重要的问题是 ES 只能接受 JSON 数据

 相关资料
  • Amazon Kinesis是一种托管,可扩展,基于云的服务,允许实时处理每秒流式传输大量数据。 它专为实时应用程序而设计,允许开发人员从多个来源接收任何数量的数据,可以在EC2实例上运行扩展和缩小。 它用于从大型分布式流(如事件日志和社交媒体源)捕获,存储和处理数据。 处理完数据后,Kinesis会同时将其分发给多个消费者。 如何使用亚马逊KCL? 它用于我们需要快速移动数据及其连续处理的情况。

  • Amazon Kinesis Connector 可以帮助开发者将 Amazon Kinesis 和其他 AWS 、非 AWS 服务。目前库的版本提供 Amazon DynamoDB,Amazon Redshift,Amazon S3 ,Elasticsearch 的连接器。这个库包括每种类型的样本连接器,再加上为运行样本的 Apache Ant 构建文件。 要求: Amazon Kinesis客

  • 我不熟悉动态信息,所以这似乎是一个非常基本的问题,但我还没有找到一个明确的答案来解释动态信息流中读写事务之间的实际区别。 Amazon Kinesis Limits的相关部分: GetShardIterator可以为每个打开的碎片每秒提供多达5个事务 GetRecords可以检索10 MB的数据 每个碎片每秒最多可支持5个事务进行读取,最大总数据读取速率为每秒2 MB 每个碎片每秒最多可支持102

  • 我正在做一个项目,我需要将视频从我的IP摄像机发送到Kinesis视频流,并使用Sagemaker来托管我的ML模型,然后它将实时分析来自Kinesis视频流的视频。 我跟踪了这个链接:https://aws.amazon.com/blogs/machine-learning/analyse-live-video-at-scale-in-real-time-using-amazon-kinesis

  • 我的团队正在使用Amazon Kinesis将其他数据集上的查询结果输出到我们自己的S3存储桶中。 虽然我们根本不经常运行查询,但我们在计费控制台中看到,仅在12月份,到目前为止,我们仍在使用24000个碎片小时。 现在有没有人知道,如果在碎片实际运行时,或者如果碎片刚刚启动并存在,动觉会充电?