我试图创建一个Dataproc集群与Presto作为可选组件,我想添加一个Kafka目录。以下https://cloud.google.com/dataproc/docs/concepts/components/presto和https://prestodb.io/docs/current/connector/kafka.html#configuration-properties我使用以下命令:
gcloud beta dataproc clusters create mycluster \
--region us-central1 \
--no-address \
--zone us-central1-a \
--single-node \
--master-machine-type n1-standard-4 \
--master-boot-disk-size 500 \
--project myproject \
--optional-components=PRESTO \
--enable-component-gateway \
--properties="presto-catalog:kafkastream.connector.name=kafka,presto-catalog:kafkastream.kafka.tables-names=topicname,presto-catalog:kafkastream.kafka.nodes=kafkavm:9092,presto-catalog:kafkastream.kafka.default-schema=default,presto-catalog:kafkastream.kafka.hide-internal-columns=false"
因此,基本上我想设置属性
来安装名为kafkastream
的目录,该目录连接到端口9092
上的Kafka虚拟机,并创建一个表default。主题名称
。
但是,当我尝试创建群集时,状态会出错。在日志中,我发现了与结构错误{presto相关的内容,组件presto未能激活
。日志中的其他错误有
google-dataproc-startup[1129]: activate-component-presto[2447]: Query 12345 failed: Presto server is still initializing
google-dataproc-startup[1129]: activate-component-presto[2447]: 'get_node_information' attempt 6 failed! Sleeping 10s.
google-dataproc-startup[1129]: activate-component-presto[2447]: Error running command: java.net.ConnectException: Failed to connect to localhost/0:0:0:0:0:0:0:1:8060
如果我删除属性
部分Presto完美工作。
设置Kafka目录的正确方法是什么?有人能帮帮我吗?我无法在其他stackoverflow主题或网上找到与此问题相关的信息。
属性名kafka中有输入错误。表名称
:
$ cat /var/log/presto/server.log | grep Exception -A 10
...
1) Error: Configuration property 'kafka.tables-names' was not used
1 error
at io.airlift.bootstrap.Bootstrap.initialize(Bootstrap.java:238)
at io.prestosql.plugin.kafka.KafkaConnectorFactory.create(KafkaConnectorFactory.java:73)
at io.prestosql.connector.ConnectorManager.createConnector(ConnectorManager.java:349)
at io.prestosql.connector.ConnectorManager.createCatalog(ConnectorManager.java:208)
at io.prestosql.connector.ConnectorManager.createCatalog(ConnectorManager.java:200)
at io.prestosql.connector.ConnectorManager.createCatalog(ConnectorManager.java:186)
应该是Kafka。表名(在表
之后没有s
)。您在init操作中操作正确,但在--properties
标志中操作错误。
可选组件Presto的--properties
功能似乎有一个bug,不能按预期工作。但是,我找到了一种通过初始化脚本init脚本建立Kafka目录的方法。地面军事系统存储桶中的sh
:
#init-script.sh
function add_kafka-catalog() {
cat > /etc/presto/conf/catalog/kafka.properties <<EOF
connector.name=kafka
kafka.nodes=my-vm:9092
kafka.table-names=my-topic
kafka.hide-internal-columns=false
EOF
}
# Restart presto to read new catalogs
function restart_presto() {
sudo /usr/lib/presto/bin/launcher restart
}
function main() {
add_kafka-catalog
restart_presto
}
main
以及通过
gcloud beta dataproc clusters create mycluster \
--region us-central1 \
--no-address \
--zone us-central1-a \
--single-node \
--master-machine-type n1-standard-4 \
--master-boot-disk-size 500 \
--project myproject \
--optional-components=PRESTO \
--enable-component-gateway
--initialization-actions 'gs://mybucket/init-script.sh
我试图提交一个作业在运行Presto的群集与postgresql连接器。 集群初始化如下所示: 指向一个bash文件,其中包含使用postgresql启动presto集群的初始化操作。 我不使用,因为我需要来执行非默认操作。同时具有和都不起作用。 当我尝试运行简单作业时: 我得到以下错误: 是否有其他方法来定义集群上的可选组件? 更新: 同时使用和,如下所示: 是从该repo复制的。只需对函数以创
我有一个Gradle多项目构建,看起来像这样: 我希望将目录< code>shared中的所有项目作为依赖项添加到< code>plugins中的所有项目。 更一般地说:我如何按目录配置子项目? settings.gradle的内容: build.gradle的内容:
重要的客户端配置 最重要的老的 scala 版本的 producer 配置 acks compression sync vs async production batch size (for async producers) 最重要的新的 Java 版本的 producer 配置 acks compression batch size 最重要的 consumer 配置是 fetch size。 所
我在一个简单的Kafka消费程序中遇到了一些问题: 这些是我的财产: 我了解到这可能是一个与jaas相关的问题。但是我对Kafka还不熟悉,我不知道怎么找到它。。 你能帮帮我吗?谢谢你!
本文向大家介绍详解Spring Kafka中关于Kafka的配置参数,包括了详解Spring Kafka中关于Kafka的配置参数的使用技巧和注意事项,需要的朋友参考一下 SpringKafka文档地址:https://docs.spring.io/spring-kafka/reference/htmlsingle kafka文档地址:http://kafka.apache.org/documen
是否有任何选项可以在Presto cli上提供参数。