lines = p | 'read' >> ReadFromText(known_args.input)
# Count the occurrences of each word.
def count_ones(word_ones):
(word, ones) = word_ones
return (word, sum(ones))
counts = (lines
| 'split' >> (beam.ParDo(WordExtractingDoFn())
.with_output_types(unicode))
| 'pair_with_one' >> beam.Map(lambda x: (x, 1))
| 'group' >> beam.GroupByKey()
| 'count' >> beam.Map(count_ones))
来自:https://github.com/apache/beam/blob/master/sdks/python/apache_beam/examples/wordcount.py#l92
Python中和
>
的语法和用法是什么?
默认情况下,代表逻辑或位或运算符,
>
代表右移,但幸运的是,您可以在Python中重载运算符。因此,为了对和
>>进行自定义,
只需在类__or__
和__rshift__
中重载以下两个dunder(magic)方法:
class A():
def __or__(self):
pass
def __rshift__(self):
pass
我建议您阅读更多关于Python数据模型的内容。
现在看一下Beam Python SDK,__or__
在PTransform
类中重载:
def __or__(self, right):
"""Used to compose PTransforms, e.g., ptransform1 | ptransform2."""
if isinstance(right, PTransform):
return _ChainedPTransform(self, right)
return NotImplemented
可能重复: 之间的差异 什么是<代码> 为什么
本文向大家介绍ElasticSearch中的副本是什么?相关面试题,主要包含被问及ElasticSearch中的副本是什么?时的应答技巧和注意事项,需要的朋友参考一下 一个索引被分解成碎片以便于分发和扩展。副本是分片的副本。一个节点是一个属于一个集群的ElasticSearch的运行实例。一个集群由一个或多个共享相同集群名称的节点组成。
这里的。class是什么,它指定了什么?c和a不同吗?
有两种代码,其中vscode会自动将x:放入系统中。出来println我的问题是x是什么:为什么vs代码会把它放在代码中--示例代码1- 示例代码2--
我一直在谷歌搜索它,但谷歌搜索关键字“?”也没那么好。我很想知道它是做什么的,什么时候用。 谢了! 我已经看过几次了,但这里有一个我刚刚看到的例子