当前位置: 首页 > 面试题库 >

在pyspark中找不到col函数

师冥夜
2023-03-14
问题内容

在pyspark 1.6.2中,我可以通过导入col功能

from pyspark.sql.functions import col

但是当我尝试在Github源代码中查找它时,我发现文件中没有col函数,functions.pypython如何导入不存在的函数?


问题答案:

它存在。只是没有明确定义。从中导出的函数pyspark.sql.functions是围绕JVM代码的精简包装,除少数需要特殊处理的异常外,这些函数是使用辅助方法自动生成的。

如果您仔细检查来源,就会发现其中col列出了其他来源_functions。此字典会进一步迭代,_create_function并用于生成包装器。每个生成的函数都直接分配给中的相应名称globals

最后__all__,它定义了从模块导出的项目的列表,仅导出globals除黑名单中包含的项目以外的所有项目。

如果仍然不清楚这种机制,则可以创建一个玩具示例:

  • 创建foo.py带有以下内容的Python模块:

    # Creates a function assigned to the name foo
    

    globals()[“foo”] = lambda x: “foo {0}”.format(x)

    all = [x for x in globals() if x.startswith(“foo”)]

  • 将其放置在Python路径上的某个位置(例如,在工作目录中)。

  • 导入foo

    from foo import foo
    

    foo(1)

这种元编程方法的不良副作用是,纯依赖于静态代码分析的工具可能无法识别已定义的功能。这不是关键问题,在开发过程中可以安全地忽略它。

根据IDE的不同,安装类型注释可以解决该问题(例如,请参见zero323 / pyspark-
stubs#172
)。



 类似资料:
  • 要查找函数在Laravel应用程序中的定义位置,我尝试执行以下操作: 在命名空间内: 但是得到一个错误: PHP错误:在/var/www/html/s/source/App/Http/Controllers/HomeController中找不到类“App\Http\Controllers\ReflectionFunction”。第169行的php 我甚至尝试使用全局命名空间: Reflection

  • 我试图将JNA与来自SiLabs(siusbxp.dll)的USBXPRESS库一起使用,虽然基本函数工作正常,但SI_GetDeviceProductString函数存在问题。 当我尝试运行它时,我得到以下错误: 所以问题是由别的东西引起的,但它仍然存在。

  • 我为我的文本分析项目运行lucene库(我对java相对较新)。主功能(或命令)有问题。 我使用的lucene版本是3.0.0,已经编译成JAR文件。JAR文件与主类文件Indexer.java位于同一文件夹中。 我首先运行编译代码: 它工作正常,创建了索引器。类文件位于同一目录中。 然后我运行同样的命令: 这次命令行输出说我没有主类Indexer: 我检查了原始的java代码,其中定义了main

  • 问题内容: 我对新的Bootstrap中的网格系统感到困惑,尤其是这些类: (其中*代表一些数字)。 任何人都可以解释以下内容: __这个数字 如何 对齐网格? 如何 使用这些数字? 什么 他们实际上代表什么呢? 问题答案: 仅适用于Bootstrap 3。 忽略字母(X 小号 , SM , MD , LG ) 现在 ,我只用数字开始… 数字(1-12)代表任何div总宽度的一部分 所有div分为