当前位置: 首页 > 知识库问答 >
问题:

核密度误差

国阳
2023-03-14
data = sc.parallelize([0, 1, 2, 2, 1, 1, 1, 1, 1, 2, 0, 0])
kd = KernelDensity()
kd.setSample(data)
kd.setBandwidth(3)
densities = kd.estimate([-1.0, 2.0, 5.0])

/home/user10215193/anaconda3/lib/python3.6/site-packages/pyspark/mllib/common.py in callMLlibFunc(name,*args)129 api=getattr(sc._jvm.pythonmllibapi(),name)130 print(api)-->131 return callJavaFunc(sc,api,*args)132 133

/home/user10215193/anaconda3/lib/python3.6/site-packages/pyspark/mllib/common.py in callJavaFunc(sc,func,*args)121“”调用Java函数“122 args=[_py2java(sc,a)for a in args]-->123 return_java2py(sc,func(*args))124 125

/home/user10215193/anaconda3/lib/python3.6/site-packages/py4j/java_gateway.py in call(self,*args)1131 answer=self.gateway_client.send_command(command)1132 return_value=get_return_value(->1133 answer,self.gateway_client,self.target_id,self.name)1134 1135 temp_args中的temp_arg:

/home/user10215193/anaconda3/lib/python3.6/site-packages/py4j/protocol.py中的get_return_value(应答,gateway_client,target_id,name)321引发Py4JError(322“调用{0}{1}{2}时发生错误。跟踪:\n{3}\n”.-->323格式(target_id,“.”,name,value))324其他:325引发Py4JError(

PY4JERROR:调用O19.EstimateKernelDensity时出错。跟踪:py4j.py4jException:Method EstimateKernelDensite([class org.apache.spark.api.java.java.lang.Integer,class java.util.ArrayList])在py4j.reflection.reflectionEngine.getMethod(reflectionEngine.java:318)在py4j.reflection.reflectionEngine.java:326)在py4j.gateway.invoke(gatewayconnection.run(gatewayconnection.java:214)位于java.lang.thread.run(thread.java:748)

我在这里找不到任何类似的东西,所以如果有人能帮我做这个,我会非常感激的。

共有1个答案

方浩旷
2023-03-14

你必须小心类型:

  • 带宽必须浮动
  • 示例必须为rdd[float]

因此,将代码替换为:

kd.setSample(data.map(float))
kd.setBandwidth(3.0)
densities = kd.estimate([-1.0, 2.0, 5.0])
 类似资料:
  • 我试图创建一个后验概率图。我使用的代码是: 其中N2016是100.000个样本的后验概率。 我遇到的问题是,当我使用“密度”类型的图时,我得到了一些不可信的概率值,因为我的观察值是160。因此,在160之前,我应该得到一个0的概率。 调整为5的图形 我一直在玩调整参数,但这似乎不是答案,因为曲线一点也不平滑。 带调整的图=0.25 我还附加了直方图,以表明问题不在于数据: 直方图 有人知道如何获

  • 核密度分析用于计算点、线要素测量值在指定邻域范围内的单位密度。简单来说,它能直观的反映出离散测量值在连续区域内的分布情况。其结果是中间值大周边值小的光滑曲面,栅格值即为单位密度,在邻域边界处降为0。 密度分析可用于计算人口密度、建筑密度、获取犯罪情况报告、旅游区人口密度监测、连锁店经营情况分析等等。例如: 某街区分布了多栋高层公寓及住宅,已知每栋的入住人数,想要了解街区内各处的人口分布情况,即可使

  • 核密度估计(KDE)是一种估计连续随机变量的概率密度函数的方法。 它用于非参数分析。 在distplot中将hist标志设置为False将产生核密度估计图。 例子 (Example) import pandas as pd import seaborn as sb from matplotlib import pyplot as plt df = sb.load_dataset('iris') s

  • 1 理论分析   核密度估计是在概率论中用来估计未知的密度函数,属于非参数检验方法之一。假设我们有n个数$x{1},x{2},…,x_{n}$,要计算某个数X的概率密度有多大, 可以通过下面的核密度估计方法估计。   在上面的式子中,K为核密度函数,h为窗宽。核密度函数的原理比较简单,在我们知道某一事物的概率分布的情况下,如果某一个数在观察中出现了,我们可以认为这个数的概率密度很大,和这个数比较近

  • 问题内容: 我正在使用3DESC解密数据,但出现以下异常 我的代码: 打印上面使用的所有字节数组 问题答案: DES- EDE密码可与3个不同的子密钥一起使用,因此密钥大小应为24字节(3乘8字节)。如果您只想使用2个键(即在此模式下,第一个键==最后一个键),则只需复制键数组的前8个字节。

  • 一系列关于 Linux 内核和其内在机理的帖子,目的很简单 - 分享我对 Linux 内核内在机理的一点知识,帮助对 Linux 内核内在机理感兴趣的人,和其他低级话题。