我正在建立一个机器学习模型,其中一些列是物理地址(我可以将其转换为X / Y坐标),但我对ML算法如何处理这一点有点困惑。有没有一种特定的方法可以将地理位置转换成列,以便用于ML(分类和/或回归)中?
提前感谢!
这总结了我们在问题评论中最终得到的答案:
这种从邮政编码到地理坐标的转换不应被视为一种“分割”,而只是一种以多维方式表示数据的方式(在这种情况下,维度将为2)。一维数据和多维数据都有机器学习算法。这两个维度可以相关,也可以不相关,这取决于您如何定义随后选择的模型的参数。
此外,在大多数情况下,相关性不必明确设置。只有初始值可能是有用的,但许多算法也依赖于随机初始化或其他简单的方法,从数据的子集中估计它。因此,为了清晰起见,如果您通过高斯对数据建模,例如,在估计该高斯的参数时,协方差矩阵将具有非对角项,这些项是非零,这将代表数据相关性。您只需要不要假设这两个维度是不相关的!
通常,特征的选择取决于您预期特征与目标变量之间的关系类型。您说得对,邮政编码本身与目标没有任何关系。这里的邮政编码只是一个字符串或类别。您打算使用哪种模型?线性回归和决策树是两个例子。这些模型以不同的方式捕获关系。作为要素的示例,您可以计算源和目标之间的直线距离,并在模型中使用该距离,因为直观地,它们越远,传输时间可能就越长。运输时间还取决于什么?看看您是否可以以某种方式将影响旅行时间的因素与您拥有的信息(即邮政编码/XY坐标)联系起来。
机器学习无疑是当前数据分析领域的一个热点内容。很多人在平时的工作中都或多或少会用到机器学习的算法。
机器学习原理
问题内容: 关于如何生成地球上位置的随机坐标(纬度/经度)的任何聪明的想法?纬度/经度。精确到5分,避免水体。 也许我生活在一个梦幻世界中,水的话题是不可避免的……但是希望有一种更好,更清洁,更高效的方法来实现这一目标? 编辑 一些奇妙的答案/想法-但是,从规模上讲,我需要生成25,000个坐标。由于延迟,成本和其他一些因素,去外部服务提供商可能不是最好的选择。 问题答案: 处理水体问题将主要是一
功能介绍 地理编码指将结构化内容转换为经纬度坐标,逆地理编码指将经纬度坐标转换成结构化地址。使用该功能模块,可以快速批量把Excel文件内的大量地址转换为经纬度信息,或者实现反查。 当前功能模块使用高德接口。由于地理编码与逆地理编码需要使用高德API接口,而API接口日请求次数有限,公共API KEY无法满足大批量请求,使用自己申请的高德KEY可以解决该问题,因此需要申
功能介绍 地理编码指将结构化内容转换为经纬度坐标,逆地理编码指将经纬度坐标转换成结构化地址。使用该功能模块,可以快速批量把Excel文件内的大量地址转换为经纬度信息,或者实现反查。 当前功能模块使用高德接口。由于地理编码与逆地理编码需要使用高德API接口,而API接口日请求次数有限,公共API KEY无法满足大批量请求,使用自己申请的高德KEY可以解决该问题,因此需要申