当前位置: 首页 > 知识库问答 >
问题:

将Google云存储桶中的日志加载到BigQuery中

汲灿
2023-03-14

我的目标是使用BigQuery web界面将我的所有(GCS创建的)日志从Google Cloud Storage中获取到BigQuery中。由于日志每小时创建一次,所以我喜欢一次导入所有日志来进行分析。

因此,例如gs://logging-bucket/images.mysite.net_storage_2013_03_31_07_00_00_0001a_v0、gs://logging-bucket/images.mysite.net_storage_2013_03_31_07_00_0002a_v0等等。

当只获取一个文件时,我会出现以下错误:

错误:

 Line:1 / Column:1, Expected '{' found '"'
 Line:2 / Column:1, Expected '{' found '"' 
 Line:3 / Column:1, Expected '{' found '"'
 Line:4 / Column:1, Expected '{' found '"'
 Line:5 / Column:1, Expected '{' found '"'
 Line:6 / Column:1, Expected '{' found '"'
 Line:7 / Column:1, Expected '{' found '"'

我所做的是创建一个新的数据集,从gs://logging-bucket/images.mysite.net_storage_2013_03_31_07_00_00_0001a_v0中选择数据,然后添加这个模式http://storage.googleapis.com/pub/cloud_storage_usage_schema_v0.json并提交这个模式。

共有1个答案

乐正辰阳
2023-03-14

你能举一个排的例子吗?数据是json格式还是CSV格式?从这个错误来看,它听起来像是在试图导入JSON数据,但是JSON行不应该以“”开头--应该以“{”开头。这是CSV数据吗?如果是,应该将sourceFormat设置为CSV(或者让它为空),而不是newline_delimited_json。

 类似资料:
  • 我需要从Google Cloud Storage(GCS->Temp Table->Main table)中加载100个表到BigQuery。我创建了一个python进程,将数据加载到BigQuery中,并在AppEngine中进行调度。因为AppEngine最多有10min的超时时间。我已经在异步模式下提交了作业,并在稍后的时间点检查了作业状态。由于我有100个表,需要创建一个监控系统来检查作业

  • 我有一个要求,我需要上传文件到谷歌云存储(他拥有并完全维护它)桶。 这个谷歌云存储桶是由我的客户创建的。 我是谷歌云的新手,有亚马逊S3的经验。我在服务器上运行SSI,以将事务数据加载到平面文件。 我为谷歌云创建了一个示例帐户,并安装了谷歌SDK。我可以通过gsutil手动上传文件。 我的问题是 > 我应该如何建议我的客户共享凭据? 我如何连接到谷歌云存储与提供凭据独立? 如何通过以上两个步骤将文

  • 我打算将包含所有文件和目录的整个目录从一个谷歌云存储桶递归复制到另一个谷歌云存储桶。 从本地到Google云存储桶,以下代码运行良好: 如何在同一个项目中将目录从一个bucket递归复制到另一个bucket?

  • 我正试图从控制台/命令行将一个表从big query导出到google cloud storage。控制台作业运行了几分钟,并在没有任何错误代码的情况下出错,命令行作业在运行一段时间后也会出现以下错误: 提取操作中的BigQuery错误:错误处理作业“数据流-实验:BQJOB_R308FF0F73D1820A6_00000157F77E8AB9_1”:后端错误。作业中止。 上面给出了命令行的作业i

  • 那么,第一个问题:这些日志是否可用?如果是,我如何访问它们? 看起来应该可以通过: 但是使用,例如,下面的代码不起作用:

  • 我正在运行一个部署到Google App Engine的Node.js应用程序。我还使用了winston库和'StackDriver Logging winston Plugin'[@google-cloud/logging-Winston]。 “链接到温斯顿日志设置教程” “链接到将日志导出到谷歌存储桶的教程” 我通过创建一个接收器将stackdriver日志导出到Google存储桶。目前,所有