当前位置: 首页 > 面试题库 >

使用Python访问Hive数据

赵俊晤
2023-03-14
问题内容

我在HDFS中有一些数据,我需要使用python访问该数据,有人可以告诉我如何使用python从蜂巢访问数据吗?


问题答案:

您可以使用hive库从python访问hive,因为要从hive导入ThriveHive导入hive类

下面的例子

import sys

from hive import ThriftHive
from hive.ttypes import HiveServerException

from thrift import Thrift
from thrift.transport import TSocket
from thrift.transport import TTransport
from thrift.protocol import TBinaryProtocol

try:
  transport = TSocket.TSocket('localhost', 10000)
  transport = TTransport.TBufferedTransport(transport)
  protocol = TBinaryProtocol.TBinaryProtocol(transport)
  client = ThriftHive.Client(protocol)
  transport.open()
  client.execute("CREATE TABLE r(a STRING, b INT, c DOUBLE)")
  client.execute("LOAD TABLE LOCAL INPATH '/path' INTO TABLE r")
  client.execute("SELECT * FROM r")
  while (1):
    row = client.fetchOne()
    if (row == None):
       break
    print row

  client.execute("SELECT * FROM r")
  print client.fetchAll()
  transport.close()
except Thrift.TException, tx:
  print '%s' % (tx.message)


 类似资料:
  • 我正在尝试连接到配置为使用Kerberos进行身份验证的蜂巢元存储。当我不尝试使用keytab文件时,即当程序在身份验证过程中提示我输入密码时,这对我很有效。当我将配置更改为使用keytab时,我会收到一个长堆栈跟踪,其中包含以下语句: 有人能对我做错了什么提出建议吗? 如果相关的话,我的问题的背景是,我想从mapreduce作业访问配置单元元存储,当然,mapreduced作业无法响应提示。 我

  • 本文向大家介绍python使用MySQLdb访问mysql数据库的方法,包括了python使用MySQLdb访问mysql数据库的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了python使用MySQLdb访问mysql数据库的方法。分享给大家供大家参考。具体如下: 希望本文所述对大家的Python程序设计有所帮助。

  • 我是使用API的新手。我只想从API中获取数据并将其存储在数据库中。我知道python中有很多库/包可以从特定的API中提取数据(例如Google API:google-api-python-client)。那么有没有通用库可以从API中获取数据呢? 非常感谢。

  • 问题内容: 我是Hive,MapReduce和Hadoop的新手。我正在使用Putty连接到配置单元表并访问表中的记录。因此,我要做的是- 打开Putty并输入主机名-然后单击。然后我输入了用户名和密码,然后输入了一些命令来访问Hive sql。以下是我的工作清单 所以我的问题是 还有其他方法可以在任何Sql客户端(例如Sql Developer或Squirel SQL Client)中执行相同的

  • Kubenretes1.6中使用etcd V3版本的API,使用etcdctl直接ls的话只能看到/kube-centos一个路径。需要在命令前加上ETCDCTL_API=3这个环境变量才能看到kuberentes在etcd中保存的数据。 ETCDCTL_API=3 etcdctl get /registry/namespaces/default -w=json|python -m json.to

  • 问题内容: 我敢肯定,这已经在某个地方得到了回答,因为这是一个非常基本的问题-但是,对于我的一生,我无法在网上找到答案。我觉得自己是个白痴,但是我不得不问,这是: 我正在编写一个python代码,该代码将生成域中所有页面地址的列表。这是使用selenium2完成的-当我尝试访问由selenium产生的所有链接的列表时,会发生我的问题。 这是我到目前为止的内容: 该变量不包含在页面上找到的链接- 而