我下载并安装了VM Cloudera4.4来使用Hadoop。我已经在一个平台上为我的工作建立了一个集群,所以我对Hadoop的工作原理略有了解。所以我认为我的问题来自于我对linux和他的用户和群体的误解。
使用配置单元:
我尝试用shell创建一个配置单元表,它起作用了。我在/user/hive/warehouse/test中有一个表,它属于cloudera组的用户cloudera。
我在hdfs:/user/cloudera(user:cloudera和group:hive)中有一些数据文件(.txt),我用以下方法加载到配置单元表中:
LOAD DATA INPATH '/user/cloudera/*.txt' INTO TABLE test;
这是我得到的:
hive> LOAD DATA INPATH '/user/cloudera/jeuDeTest/*.txt' INTO TABLE test;
Loading data to table default.test
chgrp: changing ownership of '/user/hive/warehouse/test/_log24310.txt': User does not belong to hive
chgrp: changing ownership of '/user/hive/warehouse/test/_log24311.txt': User does not belong to hive
Table default.test stats: [num_partitions: 0, num_files: 2, num_rows: 0, total_size: 10161843, raw_data_size: 0]
OK
Time taken: 2.472 seconds
我从来没有这种错误消息,但文件被移动。如果我尝试选择*
,则没有结果。
使用HBase:
hbase org.apache.hadoop.hbase.mapreduce.ImportTsv
-Dimporttsv.columns=HBASE_ROW_KEY,cf:nl,ch:nt,cf:ti,cf:ip,cf:cr,cf:am,cf:op,cf:mr,cf:ct
'-Dimporttsv.separator=|' testhbase -Dimporttsv.skip.bad.lines=false
/user/cloudera/jeuDeTest/*.txt
ERROR security.UserGroupInformation: PriviledgedActionException as:hdfs (auth:SIMPLE)
cause:org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist:
hdfs://localhost.localdomain:8020/user/cloudera/jeuDeTest/_logGeneral_C_24310_SO.txt
Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist:
hdfs://localhost.localdomain:8020/user/cloudera/jeuDeTest/_logGeneral_C_24310_SO.txt
我尝试将我的cloudera用户添加到组配置单元。我在加载过程中没有错误,但我在选择时总是没有结果。
hive> LOAD DATA INPATH '/user/cloudera/jeuDeTest/*.txt' INTO TABLE test;
Loading data to table default.test
Table default.test stats: [num_partitions: 0, num_files: 10, num_rows: 0, total_size: 10161843, raw_data_size: 0]
OK
Time taken: 0.486 seconds
hive> select * from test limit 20;
OK
Time taken: 0.303 seconds
我在权限->chgrp:更改'/User/hive/warehouse/test/_log24310.txt'的所有权时遇到了相同的问题:用户不属于配置单元。
table_name
问题内容: 我需要实现用户组的用户权限(与Facebook组非常相似)。例如,每个组可以具有具有以下权限的成员:can_post,can_delete,can_ban等。当然,一个用户可以是多个组的成员,并且组可以具有许多具有不同权限的不同用户。我需要什么型号的功能? 问题答案: Django有一个内置的网上论坛系统。每当你有这样的问题时,我建议你搜索Django文档,该文档广泛,有用并且编写得很
Cloudera 的定位在于 Bringing Big Data to the Enterprise with Hadoop Cloudera为了让Hadoop的配置标准化,可以帮助企业安装,配置,运行hadoop以达到大规模企业数据的处理和分析。 既然是给企业使用,Cloudera的软件配置不是采用最新的hadoop 0.20,而是采用了Hadoop 0.18.3-12.cloudera.CH
Cloudera 发布实时查询开源项目 Impala (黑斑羚)!多款产品实测表明,比原来基于MapReduce的Hive SQL查询速度提升3~90倍。Impala是Google Dremel的模仿,但在SQL功能上青出于蓝胜于蓝。 Impala采用与Hive相同的元数据、SQL语法、ODBC驱动程序和用户接口(Hue Beeswax),这样在使用CDH产品时,批处理和实时查询的平台是统一的。目
使用Cloudera Manager时,我可以通过以下方式访问hdfs-site.xml文件: Cloudera Manager>Cluster>HDFS>Instances>(例如NameNode)>Processes COnfiguration Files>hdfs-site.xml 该文件是否可直接通过文件系统访问,如果是,它位于何处
主要内容:创建用户权限的步骤在本章中,我们将讨论关于项目中的用户权限。 创建用户权限的步骤 步骤(1): 登录到您的GitLab帐户,然后单击Settings选项卡下的 Members选项: 步骤(2): 它将打开下面的屏幕将成员添加到您的项目中: 步骤(3): 在“Choose a role permission” 部分下单击下拉列表时,您将看到不同类型的权限: 您可以参考添加用户章节用于设置用户权限并将用户添加到项目。
我创建了两个新用户和一个新角色。为模式A中的一个表的角色授予select权限,并将此角色分配给用户b。与此用户一起对架构a中的表发出select查询时,我遇到了“未找到表或视图”问题。 创建由READUSER1标识的用户READUSER1;创建由READUSER2标识的用户READUSER2; 创建由readonlyuser标识的角色只读用户; 将READUSER1.TESTA上的select授予