问题：

如何在Hadoop中读取Azure Blob存储？

贺宝

2023-03-14

我有一个map-reduce作业，并且reducer获得一个驻留在Azure Blob存储中的文件的绝对地址，并且reducer应该打开它并读取它的内容。在配置Hadoop集群（HDInsight）时，我添加了包含文件的存储帐户。因此，还原器必须有权访问这个Blob存储，但Blob存储不是我的作业的默认HDFS存储。我的reducer中有以下代码，但它给了我一个FileNotFound错误消息。

FileSystem fs = FileSystem.get(new Configuration());
Path pt = new Path("wasb://mycontainer@accountname..."); 
FSDataInputStream stream = fs.open(pt);

共有1个答案

常雅达

2023-03-14

在https://azure.microsoft.com/en-us/documentation/articles/hdinsight-hadoop-use-blob-storage/#addressing中有介绍

语法为wasb:/mycontainer@myaccount.blob.core.windows.net/example/jars/hadoop-mapreduce-examples.jar

如果“MyContainer”是私有容器，则必须在提供过程中添加“MyAccount”azure存储帐户作为附加存储帐户。

类似资料：

如何在Intel hadoop中使用spark shell读取HDF？

我无法从spark shell（spark版本为1.2.1）读取HDFS（英特尔发行版hadoop，hadoop版本为1.0.3）。我使用mvn-Dhadoop命令构建了spark。version=1.0.3 clean package，启动spark shell并使用sc.textFile（）读取HDFS文件，异常为：警告hdfs。DFSClient：无法连接到/10.xx.xx.xx:500
如何在Android中读取存储文件？

我正在保存一个excel文件到设备（Android7）的存储，现在我想当用户点击按钮时打开excel文件，但现在当按钮点击应用程序会崩溃，而当im到我的存储和im打开文件直接在我的应用程序之外没有问题！！如果我的代码行错了，请帮忙，谢谢日志：Android.os.FileUriExposedException：file：///storage/emulated/0/MessangerApp/Mes
如何读取hadoop顺序文件？

问题内容：我有一个顺序文件，它是hadoop map- reduce作业的输出。在此文件中，数据以键值对的形式写入，而值本身是一个映射。我想将值读取为MAP对象，以便我可以进一步处理它。程序输出：关键是：[this is key]值是：{abc = 839177，xyz = 548498，lmn = 2，pqr = 1} 在这里，我以字符串的形式获取值，但我希望将其作为map的对象。问题答案
如何在hadoop mapreduce中跳过文件头的读取

我正在使用java学习hadoop mapreduce，我有一个示例文件，数据如下所示，我如何跳过处理这个文件中的标题行…因为当我看到映射器输入时，它也在考虑标题… 滚动noschool namenameageGenderclasssubjectmarks
hadoop reducer输出在reducer中迭代读取

我只是使用3机器集群测试单词计数示例。我的代码与此示例相同，但以下代码除外：
如何读取Azure存储密钥

我有一个Azure存储连接字符串，我想从中读取帐户名称和帐户密钥。我可以获取帐户名称，但不能获取密钥。有人能建议我如何读取密钥吗？ ConnectionString:DefaultEndpointsProtocol=https；AccountName=开发；AccountKey=TSDSGyduysaugdsay4ar6epn2ie9yoilep5rrfxeeaj9；EndpointSuffi

如何在Hadoop中读取Azure Blob存储？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档