背景说明
假设有一个分布式文件系统,现需要从该系统中并发下载一部分文件到本地机器。
已知该文件系统的部分节点ip, 以及需要下载的文件fileID列表,并能通过这些信息来拼接下载地址。
其中节点ip列表保存在xx_node.txt, 要下载的fileID保存在xx_fileID.txt中。
代码示例
package main import ( "bufio" "flag" "fmt" "io" "math/rand" "net/http" "os" "time" ) var ( clustername = flag.String("clustername", "c1", "download clustername") ) // 逐行读取文件内容 func ReadLines(fpath string) []string { fd, err := os.Open(fpath) if err != nil { panic(err) } defer fd.Close() var lines []string scanner := bufio.NewScanner(fd) for scanner.Scan() { lines = append(lines, scanner.Text()) } if err := scanner.Err(); err != nil { fmt.Fprintln(os.Stderr, err) } return lines } // 实现单个文件的下载 func Download(clustername string, node string, fileID string) string { nt := time.Now().Format("2006-01-02 15:04:05") fmt.Printf("[%s]To download %s\n", nt, fileID) url := fmt.Sprintf("http://%s/file/%s", node, fileID) fpath := fmt.Sprintf("/yourpath/download/%s_%s", clustername, fileID) newFile, err := os.Create(fpath) if err != nil { fmt.Println(err.Error()) return "process failed for " + fileID } defer newFile.Close() client := http.Client{Timeout: 900 * time.Second} resp, err := client.Get(url) defer resp.Body.Close() _, err = io.Copy(newFile, resp.Body) if err != nil { fmt.Println(err.Error()) } return fileID } func main() { flag.Parse() // 从文件中读取节点ip列表 nodelist := ReadLines(fmt.Sprintf("%s_node.txt", *clustername)) if len(nodelist) == 0 { return } // 从文件中读取待下载的文件ID列表 fileIDlist := ReadLines(fmt.Sprintf("%s_fileID.txt", *clustername)) if len(fileIDlist) == 0 { return } ch := make(chan string) // 每个goroutine处理一个文件的下载 r := rand.New(rand.NewSource(time.Now().UnixNano())) for _, fileID := range fileIDlist { node := nodelist[r.Intn(len(nodelist))] go func(node, fileID string) { ch <- Download(*clustername, node, fileID) }(node, fileID) } // 等待每个文件下载的完成,并检查超时 timeout := time.After(900 * time.Second) for idx := 0; idx < len(fileIDlist); idx++ { select { case res := <-ch: nt := time.Now().Format("2006-01-02 15:04:05") fmt.Printf("[%s]Finish download %s\n", nt, res) case <-timeout: fmt.Println("Timeout...") break } } }
小结
下载时没有用到默认的http Client, 并指定了超时时间;
下载文件时调用了系统调用, goroutine会被挂起;
下载文件完成后会唤醒被挂起的goroutine, 该goroutine执行完后面的代码后便退出;
全局超时控制,超时后主线程退出。
以上这篇golang并发下载多个文件的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持小牛知识库。
问题内容: 是否可以使用goroutine并行下载和保存文件? 以下是我的代码,可从我的保管箱下载文件: 当我在命令前给download_file函数添加前缀时,它不起作用。 问题答案: 那是因为您的主要goroutine正在退出。您需要添加一个WaitGroup以等待所有goroutines退出。例如,
我们有一个客户机-服务器架构,使用Google Drive在客户机和服务器之间共享文件,而不需要实际发送它们。 客户机使用Google Drive API获取它希望与服务器共享的所有文件的文件ID列表。 服务器然后使用适当的授权令牌下载文件。 服务器响应时间对用户体验至关重要。
本文向大家介绍Python多线程下载文件的方法,包括了Python多线程下载文件的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python多线程下载文件的方法。分享给大家供大家参考。具体实现方法如下: 希望本文所述对大家的Python程序设计有所帮助。
问题内容: 我目前有2个命令按钮和一个列表框。根据列表框的选择,生成的结果可以显示在可下载的文件中或呈现为HTML表。该代码基于BalusC的PDF Handling教程 ,而set 。 到目前为止,两个按钮都可以正常工作。但是,我想将两个动作组合为一个按钮。当我用一个可以触发两个动作的按钮进行测试时,什么也没发生(没有文件另存为对话框或表)。这是因为一个动作是ajax还是另一个动作以ajax结尾
问题内容: 我目前有2个命令按钮和一个列表框。根据列表框的选择,生成的结果可以显示在可下载的文件中或呈现为HTML表。该代码基于BalusC的PDF处理教程,而set 。 到目前为止,两个按钮都可以正常工作。但是,我想将两个动作组合为一个按钮。当我使用触发两个动作的按钮进行测试时,什么也没发生(没有文件另存为对话框或表)。这是因为一个动作是ajax还是另一个动作以ajax结尾? 另外,我想要一个复
我能够使用canmel路由定义中的以下uri从sftp目录成功下载一个/所有文件: 下载所有文件 下载一个文件 我的要求是下载特定的文件列表= one.text,two.text。 如何将文件名列表传递到骆驼路由?最好是我正在寻找一个解决方案,我可以在其中指定如下内容