Ruby操纵外部数据（二）

连坚白

2023-12-01

10 、重新取回与设置时间戳信息

每个磁盘文件都有多个时间戳与其关联( 尽管两个操作系统之间有些区别) 。Ruby 理解的三个时间戳是修改时间( 文件内容被最后修改的时间) ，访问时间( 文件最后被读取的时间) ，和更改时间( 文件的目录信息被更改的最后时间) 。

这三个信息部分可由三种不的方式访问。幸运的是，每种都返回同样的结果。
File 类方法mtime ，atime ，和ctime 将返回时间：
t1 = File.mtime("somefile")
# Thu Jan 04 09:03:10 GMT-6:00 2001
t2 = File.atime("somefile")
# Tue Jan 09 10:03:34 GMT-6:00 2001
t3 = File.ctime("somefile")
# Sun Nov 26 23:48:32 GMT-6:00 2000
如果发生一个File 的实例已经被创建，可以被使用实例方法是：
myfile = File.new("somefile")
t1 = myfile.mtime
t2 = myfile.atime
t3 = myfile.ctime
如果发生一个File::Stat 实例已经被创建，这些实例方法同样可使用：
myfile = File.new("somefile")
info = myfile.stat
t1 = info.mtime
t2 = info.atime
t3 = info.ctime

注意File::Stat被File的类方法(或实例方法)stat返回。类方法lstat(或同名的实例方法)是一样的，除了它报告本身的连接状态而不是跟随连接指向的实际文件。在指向连接的连接情况下，所有连接都会被跟踪而不是最后一个。

文件访问和修改时间可以使用utime 方法修改。它将修改一或多个指定文件的时间。时间即可以是Time 对象也可以是秒的数值。这儿是个例子：
today = Time.now
yesterday = today - 86400
File.utime(today, today, "alpha")
File.utime(today, yesterday, "beta", "gamma")
因为两个时间可以同时被修改，如果你想留下其中一个不修改，你必须首先保存它，像这样：
mtime = File.mtime("delta")
File.utime(Time.now, mtime, "delta")

11 、检查文件的存在和大小

一个基本的问题是，有时候我们想知道文件是否存在。FileTest 模块提供的exist? 方法可以找到：
flag = FileTest::exist?("LochNessMonster")
flag = FileTest::exists?("UFO")
# exists? is a synonym for exist?
直观上，这个方法不应该是File 的类方法，因为时间是被实例的对象，该文件已经打开；File 有一个类方法exist? ，但事实上它不做这件事。
与文件存在相关另一个问题是，它有多少内容。毕竟，存在文件可能有零长度。
如果我们对这个yes/no 问题感兴趣，File::Stat 有两个实例方法很有用。方法zero? 将返回true 如果文件是零长度的话；否则它返回false ：
flag = File.new("somefile").stat.zero?
相反地，如果文件是非零长度方法size? 将以字节形式返回文件的大小，如果文件是零长度返回值为nil 。它返回nil 而不是0 有时很不明显。回答是这是有意安排的，因为Ruby 中0 就是true ，反之，nil 才是false 。这儿个例子：
if File.new("myfile").stat.size?

puts "The file has contents."
else

puts "The file is empty."
end
方法zero? 和size? 也出现在FileTest 模块内：
flag1 = FileTest::zero?("file1")
flag2 = FileTest::size?("file2")
这自然引出这样问题，这个文件多大？我们已经看到非空文件的情况，size? 将返回长度，但如果我们不使用它，nil 值会让我们糊涂。
File 为有个类方法( 不是实例方法) 可以给我们答案。同名的实例方法是从IO 类继承来的，File::Stat 有个相应的实例方法：
size1 = File.size("file1")
size2 = File.stat("file2").size
如果我们想按块而不字节知道文件的大小，我们可以使用File::Stat 内的实例方法blocks 。它依赖于操作系统。这儿个例子：
info = File.stat("somefile")
total_bytes = info.blocks * info.blksize

12 、检查文件的属性

我们测试的文件有很多方面。我们总结一下相关的内建方法。大多数，不是全部，是个断言。
通过这一节我们要记住两个事实( 这一章的大部分) 。首先，因为File 混插了FileTest ，任何测试即可以调用模块的名字的方法也可以调用文件对象的实例方法。其次，记住此处FileTest 模块与由stat( 或lstat) 方法返回的File::Stat 对象高度交替重叠。在有些情况下，三种不同方式的调用实质上是同一方法。我们不必每次都显示出来。
一些操作系统有块传输设备及相反的字符传输设备的概念。文件可以引用任一种，但不可是两者。FileTest 模块内的方法blockdev? 和chardev? 将测试这个：
flag1 = FileTest::chardev?("/dev/hdisk0")
# false
flag2 = FileTest::blockdev?("/dev/hdisk0") # true
有时候，我们想知道流是否与终端连接。IO 类方法tty? 会进行测试(isatty 是它的别名) ：
flag1 = STDIN.tty?

# true
flag2 = File.new("diskfile").isatty
# false
流可以管道或者是套接字。FileTest 中相应的方法会测试这些情况：
flag1 = FileTest::pipe?(myfile)
flag2 = FileTest::socket?(myfile)
回忆一下目标实际上只是一个特殊的文件。所以我们需要有能力来区别目录和普通文件，FileTest 有一对方法可以做到。这儿是例子：
file1 = File.new("/tmp")
file2 = File.new("/tmp/myfile")
test1 = file1.directory?
# true
test2 = file1.file?
# false
test3 = file2.directory?
# false
test4 = file2.file?
# true
同样，File 类方法ftype 也可以告诉你一个流是什么类型的；也可以File::Stat 类中找到这个实例方法。这个方法返回一个字符串，它包含下列值：file, directory, blockSpecial, characterSpecial, fifo, link, 或 socket 。( 字符串fifo 引用到一个管道。) 这儿是个例子：
this_kind = File.ftype("/dev/hdisk0")
# "blockSpecial"
that_kind = File.new("/tmp").stat.ftype
# "directory"

某些特定的bit可以设置或清除文件的许可。这与我们在"Manipulating File Ownership and Permissions"节中讨论的其它bit是没有严格联系的。这些是set-group-id bit, set-user-id bit, 和sticky bit。每一个在FileTest内有相应方法，像这儿显示的：

file = File.new("somefile")
info = file.stat
sticky_flag = info.sticky?
setgid_flag = info.setgid?
setuid_flag = info.setuid?
磁盘文件可以有符号或者指向它的硬连接( 操作系统支持这些特征) 。要测试一个文件是否是指向一些其它文件的连接，使用FileTest 的symlink? 方法。它使用nlink 方法( 只有一个在File::Stat) 来计数与这个文件关联的连接数量。硬连接不能区分它来自哪个文件；事实上，它是普通文件的多个名字和目录的入口。这儿是个例子：
File.symlink("yourfile","myfile")
# Make a link
is_sym = FileTest::symlink?("myfile")
# true
hard_count = File.new("myfile").stat.nlink
# 0
附带提一下，这个例子中们使用File 类方法symlink 来创建一个符号连接。

在极少情况下，你可能希望获取文件的底层信息。File::Stat类有三个实例方法，它给你最祥细的细节。方法dev将给出一个整数来识别文件所处的设备；rdev将返回整数，以指出设备的种类；对于磁盘文件，ino将给你这个文件的标准"inode" 数字：

file = File.new("diskfile")
info = file.stat
device = info.dev
devtype = info.rdev
inode = info.ino

13 、用管道工作

Ruby 提供了多种方式来读和写管道。类方法IO.popen 将打开一个管道并连接进程的标准输入和标准输出到返回的IO 对象上。我们经常需要不同的线程处理每个管道的结束；这儿我们只显示了单线程的读和写：
check = IO.popen("spell","r+")
check.puts("'T was brillig, and the slithy toves")
check.puts("Did gyre and gimble in the wabe.")
check.close_write
list = check.readlines
list.collect! {
|x| x.chomp }
# list is now %w[brillig gimble gyre slithy toves wabe]
注意close_write 调用是必须的。如果它没结果，我们在读管道时将不能读文件结束行。
这儿是块形式：
File.popen("/usr/games/fortune") do |pipe|

quote = pipe.gets

puts quote

# On a clean disk, you can seek forever. - Thomas Steel
end
如果指定字符"-" ，一个新的Ruby 实例会被启动。如果这个带块，块做为两个分别的进程被运行就像一把叉子；被传递到块的孩子获得nil ，双亲获取与孩子连接的标准输入输出关联的IO 对象，像下面：
IO.popen("-") do |mypipe|

if mypipe

puts "I'm the parent: pid = #{ Process.pid} "

listen = mypipe.gets

puts listen

else

puts "I'm the child: pid = #{ Process.pid} "

end
end

# Prints:
#
I'm the parent: pid = 10580
#
I'm the child: pid = 10582
同样，pipe 方法返回一对联接到另一个尾部的管道。但是，我们创建一对线程一个传递消息给另一个：
pipe = IO.pipe
reader = pipe[0]
writer = pipe[1]

str = nil
thread1 = Thread.new(reader,writer) do |reader,writer|

# writer.close_write

str = reader.gets

reader.close
end

thread2 = Thread.new(reader,writer) do |reader,writer|

# reader.close_read

writer.puts("What hath God wrought?")

writer.close
end
thread1.join
thread2.join

puts str
# What hath God wrought?

14 、完成特定的I/O 操作

Ruby 中可以做低级的I/O 。我们只是提及一下些方法；如果你需要使用它们，应注意它们中的一些依赖于机器( 不同版本的Unix 之间都有变化) 。
ioctl 方法(I/O 控制) 将接受两个参数。第一个整数指出操作的类型。第二个即可是整数也可以是表示二进制数字的字符串。
fcntl 方法也是以系统依赖风格对文件导向流的低级控制。它接受同ioctl 一样的参数。
Kernel 模块内的select 方法将接受四个参数；第一个是读数组和timeout 值。在读数组内一个或多个设备输入有效时，或写数组内一个或多个设备被读入时，调用会返回有三个元素的数组，以表现分别用于读I/O 的设备的数组。
Kernel 模块内的方法syscall 至少接受一个整数参数( 全部参数是九个字符串和一个整数) 。第一个参数指出要完成的I/O 操作。
fileno 方法在一个I/O 流内返回一个旧式风格的文件描述符。提到的所有方法中它对系统的依赖是最小的。这儿是个例子：
desc = $stderr.fileno
# 2

15 、操作路径

操作路径时，首先要知道的是类方法File.dirname 和File.basename ；它们的工作与同名的Unix 命令一样，分别地返回目录名称和文件名，如果指定扩展名做为第二个参数给basename 方法，扩展名将被移除：
str = "/home/dave/podbay.rb"
dir = File.dirname(str)
# "/home/dave"
file1 = File.basename(str)
# "podbay.rb"
file2 = File.basename(str,".rb")
# "podbay"
注意尽管它们都是File 的方法，它们实际上也简单地用于字符串管理。
另一个相关的方法是File.split ，它返回的两元素数组有两个部分组成( 目录和文件名) ：

info = File.split(str)
# ["/home/dave","podbay.rb"]
expand_path 类方法将扩展一个相对路径，转换它为一个绝对路径。如果操作系统理解~ 和~user 这些，它们也将被扩展。这儿是个例子：
Dir.chdir("/home/poole/personal/docs")
abs = File.expand_path("../../misc")
# "/home/poole/misc"
给出一个打开的文件，path 实例方法将返回用于打开这个文件的路径名：
file = File.new("../../foobar")
name = file.path

# "../../foobar"
常量File::Separator 给出用于分割路径名成份的字符(Windows 是
，Unix 是/) 。别名是File::SEPARATOR 。
类方法join 使用这个分割符从目录列表中产生路径：
path = File.join("usr","local","bin","someprog")
# path is "usr/local/bin/someprog"
# Note that it doesn't put a separator on the front!
不要认为File.join 和File.split 是个相反的操作，它们不是。

16 、命令行级的文件管理

通常我们需要以命令行的风格来操作文件。也就是，我们需要复制，删除，重命名等等。大多数这些方法都是内建的；很小一部分由ftools 库添加进来。
要删除一个文件，我们可以使用File.delete 或它的别名File.unlink ，像这样：
File.delete("history")
File.unlink("toast")
要重命名一个文件，我们可以使用File.rename 。像这样：
File.rename("Ceylon","SriLanka") 文件连接( 硬和符号) 可以分别使用File.link 和File.symlink 来创建：
File.link("/etc/hosts","/etc/hostfile")
# hard link
File.symlink("/etc/hosts","/tmp/hosts")
# symbolic link

Ruby操纵外部数据（二）

相关阅读

相关文章

相关问答

相关文档