当前位置: 首页 > 面试题库 >

使用Java获取页面的上次修改日期

史弘致
2023-03-14
问题内容

有什么标准的方法可以告诉您页面的最后修改时间?目前,我正在这样做:

URLConnection uCon = url.openConnection();
uCon.setConnectTimeout(5000);   // 5 seconds
String lastMod = uCon.getHeaderField("Last-Modified");
System.out.println("last mod: "+lastMod);

但是,看起来有些站点没有Last-Modified字段。

http://www.cbc.ca具有以下标头字段:

X-Origin-Server
Connection
Expires
null
Date
Server
Content-Type
Transfer-Encoding
Cache-Control

我可以解析页面以尝试获取其日期,但这似乎是一个很大的痛苦。标准是什么?

(如果可能的话,我想坚持使用URLConnection,因为那是我用来下载网页的方法)


问题答案:

没有标准。动态生成的网页通常没有“ Last-
Modified”字段,并且不同的网页以不同的方式包含日期。某些站点甚至不包含这样的日期,在底部包括“©<当前年份>”。您可以尝试在底部或顶部附近寻找一个日期,但是要
可靠地 从网页中提取日期必须是特定于站点的。



 类似资料:
  • 我正在开发一个应用程序,它将在Dropbox上获取文件的最后修改时间和日期,也将在本地计算机上获取文件的最后修改日期(上载时间)和时间,然后在对时间和日期进行比较后,应用程序将决定是上载该文件还是从Dropbox下载该文件。现在我被这个问题困住了,我怎样才能得到最后修改的日期

  • 我有一个Azure Blob存储安装到我的Database ricks hdfs。有没有办法在数据库中获取Blob的最后修改日期? 这就是我阅读blob内容的方式:

  • 我有一个用例,在这个用例中,我以编程方式启动一个EC2实例,从S3复制一个可执行文件,运行它并关闭实例(在用户数据中完成)。我只需要从S3获取最后添加的文件。 有没有办法使用AWS CLI工具从S3存储桶中获取上次修改的文件/对象?

  • 问题内容: 想知道目录的上次修改日期何时更改。我修改了特定目录中的文件(通过FTP),但目录的LMD不变。应该如何运作? 问题答案: 当添加,删除或重命名文件或子目录时,目录本身上的mtime(修改时间)会更改。 修改目录中文件的内容不会更改目录本身,也不会更新文件或子目录的修改时间。如果更改目录的权限,则ctime会更改,而mtime不会。

  • 我需要获取Azure Databricks下DBFS装载点(ADLS Gen1)中所有文件夹和文件的最后修改日期。文件夹结构如下: 使用以下Python代码获取最后修改日期: 从上面的代码中,我得到了所有包含文件的文件夹的正确修改日期。 但对于空文件夹,它会给出当前日期。不是上次修改日期。 然而,当我硬编码空文件夹的路径时,它会给出正确的修改日期: 打印(datetime.fromtimestam

  • 问题内容: 我的一位同事说,SQL Server将最后修改的日期和时间保存在每条记录的“隐藏列”中。我很确定他说错了。你能向我确认一下吗? 问题答案: 正如其他人所暗示的那样,您的同事一定在胡说八道,或者指的是其他东西。为此,记录或页面的磁盘结构不包含对上次更新时间的任何引用。虽然可以在对象级别找到有关上次更新的信息,但在记录/行级别上找不到此类信息。