当前位置: 首页 > 文档资料 > Express 实战 >

2. Node.js 基础

优质
小牛编辑
120浏览
2023-12-01

在第 1 章中,我们简单的介绍了 Node.js。了解到它基于 JavaScript、天生异步、拥有大量的第三方类库。可能对于这些内容你还没有完全弄清。所以在这章中将会给出一个更简洁高效的介绍。

其中的内容包括:

  • Node 的安装

  • 如何使用第三方模块生态

  • 第三方模块的安装

  • 一些简单的使用示例

  • 开发过程中的一些建议和技巧

在此之前,我假设你已经掌握了 JavaScript 基础知识并且熟悉一些基本的命令行操作。另外,不要臆想通过这一章就全面掌握 Node。但是如果你有心的话,可以去阅读 Node.js 实战

安装Node

JavaScript 世界的一大特点就是它选择性非常丰富,Node 的安装也不例外。

可以在官方下载页面找到各种版本的源代码和安装包文件。建议你使用与自己操作系统对应的安装包进行安装。当然,你也可用使用 apt-get、Homebrew 等包管理器进行安装,如果你系统有的话。具体详见官方的包管理工具的安装指南

如果你使用的是 Mac 或者 Linux 的话,那么我极力推荐你使用 NVM 来安装。Window 系统上的对应程序是 NVMW。这些版本管理工具,让你可以在不同版本间进行自由切换。例如,你可以在尝试新版本的特性时,同时在系统中保留一份稳定版。另外,NVM 无需系统管理权限同时卸载也非常容易。而安装过程也只需在终端执行一行命令。

现在,请在你系统中安装好 Node。

运行你的第一个Node脚本

安装完成后,先动手写个 “Hello World” 来检验一些。在新建的 helloworld.js 中加入一下代码:

console.log("Hello, World!");

代码中主要就是使用 console.log 来打印字符串 “Hello,world!”,相信对于前端程序员来说并不会感到陌生。

这里,我们使用命令行来运行这段代码。如果一切正常的话,会出现如下输出:

模块的使用

在大多数编程语言中,我们都会对代码进行拆分,然后在使用的时候将这些文件引入其中。例如,C 和 C++ 中的 Include,Python 的 import ,Ruby 和 PHP 中的 require。而另外一下语言,如 C# 实战编译时完成跨文件引用的。

很长一段时间内,JavaScript 官方并不支持这一机制。所以,社区中有人就编写了 RequireJS 这种工具来解决依赖性导入的问题。但是,大多数时候还是通过 <script> 标签来进行文件导入。而Node 通过实现名为 CommonJS 的标准模块,完美的解决了文件导入问题。

在模块系统部分主要有三大主要内容:内置模块的引入,第三方模块引入,个人似有模块引入。下面,将会对这些内容逐一介绍。

引入内置模块

Node 已经内置了很多实用模块,例如,文件系统模块 fs,工具函数模块 util。

在 Node 编写的 web 应用中,最常见的任务当属 URL 解析了。浏览器通过特定的 URL 来请求服务器上对应的资源。例如,访问主页、访问关于页面 的网络请求。这些 URL 都以字符串的形式存在,我们需要对其进行解析然后获取更多的信息。这里我们通过对 URL 进行解析来介绍如何引入内置模块。

内置的 url 模块中暴露的方法不多,不过其中有一个 parse 函数非常有用。它能从 URL 字符串中提取到类似域名和路径等有益信息。

这里我们使用 require 来实现模块导入,该命令与之前提到的 Include、Import 的作用一致。通过将模块名作为参数,该命令就能成功的返回对应的模块。大多数情况下,该返回的对象是一个 object 对象,但有时也可能会是字符串、数字、或者函数。下面是引入改模块的示例代码:

var url = require("url");   
var parsedURL = url.parse("http://www.example.com/profile?name=barry");  

console.log(parsedURL.protocol);  // "http:"
console.log(parsedURL.host);      // "www.example.com"
console.log(parsedURL.query);     // "name=barry

在上面的代码中,通过 require("url") 返回一个模块对象,然后就可以像使用其他对象一样调用对象的方法。

如果将这段代码保存到 url-test.js 文件中,你可以使用 node url-test.js 运行代码。你将会看到,协议名,域名、查询条件。

绝大多数时候,我们在引入模块的时候会用一个同名的变量来接受返回的模块对象。例如,上面就使用 url 来介绍 require("url") 的返回值。

当然,你完全可以不遵循上面的规则。如果你想的话,你也可以这么干:

var theURLModule = require("url");   
var parsedURL = theURLModule.parse("http://www.example.com/profile?name=barry");

保存变量名和模块名一致只是一个统一风格增加可读性的宽松约定,而不是什么强制规范。

使用 npm 和 package.json 引入第三方模块

Node 的内置模块远远不能满足日常开发需要。所以引入第三方模块是一个必须要掌握的技能。其实,本书实际上就是一本关于第三方模块的书。

首先,我们需要了解 package.json 文件。所有的 Node 项目都单独存放在一个文件夹中,而项目如果使用了第三方模块,那么其中必定存在一个名为 package.json 的文件。

package.json 中的内容非常的简单,一般其中定义了项目名称、版本号、作者,已经项目的外部依赖项。

在新建的 Node 工程文件夹中,将下面的内容复制到 package.json 中:

{
  "name": "my-fun-project",   
  "author": "Evan Hahn",      
  "private": true,            
  "version": "0.2.0",         
  "dependencies": {}          
}

文件定义好之后,我们就可以直接使用了。

其实,在进行 Node 安装时实际上还安装了另一个程序:npm 。通常 npm 都被称为 Node 包管理器,而这也是它最大的特色。

假设,现在需要在应用中导入一个小型的标准模版系统 Mustache。它能将模版字符串转化为真正的字符串,请看代码:

// Returns "Hello, Nicholas Cage!"
Mustache.render("Hello, {{first}} {{last}}!", {
  first: "Nicholas",
  last: "Cage"
});

// Returns "Hello, Sheryl Sandberg!"
Mustache.render("Hello, {{first}} {{last}}!", {
  first: "Sheryl",
  last: "Sandberg"
});

现在,假设你想通过 Mustache 模块来编写一个简单的 Node 应用来欢迎 Nicolas Cage。

首先,在工程文件夹的根目录里运行 npm install mustache --save。该命令会新建一个 *node_modules* 文件夹并将 Mustache 保存到文件夹下。 --save 参数将会把该模块添加到 pakage.json 文件中。此时 pakage.json 文件夹大致如下,其中 Mustache 会使用最新的版本。

{
  "name": "my-fun-project",
  "author": "Evan Hahn",
  "private": true,
  "version": "0.2.0",
  "dependencies": {
    "mustache": "^2.0.0"  #A
  }
}

如果你没有使用 --save 选项的话,虽然也会创建 node_modules 文件夹将把 Mustache 模块保存到同名子目录下,但是 pakage.json 将不会发生任何变化。这里之所以将这些依赖关系保存到 package.json 是为了方便其他开发者在得到工程后直接使用 npm install 完成所有依赖项的安装。另一个原因是 Node 项目在进行代码管理时通常都会忽略 node_modules 文件夹而只保留 package.json。

安装完成后接下来就是使用了:

var Mustache = require("mustache");  
var result = Mustache.render("Hi, {{first}} {{last}}!", {
  first: "Nicolas",
  last: "Cage"
});
console.log(result);

保存代码到 mustache-test.js 中并执行 node mustache-test.js 命令。然后你将会看见 Hi,Nicolas Cage! 。

就是这样简单,这些依赖项安装完成后,你可以像使用内置模块一样进行调用。node_modules 中模块引入的工作直接交给 Node 就行了,你无需担心。

当然你可以手动添加工程依赖项,并且你还可以指定依赖项的版本。

npm init

除了安装依赖项之外,npm 还能完成其他任务。例如,自动生成 package.json 而不是通过手动编辑的方式。在一个新工程的文件夹中可以通过 *npm init* 来配置工程名、作者、版本等信息,然后 npm 就会自定生成对应的 package.json 文件。这种自动化过程可以节约开发者的时间。

开发自己的模块

前面都是介绍如何使用他人开发好的模块,接下来你将会学到如何去开发一个自己的模块。假设现在随机返回 0 ~ 100 之间的整数。在不引入其他模块的情况下,代码大致如下:

var MAX = 100;
function randomInteger()  {
    return Math.floor( (Math.random() * MAX) );
}

这可能与你在浏览器环境下代码差不多,并没有什么特别之处。但是在 Node 中,我们还需要暴露一个变量给外部使用。这样当其他程序在通过 require 进行引入的时候就能获得该变量。在此例中,我们暴露函数 randomInteger 并将代码保存到 random-integer.js 文件中。

var MAX = 100;
function randomInteger()  {
    return Math.floor( (Math.random() * MAX) );
}

module.exports = randomInteger;

最后一行代码对于 Node 初学者来说可能感觉有点陌生。每个模块只能暴露一个变量,而且必须通过 module.exports 设置。本例中只暴露了一个函数变量,所以 MAX 就作为模块私有变量无法被其他文件所访问。

module.exports 可以暴露任何变量,虽然本例中是一个函数,但是通常都会是一个对象。当然,你可以暴露字符串或者数组。

接下来我们就来使用一下这个新模块。在 random-integer.js 同一目录下,新建一个 print-three-random-integers.js 并复制下面的代码:

var randomInt = require("./random-integer");  #A
console.log(randomInt());  // 12
console.log(randomInt());  // 77
console.log(randomInt());  // 8

除了需要通过点语法指定相对路径之外,其余部分与前面几乎一摸一样。通过 node print-three-random-integers.js 命令,我们可以检查程序的运行效果。不出意外的话,将会有三个 0 ~ 100 之间的随机数会被打印出来。

如果你尝试运行 node random-integer.js 的话,你还发现并没有任何事情发生。虽然,我们暴露了模块中的函数,但是改函数并不会执行更不会打印任何输出。

注意,这里只涉及了私有模块在工程中的使用。如果你希望将自己的模块发布出去供其他人使用的话,可以去我的个人站点查看相关内容。

以上部分就是 Node 模块系统的简单入门。

Node:异步的世界

在第一章中,我用 “烤松饼” 的例子简单的介绍了 Node 中的异步特性。其中的关键点就是,你无法同时做两件事哪怕它们是同时发生的。虽然,在烘焙过程中我可以健身,但是,烤箱毕竟不是我而是个外部事物。

Node 的异步工作原理与此类似,例如,你通过浏览器请求 Node 服务器上的一张小猫图片。因为该图片资源太大,所以在进行磁盘读写的时候你可以抽身去处理其他事情。此时,这个磁盘就相当于一个外部资源,我们可以直接处理第二个请求而无需挂起等待费时操作结束。

Express 中主要有两个外部资源:

  1. 涉及文件系统。例如,磁盘文件的读写。
  2. 涉及网络处理。例如,接受请求、发送响应。

在 Node 代码中,这些异步都是通过回调进行处理的。其工作原理和在 web 页面发送 AJAX 请求一样。在发送请求时你会附带一个回调函数,当请求处理完成后你的回调将会被执行。

例如,现在你正在硬盘上读取文件 myfile.txt 。当读取结束后,你希望能够打印出其中字母 X 出现的次数,代码如下:

var fs = require("fs");  

var options = { encoding: "utf-8" };                      
fs.readFile("myfile.txt", options, function(err, data) {  
  if (err) {                                
    console.error("Error reading file!");   
    return;                                 
  }                                        

  console.log(data.match(/x/gi).length + " letter X's");  
});

下面我们一步步解释这些代码:

首先,我们导入 Node 自带的文件系统模块。该模块主要处理文件相关内容,其中大多数都是文件读写功能。本例使用的其中的 readFile 方法。

接下来,我们需要设置 fs.readFile 方法中的参数,第一个是文件名,第二个就是会回调函数。并且在读取结束后执行回调函数。

在 Node 中大多数回调函数都会设置错误信息 error 作为第一个参数。如果一切正常,该参数将会被设为 null 。否则会将对应的错误信息保存到该参数中。这也是错误处理的最佳实践。有时候这些错误信息并不会导致程序终止执行,但是多数情形下需要对错误做出响应,抛出异常并跳出回调函数。

这也是 Node 中最常见的回调实践。

最后,当一切正常时我们使用正则表达式匹配字母 X 并打印其数量。

好的,下面我们来做个测试。这里,我们在上面代码的结束加上一段,那么会发生什么事情呢?

var fs = require("fs");  

var options = { encoding: "utf-8" };                      
fs.readFile("myfile.txt", options, function(err, data) {  
  if (err) {                                
    console.error("Error reading file!");   
    return;                                 
  }                                        

  console.log(data.match(/x/gi).length + " letter X's");  
});

console.log("Hello World!");

异步文件读取时异步操作,所以这里先打印出来的是 “Hello world!”,然后才是异步函数中的打印操作。

这就是异步模式强大的地方。当一个外部设备在处理费时操作时,你可以继续运行其他代码。在 web 应用中这意味着相同的时间可以处理更多的请求。

注意:如果你想了解更多 JavaScript 异步的内容的话,你可以去油管上查看这个视频。视频中的讲解同时适用于 Node 和浏览器环境。

用 Node 构建 web 服务:http 模块

上面的这个概念有助你更好地了解 Node 内置的 HTTP 模块,而该模块对于 Express 又极为重要。Node 和 Express 能够构建 web 服务都是基于这个模块中的功能。

Node 的 HTTP 模块有很多特性(比如,向其他服务器发送网络请求),不过我们将要使用的是其中一个名为 http.createServer 的方法。该方法通过其回调函数来处理每一次的网络请求,并且进行响应。下面代码中我们将所有的响应都设置为了 "hello world" (可以保存到 myserver.js 中)。

var http = require("http");           

function requestHandler(request, response) {             
  console.log("In comes a request to: " + request.url);  
  response.end("Hello, world!");                         
}                                                        

var server = http.createServer(requestHandler);  
server.listen(3000);

上面的代码由 4 个部分构成。

首先,我们引入 HTTP 模块并将其保存到变量 http 中。这与之前 URL 模块的操作一致。

接着,定义了一个请求处理函数 requestHandler 。本书中的几乎所有的代码要么是请求处理函数要么是调用处理函数。该函数有两个参数,request 表示请求对象,而 response 则表示响应对象。request 中包含 URL 路径、user-agent 等信息。而通过调用 response 对象方法 Node 会将响应信息打包好并发送给请求者。

余下的代码则是指定内置的 HTTP 服务在请求是执行的处理函数以及服务监听的端口号。

对于 HTTPS 来说,我们则可以使用自带的 HTTPS 模块。除了需要配置 SSL 证书,其余的过程都一样。如果你了解 HTTPS 的话那么后期从 HTTP 切换到 HTTPS 两分钟就能搞定。即使你不了解,也不必太过担心。

如果你将代码保存到 myserver.js 并执行 node myserver.js 拉起服务。那么,此时你在浏览器中访问 http://localhost:3000 ,你就会看到:

你可能也注意到了,每当你发起请求的时候终端控制台都会打印一些信息。当你尝试访问不同 URL 时,虽然控制台打印的信息不同但是得到的响应却都是 “Hello, world!”。控制台打印的信息类似于:

请注意上面打印的 URL 信息中并不包含 localhost:3000。虽然看起来显得不那么直观,但是反过来这也是对的。毕竟使用相对路径,我们无需修改就能在任何电脑上部署 Node 应用。

而 URL 解析的代码大致如下:

function requestHandler(req, res) {
    if (req.url === "/") {
        res.end("Welcome to the homepage!");
    } else if (req.url === "/about") {
        res.end("Welcome to the about page!");
    } else {
        res.end("Error! File not found.");
    }
}

所有的请求 URL 都可以在这个函数里面完成处理。这样做对于简单的应用来说确实非常简单,但是当应用规模变大之后该函数就会变的臃肿不利于维护。这也是 Express 框架出现的重要原因。

总结

本章的内容有:

  • Node 的安装

  • 模块系统的使用

  • package.json 文件的介绍

  • 通过 package.json 安装第三放模块依赖项

  • Node 中的异步编程概念。

  • 简单 HTTP 服务应用的创建。