当前位置: 首页 > 工具软件 > xlsx.js > 使用案例 >

js使用xlsx读取excel文件

呼延卓
2023-12-01

下载安装插件

npm install xlsx
or
yarn add xlsx

此时,在项目的node_modules文件夹和package.json文件中可以找到xlsx依赖。

文件基础

获取文件对象

我比较推荐使用h5的原生文件上传项

<input type="file" id="uploadExcel" multiple />

其中multiple属性允许上传多个文件,通过Ctrl按键来实现。

在选择文件的过程中,触发事件的流程是下面这样的:

  1. mousedown
  2. focus
  3. mouseup
  4. click
  5. blur
  6. focus
  7. change

首先触发的是鼠标按下事件,然后就是焦点到了input上面,然后鼠标抬起事件,触发click事件,失去焦点以后弹出文件选择框,选中文件以后触发焦点,最后触发change事件。

所以监听input的文件内容变更事件的话,我推荐用change事件去监听。

添加事件监听:

window.document.getElementdById("uploadExcel").addEventListener("change", function(e){
    let fileList = e.target.files;
})

其中,打印fileList信息,可以发现fileList是一个类数组,由传入的file对象组成。每个file对象包含一下属性:

lastModified

Number

表示最近一次的修改时间的时间戳

lastModeifiedDate

Object

表示最后一次修改时间的Date对象,可以在其中调用Date对象的有关方法。

name

文件上传时的文件名

size

文件的字节大小

type

String

文件的MIME类型

weblitRelativePath

当在input上添加webkitdirectory属性时,可选文件夹,此时weblitRelativePath表示文件夹中文件的相对路径。未加时为空

读取文件数据

首先创建一个FileReader实例:

let reader = new FileReader();

FileReader提供了如下方法:

readAsArrayBuffer(file)

将文件读取为ArrayBuffer对象

readAsDataURL(file)

将文件读取为DataURL,因此可以读取图片。

readAsText(file, encoding)

将文件读取为文本,第二个参数是文本的编码方式,默认为utf-8

abort()

终止文件读取操作

注:无论读取成功或失败,方法并不会返回读取结果,这一结果存储都在result属性中。

FileReader事件:

onabort

当读取操作被终止时调用

onerror

当读取操作发生错误时调用

onload

当读取操作成功完成时调用

onloaded

当读取操作完成时调用,无论成功或失败

onloadstart

当读取操作开始时调用

onprogress

在读取数据过程中周期性调用

我们使用readAsDataURL(file)来读取文件数据,并使用onload事件来输出读取成功后result中的数据:

reader.onload = function(e){
    let data = e.target.result;
};
reader.readAsDataURL(file);

读取Excel

通过xlsx获取workbook

读取excel主要是通过以下语句实现:

XLSX.read(data, { type: type });

返回一个叫WordBook的对象。

其中,这里type的类型要与处理文件时读的data一致,FileReader方法对应的type取值如下:

base64

以base64方法读取

binary

BinatyString格式(byte n is data.charCodeAt (n))

string

UTF-8编码的字符串

buffer

nodejs Buffer

array

Uint8Array,8位无符号数组

file

文件的路径(仅nodejs下支持)

所以,全部代码如下:

let wb;  // 读取完成的数据
let rABS = false; // 是否将文件读取为二进制字符串
document.getElementById("excel").addEventListener("change",function (e) {
  if(!e.target.files) return;
  var f = e.target.files[0];
  var reader = new FileReader();
  reader.onload = function(e) {
    var data = e.target.result;
      if(rABS) {
        wb = XLSX.read(btoa(fixdata(data)), {type: 'base64'});//手动转化
      } 
      else {
       wb = XLSX.read(data, {type: 'binary'});
      }
      //wb.SheetNames[0]是获取Sheets中第一个Sheet的名字
      //wb.Sheets[Sheet名]获取第一个Sheet的数据
    document.getElementById("demo").innerHTML= JSON.stringify( XLSX.utils.sheet_to_json(wb.Sheets[wb.SheetNames[0]]) );
  };
  if(rABS) {reader.readAsArrayBuffer(f);} 
  else {reader.readAsBinaryString(f);}
  });
      
function fixdata(data) { //文件流转BinaryString
  var o = "",
  l = 0,
  w = 10240;
  for(; l < data.byteLength / w; ++l) 
    o += String.fromCharCode.apply(null, new Uint8Array(data.slice(l * w, l * w + w)));
    o += String.fromCharCode.apply(null, new Uint8Array(data.slice(l * w)));
  return o;
}

WorkBook介绍

SheetNames保存了所有Sheet的名字

Sheets保存了每个Sheet的具体内容

Sheet Object

每个sheet Object表示一张表格,通过类似A1这样的键值保存每个单元格的内容。只要不是"!"开头的都表示普通的cell。特殊cell有:

sheet['!ref']

表示所有单元格的范围,例如A1到F8则记录为A1: F8

sheet[!merges]

存放单元格合并信息,是一个数组。每个数组由包含s和e构成的对象组成。s表示start,e表示end,r表示row,c表示col。

例如:

sheet1:{
    !merge: [
    {
        e: { c: 5, r: 0 },
      s: { c: 0, r: 0 }  // 表示A1到F1单元格合并
    },
    {
        e: { c: 5, r: 9 },
      s: { c: 0, r: 9 }  // 表示A10到F10单元格合并
    }
  ]
}

Cell Object

t

内容类型

s

String

n

Number

b

Boolean

d

Date

v

原始值

f

公式

如:B2 + B3

h

HTML内容

w

格式化后的内容

r

富文本内容

......

读取WorkBook

普通方法:

// 读取 excel文件
function outputWorkbook(workbook) {    
  var sheetNames = workbook.SheetNames; // 工作表名称集合
  sheetNames.forEach(name => {        
    var worksheet = Workbook.Sheets[name]; // 只能通过工作表名称来获取指定工作表
    for(var key in worksheet) {            // v是读取单元格的原始值
        console.log(key, key[0] === '!' ? worksheet[key] : worksheet[key].v);
    }
   });
}

根据!ref确定excel的范围,再根据!merges确定单元格合并,最后输出整个table。插件zi'shen已经写好工具类XLSX.utils给我们用:

sheet_to_html

转csv会忽略格式、单元格合并等信息

sheet_to_txt

sheet_to_csv

会保留单元格合并,但是生成的是HTML代码,不是<table>

sheet_to_json

sheet_to_formulae

导出Excel

生成sheet

aoa_to_sheet

将一个二维数组转成sheet

json_to_sheet

将由对象组成的数组转化成sheet

table_to_sheet

将table的dom直接转成sheet

sheet_add_aoa

将二维数组添加到现有工作表中

sheet_add_json

将js对象数组添加到现有工作表中

  • format_cell 生成单元格的文本值(使用数字格式)
  • encode_row / decode_row 在0索引行和1索引行之间转换
  • encode_col / decode_col 在0索引的列和列名之间转换
  • encode_cell / decode_cell 转换单元格地址
  • encode_range / decode_range 转换单元格范围
 类似资料: