npm install xlsx
or
yarn add xlsx
此时,在项目的node_modules文件夹和package.json文件中可以找到xlsx依赖。
我比较推荐使用h5的原生文件上传项
<input type="file" id="uploadExcel" multiple />
其中multiple
属性允许上传多个文件,通过Ctrl按键来实现。
在选择文件的过程中,触发事件的流程是下面这样的:
首先触发的是鼠标按下事件,然后就是焦点到了input上面,然后鼠标抬起事件,触发click事件,失去焦点以后弹出文件选择框,选中文件以后触发焦点,最后触发change事件。
所以监听input的文件内容变更事件的话,我推荐用change事件去监听。
添加事件监听:
window.document.getElementdById("uploadExcel").addEventListener("change", function(e){
let fileList = e.target.files;
})
其中,打印fileList信息,可以发现fileList是一个类数组,由传入的file对象组成。每个file对象包含一下属性:
lastModified | Number | 表示最近一次的修改时间的时间戳 |
lastModeifiedDate | Object | 表示最后一次修改时间的Date对象,可以在其中调用Date对象的有关方法。 |
name | 文件上传时的文件名 | |
size | 文件的字节大小 | |
type | String | 文件的MIME类型 |
weblitRelativePath | 当在input上添加webkitdirectory属性时,可选文件夹,此时weblitRelativePath表示文件夹中文件的相对路径。未加时为空 |
首先创建一个FileReader实例:
let reader = new FileReader();
FileReader提供了如下方法:
readAsArrayBuffer(file) | 将文件读取为ArrayBuffer对象 |
readAsDataURL(file) | 将文件读取为DataURL,因此可以读取图片。 |
readAsText(file, encoding) | 将文件读取为文本,第二个参数是文本的编码方式,默认为utf-8 |
abort() | 终止文件读取操作 |
注:无论读取成功或失败,方法并不会返回读取结果,这一结果存储都在result属性中。 |
FileReader事件:
onabort | 当读取操作被终止时调用 |
onerror | 当读取操作发生错误时调用 |
onload | 当读取操作成功完成时调用 |
onloaded | 当读取操作完成时调用,无论成功或失败 |
onloadstart | 当读取操作开始时调用 |
onprogress | 在读取数据过程中周期性调用 |
我们使用readAsDataURL(file)来读取文件数据,并使用onload事件来输出读取成功后result中的数据:
reader.onload = function(e){
let data = e.target.result;
};
reader.readAsDataURL(file);
读取excel主要是通过以下语句实现:
XLSX.read(data, { type: type });
返回一个叫WordBook的对象。
其中,这里type的类型要与处理文件时读的data一致,FileReader方法对应的type取值如下:
base64 | 以base64方法读取 |
binary | BinatyString格式(byte n is data.charCodeAt (n)) |
string | UTF-8编码的字符串 |
buffer | nodejs Buffer |
array | Uint8Array,8位无符号数组 |
file | 文件的路径(仅nodejs下支持) |
所以,全部代码如下:
let wb; // 读取完成的数据
let rABS = false; // 是否将文件读取为二进制字符串
document.getElementById("excel").addEventListener("change",function (e) {
if(!e.target.files) return;
var f = e.target.files[0];
var reader = new FileReader();
reader.onload = function(e) {
var data = e.target.result;
if(rABS) {
wb = XLSX.read(btoa(fixdata(data)), {type: 'base64'});//手动转化
}
else {
wb = XLSX.read(data, {type: 'binary'});
}
//wb.SheetNames[0]是获取Sheets中第一个Sheet的名字
//wb.Sheets[Sheet名]获取第一个Sheet的数据
document.getElementById("demo").innerHTML= JSON.stringify( XLSX.utils.sheet_to_json(wb.Sheets[wb.SheetNames[0]]) );
};
if(rABS) {reader.readAsArrayBuffer(f);}
else {reader.readAsBinaryString(f);}
});
function fixdata(data) { //文件流转BinaryString
var o = "",
l = 0,
w = 10240;
for(; l < data.byteLength / w; ++l)
o += String.fromCharCode.apply(null, new Uint8Array(data.slice(l * w, l * w + w)));
o += String.fromCharCode.apply(null, new Uint8Array(data.slice(l * w)));
return o;
}
SheetNames保存了所有Sheet的名字
Sheets保存了每个Sheet的具体内容
Sheet Object
每个sheet Object表示一张表格,通过类似A1这样的键值保存每个单元格的内容。只要不是"!"开头的都表示普通的cell。特殊cell有:
sheet['!ref'] | 表示所有单元格的范围,例如A1到F8则记录为A1: F8 |
sheet[!merges] | 存放单元格合并信息,是一个数组。每个数组由包含s和e构成的对象组成。s表示start,e表示end,r表示row,c表示col。 |
例如:
sheet1:{
!merge: [
{
e: { c: 5, r: 0 },
s: { c: 0, r: 0 } // 表示A1到F1单元格合并
},
{
e: { c: 5, r: 9 },
s: { c: 0, r: 9 } // 表示A10到F10单元格合并
}
]
}
Cell Object
t | 内容类型 | s | String |
n | Number | ||
b | Boolean | ||
d | Date | ||
v | 原始值 | ||
f | 公式 | 如:B2 + B3 | |
h | HTML内容 | ||
w | 格式化后的内容 | ||
r | 富文本内容 | ||
...... |
普通方法:
// 读取 excel文件
function outputWorkbook(workbook) {
var sheetNames = workbook.SheetNames; // 工作表名称集合
sheetNames.forEach(name => {
var worksheet = Workbook.Sheets[name]; // 只能通过工作表名称来获取指定工作表
for(var key in worksheet) { // v是读取单元格的原始值
console.log(key, key[0] === '!' ? worksheet[key] : worksheet[key].v);
}
});
}
根据!ref确定excel的范围,再根据!merges确定单元格合并,最后输出整个table。插件zi'shen已经写好工具类XLSX.utils给我们用:
sheet_to_html | 转csv会忽略格式、单元格合并等信息 |
sheet_to_txt | |
sheet_to_csv | 会保留单元格合并,但是生成的是HTML代码,不是<table> |
sheet_to_json | |
sheet_to_formulae |
aoa_to_sheet | 将一个二维数组转成sheet |
json_to_sheet | 将由对象组成的数组转化成sheet |
table_to_sheet | 将table的dom直接转成sheet |
sheet_add_aoa | 将二维数组添加到现有工作表中 |
sheet_add_json | 将js对象数组添加到现有工作表中 |
format_cell
生成单元格的文本值(使用数字格式)encode_row / decode_row
在0索引行和1索引行之间转换encode_col / decode_col
在0索引的列和列名之间转换encode_cell / decode_cell
转换单元格地址encode_range / decode_range
转换单元格范围