场景:对于经常需要导入Excel模板或数据来解析后加以应用的,使用频率非常之高,做了一个比较稳定的版本,体现在这些地方
工具:org.apache.poi
使用前必须了解这些:
1、要解析,那肯定先判断是不是Excel
2、xls后缀的Excel,是03版及以前的用HSSFWorkbook类
xlsx后缀的Excel,是07版及以后的用XSSFWorkbook解析
3、getWorkbook这个方法是我自己乱造各种Excel数据不断测试搜索修正得出的结果,其他的像简单的判断后缀xls还是xlsx来决定用HSSH还是XSSF是不保险的,比如你可能没遇过org.apache.poi.openxml4j.exceptions.InvalidFormatException这样的异常,当然这个异常仍然是因为Excel类型导致获取workbook时出错,然而我查到的结果是,Excel最底层是xml实现的,类型问题出在这儿,看异常的描述也可以稍微看出来openxml4j.exceptions
4 、可能出现空行,空的单元格,或者单元格值为空的情况,这些情况,在我的readExcel()方法里都考虑到了,为什么我不用迭代器,或者加强的for each循环?就是因为这些坑爹的空单元格或者空行啊,迭代器内部在取cell单元格对象时跳过这些空的对象,who knows why?我也不知道,反正我测试过,跳过去了,本来5个单元格,一个空的,结果就只得到4个数据,即使用cell.isEmpty()和cell!=null来判断,也没卵用,因为遍历的时候直接跳过去了,都没有判断的机会
5、取单元格数据,这个就比较简单了,判断单元格类型,根据类型做相应的处理取出来,但是我觉得我这个getCellValue()的方法应该有漏洞,先这么用着
下面上代码,简单描述下关键部位
import java.io.File; import java.io.FileInputStream; import java.io.FileNotFoundException; import java.io.IOException; import java.io.InputStream; import java.io.PushbackInputStream; import java.util.ArrayList; import java.util.HashMap; import java.util.Map; import java.util.List; import org.apache.poi.POIXMLDocument; import org.apache.poi.openxml4j.exceptions.InvalidFormatException; import org.apache.poi.openxml4j.opc.OPCPackage; import org.apache.poi.poifs.filesystem.POIFSFileSystem; import org.apache.poi.ss.usermodel.Cell; import org.apache.poi.ss.usermodel.Row; import org.apache.poi.ss.usermodel.Sheet; import org.apache.poi.ss.usermodel.Workbook; import org.apache.poi.xssf.usermodel.XSSFWorkbook; import org.apache.poi.hssf.usermodel.HSSFCell; import org.apache.poi.hssf.usermodel.HSSFWorkbook; import org.apache.xmlbeans.impl.piccolo.io.FileFormatException; /** *yanbiao 2016.10.25 */ public class ExcelUtil { private static final String EXTENSION_XLS = "xls"; private static final String EXTENSION_XLSX = "xlsx"; /** * 文件检查 */ private void preReadCheck(String filePath) throws FileNotFoundException, FileFormatException { File file = new File(filePath); if (!file.exists()) { throw new FileNotFoundException("导入的文件不存在:" + filePath); } if (!(filePath.endsWith(EXTENSION_XLS) || filePath.endsWith(EXTENSION_XLSX))) { throw new FileFormatException("传入的文件不是excel"); } } /** * 取得WorkBook对象 * xls:HSSFWorkbook,03版 * xlsx:XSSFWorkbook,07版 */ private Workbook getWorkbook(String filePath) throws IOException, InvalidFormatException { //直接判断后缀来返回相应的Workbook对象多数情况没问题,但是这个更保险,第3条已经说明 Workbook wb = null; InputStream is = new FileInputStream(filePath); if (!is.markSupported()) { is = new PushbackInputStream(is, 8); } if (POIFSFileSystem.hasPOIFSHeader(is)) { return new HSSFWorkbook(is); } if (POIXMLDocument.hasOOXMLHeader(is)) { return new XSSFWorkbook(OPCPackage.open(is)); } throw new IllegalArgumentException("您的excel版本目前不支持poi解析"); } /** * 读取excel文件内容 */ public Map<Integer, List<String>> readExcel(String filePath) throws FileNotFoundException, FileFormatException { // 检查和获取workbook对象 this.preReadCheck(filePath); Workbook wb = null; Map<Integer,List<String>> map = new HashMap<Integer, List<String>>(); try { wb = this.getWorkbook(filePath); // 默认只读取第一个sheet Sheet sheet = wb.getSheetAt(0); int rowcount = sheet.getLastRowNum();//逻辑行,包括空行 int cellcount = sheet.getRow(0).getLastCellNum();//第一行(将来作为字段的行)有多少个单元格 for (int i=0;i<rowcount;i++) { //这里用最原始的for循环来保证每行都会被读取 List<String> list = new ArrayList<String>(); Row row = sheet.getRow(i); if(null!=row){ for (int j=0;j<cellcount;j++) { list.add(getCellValue(row.getCell(j))); //这里也是用for循环,用Cell c:row这样的遍历,空单元格就被抛弃了 } System.out.println("第"+(row.getRowNum()+1)+"行数据:"+list.toString()); map.put(row.getRowNum(), list); }else{ for (int j=0;j<cellcount;j++) { list.add("无数据"); } System.out.println("第"+(i+1)+"行数据:"+list.toString()); map.put(i, list); } } } catch (Exception e) { System.out.println("读取Excel异常:"+e.getMessage()); e.printStackTrace(); } finally { if (wb != null) { try { wb.close(); } catch (IOException e) { e.printStackTrace(); } } } return map; } /** * 取单元格的值 */ private String getCellValue(Cell c) { if (c == null) { return "无数据"; } String value = ""; switch (c.getCellType()){ case HSSFCell.CELL_TYPE_NUMERIC://数字 value = c.getNumericCellValue()+""; break; case HSSFCell.CELL_TYPE_STRING://字符串 value = c.getStringCellValue(); break; case HSSFCell.CELL_TYPE_BOOLEAN://boolean value = c.getBooleanCellValue()+""; break; case HSSFCell.CELL_TYPE_FORMULA://公式 value = c.getCellFormula()+""; break; case HSSFCell.CELL_TYPE_BLANK://空值 value= "无数据"; break; case HSSFCell.CELL_TYPE_ERROR: value = "非法字符"; break; default: value= "未知类型"; break; } return value; } }
以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持小牛知识库。
我有一个带有sheet1 excel文件,该文件的第2行和第10列有一个我需要读取的值。这是我的代码。 获取了cell对象Excel.Range后,我不知道如何读取该单元格的内容。我试着把它转换成数组并在它上面循环,我试着转换成字符串数组等等,我确信这是非常简单的。有没有直接的方法只得到一个字符串的单元格值?
本文向大家介绍PHPExcel简单读取excel文件示例,包括了PHPExcel简单读取excel文件示例的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了PHPExcel简单读取excel文件的方法。分享给大家供大家参考,具体如下: PHP Excel 2007 classes Project providing a set of classes for the PHP programmi
Java 中如何按列读取 Excel 数据 我有一个excel文件,希望用java读取某个表单某列的值,以便做后续的操作。有推荐的方案吗?
问题内容: 我正在尝试在Java中阅读excel。我有以下代码。 我导入了poi.3.6jar和poi.ooxml-3.6 jar。当我运行该程序时,出现以下错误消息。 我不明白为什么会出现此错误消息。请帮助我。 问题答案: 将文件添加到您的类路径。
问题内容: 我想用3列N行从Java读写Excel文件,在每个单元格中打印一个字符串。谁能给我简单的代码片段吗?我是否需要使用任何外部库,或者Java是否内置支持? 我要执行以下操作: 问题答案: Apache POI可以为你做到这一点。特别是HSSF模块。该快速指南是最有用的。这是你想做什么的方法-专门创建一张纸并将其写出来。
我正在尝试easyMock测试几个类/接口方法。方法,试图捕获参数,但得到一个或另一个错误。如果我只记录了一个期望值,它甚至不会捕获参数管道中的任何内容,如果我使用以下方法,我会得到如下错误代码。 结果是错误的 testFireChannelInitializer(com.obolus.generic.impl.DefaultChannelListenerTest)运行时间:3.812秒 你知道怎
问题内容: 当我读取excel数字单元格值时,我得到带小数的输出。例如:79读数为79.0,0.00读数为0.0。我编写的应用程序代码是: 问题答案: Stack Overflow上经常出现这个问题,因此建议您仔细阅读许多类似的问题,以找到答案! Excel将文件格式中的几乎所有数字都存储为浮点值,这就是为什么POI会为您返回数字单元格的双精度数字,因为这就是真正的数字。如果希望它看起来像在Exc
介绍 读取Excel内容的封装,通过构造ExcelReader对象,指定被读取的Excel文件、流或工作簿,然后调用readXXX方法读取内容为指定格式。 使用 读取Excel中所有行和列,都用列表表示 ExcelReader reader = ExcelUtil.getReader("d:/aaa.xlsx"); List<List<Object>> readAll = reader.read(