当前位置: 首页 > 编程笔记 >

C#读取csv格式文件的方法

鲁涵映
2023-03-14
本文向大家介绍C#读取csv格式文件的方法,包括了C#读取csv格式文件的方法的使用技巧和注意事项,需要的朋友参考一下

本文实例讲述了C#读取csv格式文件的方法。分享给大家供大家参考。具体实现方法如下:

一、CSV文件规则
 
1 开头是不留空,以行为单位。
2 可含或不含列名,含列名则居文件第一行。
3 一行数据不跨行,无空行。
4 以半角逗号(即,)作分隔符,列为空也要表达其存在。
5 列内容如存在半角逗号(即,)则用半角引号(即',')将该字段值包含起来。
6 列内容如存在半角引号(即")则应替换成半角双引号("")转义,并用半角引号(即"")将该字段值包含起来。
7 文件读写时引号,逗号操作规则互逆。
8 内码格式不限,可为 ASCII、Unicode 或者其他。
9 不支持特殊字符
 
二、C#读取csv文件的方法

//读CSV文件类,读取指定的CSV文件,可以导出DataTable

    public class CsvStreamReader

    {

        private ArrayList rowAL;         //行链表,CSV文件的每一行就是一个链

        private string fileName;        //文件名

        private Encoding encoding;        //编码

        public CsvStreamReader()

        {

            this.rowAL = new ArrayList();

            this.fileName = "";

            this.encoding = Encoding.Default;

        }

        /// <summary>

        ///

        /// </summary>

        /// <param name="fileName">文件名,包括文件路径</param>

        public CsvStreamReader(string fileName)

        {

            this.rowAL = new ArrayList();

            this.fileName = fileName;

            this.encoding = Encoding.Default;

            LoadCsvFile();

        }

        /// <summary>

        ///

        /// </summary>

        /// <param name="fileName">文件名,包括文件路径</param>

        /// <param name="encoding">文件编码</param>

        public CsvStreamReader(string fileName, Encoding encoding)

        {

            this.rowAL = new ArrayList();

            this.fileName = fileName;

            this.encoding = encoding;

            LoadCsvFile();

        }

        /// <summary>

        /// 文件名,包括文件路径

        /// </summary>

        public string FileName

        {

            set

            {

                this.fileName = value;

                LoadCsvFile();

            }

        }

        /// <summary>

        /// 文件编码

        /// </summary>

        public Encoding FileEncoding

        {

            set

            {

                this.encoding = value;

            }

        }

        /// <summary>

        /// 获取行数

        /// </summary>

        public int RowCount

        {

            get

            {

                return this.rowAL.Count;

            }

        }

        /// <summary>

        /// 获取列数

        /// </summary>

        public int ColCount

        {

            get

            {

                int maxCol;

                maxCol = 0;

                for (int i = 0; i < this.rowAL.Count; i++)

                {

                    ArrayList colAL = (ArrayList)this.rowAL[i];

                    maxCol = (maxCol > colAL.Count) ? maxCol : colAL.Count;

                }

                return maxCol;

            }

        }

        /// <summary>         /// 获取某行某列的数据         /// row:行,row = 1代表第一行         /// col:列,col = 1代表第一列          /// </summary>         public string this[int row, int col]         {             get             {                 //数据有效性验证                 CheckRowValid(row);                 CheckColValid(col);                 ArrayList colAL = (ArrayList)this.rowAL[row - 1];                 //如果请求列数据大于当前行的列时,返回空值                 if (colAL.Count < col)                 {                     return "";                 }                 return colAL[col - 1].ToString();             }         }

        /// <summary>         /// 根据最小行,最大行,最小列,最大列,来生成一个DataTable类型的数据         /// 行等于1代表第一行         /// 列等于1代表第一列         /// maxrow: -1代表最大行         /// maxcol: -1代表最大列         /// </summary>         public DataTable this[int minRow, int maxRow, int minCol, int maxCol]         {             get             {                 //数据有效性验证                 CheckRowValid(minRow);                 CheckMaxRowValid(maxRow);                 CheckColValid(minCol);                 CheckMaxColValid(maxCol);                 if (maxRow == -1)                 {                     maxRow = RowCount;                 }                 if (maxCol == -1)                 {                     maxCol = ColCount;                 }                 if (maxRow < minRow)                 {                     throw new Exception("最大行数不能小于最小行数");                 }                 if (maxCol < minCol)                 {                     throw new Exception("最大列数不能小于最小列数");                 }                 DataTable csvDT = new DataTable();                 int i;                 int col;                 int row;                 //增加列                 for (i = minCol; i <= maxCol; i++)                 {                     csvDT.Columns.Add(i.ToString());                 }                 for (row = minRow; row <= maxRow; row++)                 {                     DataRow csvDR = csvDT.NewRow();                     i = 0;                     for (col = minCol; col <= maxCol; col++)                     {                         csvDR[i] = this[row, col];                         i++;                     }                     csvDT.Rows.Add(csvDR);                 }                 return csvDT;             }         }

        /// <summary>         /// 检查行数是否是有效的         /// </summary>         /// <param name="col"></param>          private void CheckRowValid(int row)         {             if (row <= 0)             {                 throw new Exception("行数不能小于0");             }             if (row > RowCount)             {                 throw new Exception("没有当前行的数据");             }         }         /// <summary>         /// 检查最大行数是否是有效的         /// </summary>         /// <param name="col"></param>          private void CheckMaxRowValid(int maxRow)         {             if (maxRow <= 0 && maxRow != -1)             {                 throw new Exception("行数不能等于0或小于-1");             }             if (maxRow > RowCount)             {                 throw new Exception("没有当前行的数据");             }         }         /// <summary>         /// 检查列数是否是有效的         /// </summary>         /// <param name="col"></param>          private void CheckColValid(int col)         {             if (col <= 0)             {                 throw new Exception("列数不能小于0");             }             if (col > ColCount)             {                 throw new Exception("没有当前列的数据");             }         }         /// <summary>         /// 检查检查最大列数是否是有效的         /// </summary>         /// <param name="col"></param>          private void CheckMaxColValid(int maxCol)         {             if (maxCol <= 0 && maxCol != -1)             {                 throw new Exception("列数不能等于0或小于-1");             }             if (maxCol > ColCount)             {                 throw new Exception("没有当前列的数据");             }         }         /// <summary>         /// 载入CSV文件         /// </summary>         private void LoadCsvFile()         {             //对数据的有效性进行验证             if (this.fileName == null)             {                 throw new Exception("请指定要载入的CSV文件名");             }             else if (!File.Exists(this.fileName))             {                 throw new Exception("指定的CSV文件不存在");             }             else             {             }             if (this.encoding == null)             {                 this.encoding = Encoding.Default;             }             StreamReader sr = new StreamReader(this.fileName, this.encoding);             string csvDataLine;             csvDataLine = "";             while (true)             {                 string fileDataLine;                 fileDataLine = sr.ReadLine();                 if (fileDataLine == null)                 {                     break;                 }                 if (csvDataLine == "")                 {                     csvDataLine = fileDataLine;//GetDeleteQuotaDataLine(fileDataLine);                 }                 else                 {                     csvDataLine += "\\r\\n" + fileDataLine;//GetDeleteQuotaDataLine(fileDataLine);                 }                 //如果包含偶数个引号,说明该行数据中出现回车符或包含逗号                 if (!IfOddQuota(csvDataLine))                 {                     AddNewDataLine(csvDataLine);                     csvDataLine = "";                 }             }             sr.Close();             //数据行出现奇数个引号             if (csvDataLine.Length > 0)             {                 throw new Exception("CSV文件的格式有错误");             }         }         /// <summary>         /// 获取两个连续引号变成单个引号的数据行         /// </summary>         /// <param name="fileDataLine">文件数据行</param>         /// <returns></returns>         private string GetDeleteQuotaDataLine(string fileDataLine)         {             return fileDataLine.Replace("\\"\\"", "\\"");         }         /// <summary>         /// 判断字符串是否包含奇数个引号         /// </summary>         /// <param name="dataLine">数据行</param>         /// <returns>为奇数时,返回为真;否则返回为假</returns>         private bool IfOddQuota(string dataLine)         {             int quotaCount;             bool oddQuota;             quotaCount = 0;             for (int i = 0; i < dataLine.Length; i++)             {                 if (dataLine[i] == '\\"')                 {                     quotaCount++;                 }             }             oddQuota = false;             if (quotaCount % 2 == 1)             {                 oddQuota = true;             }             return oddQuota;         }         /// <summary>         /// 判断是否以奇数个引号开始         /// </summary>         /// <param name="dataCell"></param>         /// <returns></returns>         private bool IfOddStartQuota(string dataCell)         {             int quotaCount;             bool oddQuota;             quotaCount = 0;             for (int i = 0; i < dataCell.Length; i++)             {                 if (dataCell[i] == '\\"')                 {                     quotaCount++;                 }                 else                 {                     break;                 }             }             oddQuota = false;             if (quotaCount % 2 == 1)             {                 oddQuota = true;             }             return oddQuota;         }         /// <summary>         /// 判断是否以奇数个引号结尾         /// </summary>         /// <param name="dataCell"></param>         /// <returns></returns>         private bool IfOddEndQuota(string dataCell)         {             int quotaCount;             bool oddQuota;             quotaCount = 0;             for (int i = dataCell.Length - 1; i >= 0; i--)             {                 if (dataCell[i] == '\\"')                 {                     quotaCount++;                 }                 else                 {                     break;                 }             }             oddQuota = false;             if (quotaCount % 2 == 1)             {                 oddQuota = true;             }             return oddQuota;         }         /// <summary>         /// 加入新的数据行         /// </summary>         /// <param name="newDataLine">新的数据行</param>         private void AddNewDataLine(string newDataLine)         {             //System.Diagnostics.Debug.WriteLine("NewLine:" + newDataLine);             ////return;             ArrayList colAL = new ArrayList();             string[] dataArray = newDataLine.Split(',');             bool oddStartQuota;        //是否以奇数个引号开始             string cellData;             oddStartQuota = false;             cellData = "";             for (int i = 0; i < dataArray.Length; i++)             {                 if (oddStartQuota)                 {                     //因为前面用逗号分割,所以要加上逗号                     cellData += "," + dataArray[i];                     //是否以奇数个引号结尾                     if (IfOddEndQuota(dataArray[i]))                     {                         colAL.Add(GetHandleData(cellData));                         oddStartQuota = false;                         continue;                     }                 }                 else                 {                     //是否以奇数个引号开始                     if (IfOddStartQuota(dataArray[i]))                     {                         //是否以奇数个引号结尾,不能是一个双引号,并且不是奇数个引号                         if (IfOddEndQuota(dataArray[i]) && dataArray[i].Length > 2 && !IfOddQuota(dataArray[i]))                         {                             colAL.Add(GetHandleData(dataArray[i]));                             oddStartQuota = false;                             continue;                         }                         else                         {                             oddStartQuota = true;                             cellData = dataArray[i];                             continue;                         }                     }                     else                     {                         colAL.Add(GetHandleData(dataArray[i]));                     }                 }             }             if (oddStartQuota)             {                 throw new Exception("数据格式有问题");             }             this.rowAL.Add(colAL);         }

        /// <summary>         /// 去掉格子的首尾引号,把双引号变成单引号         /// </summary>         /// <param name="fileCellData"></param>         /// <returns></returns>         private string GetHandleData(string fileCellData)         {             if (fileCellData == "")             {                 return "";             }             if (IfOddStartQuota(fileCellData))             {                 if (IfOddEndQuota(fileCellData))                 {                     return fileCellData.Substring(1, fileCellData.Length - 2).Replace("\\"\\"", "\\""); //去掉首尾引号,然后把双引号变成单引号                 }                 else                 {                     throw new Exception("数据引号无法匹配" + fileCellData);                 }             }             else             {                 //考虑形如""    """"      """"""                   if (fileCellData.Length > 2 && fileCellData[0] == '\\"')                 {                     fileCellData = fileCellData.Substring(1, fileCellData.Length - 2).Replace("\\"\\"", "\\""); //去掉首尾引号,然后把双引号变成单引号                 }             }             return fileCellData;         }     }

希望本文所述对大家的C#程序设计有所帮助。

 类似资料:
  • 本文向大家介绍PHP读取XML格式文件的方法总结,包括了PHP读取XML格式文件的方法总结的使用技巧和注意事项,需要的朋友参考一下 本文实例总结了PHP读取XML格式文件的方法。分享给大家供大家参考,具体如下: books.xml文件: 1.DOMDocument方法 2.用 SAX 解析器读取 XML: 3.用正则表达式解析 XML: 4.解析XML到数组 5.检查XML是否有效 6.可用于精确

  • 我收到的csv文件格式不正确(无法控制生成此csv的应用程序) CSV的标题和第一行如下所示: 这是我用来读取csv的代码: 这是我收到的输出: 第一个问题是奇怪的字符(可能缺少编码选项?)另外,标题是错误的,不能在该格式上使用DictReader,这对于编辑CSV非常有用。 我可以重写一个新的CSV与标题正确格式化,这不是一个问题,但我不知道如何跳过CSV的前3行!?或者我可以用CSV即将到来的

  • 本文向大家介绍Python使用xlrd读取Excel格式文件的方法,包括了Python使用xlrd读取Excel格式文件的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了Python使用xlrd读取Excel格式文件的方法。分享给大家供大家参考。具体如下: 使用xlrd能够很方便的读取excel文件内容,而且这是个跨平台的库,能够在windows,linux/unix,等平台上面使用,

  • 本文向大家介绍python读取几个G的csv文件方法,包括了python读取几个G的csv文件方法的使用技巧和注意事项,需要的朋友参考一下 如下所示: 以上这篇python读取几个G的csv文件方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持呐喊教程。

  • 本文向大家介绍php读取csv文件并输出的方法,包括了php读取csv文件并输出的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了php读取csv文件并输出的方法。分享给大家供大家参考。具体实现方法如下: 希望本文所述对大家的php程序设计有所帮助。

  • 本文向大家介绍C#逐行读取文件的方法,包括了C#逐行读取文件的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了C#逐行读取文件的方法。分享给大家供大家参考。具体如下: 这里使用C#逐行读取文件,对于大文件的读取非常有用。 希望本文所述对大家的C#程序设计有所帮助。