将csv文件导入到数据库中

1、csv文件简介

  CSV全称 Comma Separated values,是一种用来存储数据的纯文本文件格式,通常用于电子表格或数据库软件。这样你就发现了,csv其实就是纯文本文件,可以使用记事本打开。但是因为他一般表示的是表,所以windows下默认的是用excel打开的。

  他的规则如下:

 开头是不留空,以行为单位。

  • 可含或不含列名,含列名则居文件第一行。(这一点在插入时需要注意判断,如果第一行是列名,那么需要把第一行数据抛弃)
  • 一行数据不垮行,无空行。
  • 以半角符号[,]作分隔符,列为空也要表达其存在。
  • 列内容如存在[,],则用双引号[””]将该字段内容包含起来。
  • 列内容如存在[”],双引号[””]将该字段内容包含起来,并且在内容中用两个双引号表示一双引号[””]。
  • 文件读写时引号,逗号操作规则互逆。
  • 内码格式不限,可为ASCII、Unicode或者其他。

2、插入数据库操作

  将csv文件插入数据库是一个常见的需求,最简单的做法就是直接读取csv文件,然后一行一行读出来后用split(",")分割之后插到数据库中。当然这种方法虽然看起来简单,但是有写问题很难解决。比如列内容中有[,]的问题,这种情况如果用这种方法的话很难判断。所以一般情况下不能推荐使用这种方法来插入数据。

  今天我介绍的方法是用Microsoft ActiveX Data Objects 来做:

(1)引入Microsoft ActiveX Data Objects

  右击“引用”——COM选项卡——Microsoft ActiveX Data Objects,我的电脑是6.0版本的,实际使用中版本间差距不大,代码都可以通用。

 

 

(2)代码部分:

        /// <summary>
        /// 将csv文件导入到数据库中
        /// </summary>
        /// <param name="strCSVFile">导入的文件名</param>
        /// <param name="strPathToTextFile">文件的存储路径</param>
        public void test(string strCSVFile, string strPathToTextFile)
        {
            Connection adoCSVConnection = null;
            Recordset adoCSVRecordSet = null;
            try
            {
                adoCSVConnection = new Connection();
                adoCSVRecordSet = new Recordset();
                adoCSVConnection.Open(string.Format("Provider=Microsoft.Jet.OLEDB.4.0;Data Source={0};Extended Properties=\"text;HDR=YES;FMT=Delimited\"", strPathToTextFile));
                adoCSVRecordSet.Open(string.Format("SELECT * FROM {0}", strCSVFile), adoCSVConnection);
                while (!adoCSVRecordSet.EOF)
                {
                    for (int i = 0; i < adoCSVRecordSet.Fields.Count; i++)
                    {
                        var strsource = adoCSVRecordSet.Fields[i].Value;
              //到这里你懂的了吧...^_^ } adoCSVRecordSet.MoveNext();
} } catch (Exception ex) { } finally { if (adoCSVRecordSet != null) { adoCSVRecordSet.Close(); } if (adoCSVConnection != null) { adoCSVConnection.Close(); } } }

  这种方法其实是将csv文件作为一种数据库来操作,你可以看到有连接字符串"Provider=Microsoft.Jet.OLEDB.4.0;Data Source={0};Extended Properties=\"text;HDR=YES;FMT=Delimited\""。

 

  将csv文件插入到数据库中还有很多因素要考虑,比如对于大批量的数据需要用到多线程,以及对于mvc中无法使用webform中的委托回调函数来获得数据更改ui线程。这些问题以后有时间再写出来。

posted @ 2012-08-12 19:02  zhangkai2237  阅读(13240)  评论(0编辑  收藏  举报