visual c++对大型数据文件的读取
发表于:2007-07-14来源:作者:点击数:
标签:
笔者前不久曾遇到一个问题,解决之后的经验愿与大家分享。问题是这样的,有一批数据文件,数据格式如下: 日期,开盘,最高,最低,收盘,成交量,成交金额 1996年5月13日,636.96,636.96,636.96,636.96,0,0, 1996年5月14日,641.61,641.61,641.61,641.61,0,0, 1996
笔者前不久曾遇到一个问题,解决之后的经验愿与大家分享。问题是这样的,有一批数据文件,数据格式如下:
日期,开盘,最高,最低,收盘,成交量,成交金额
1996年5月13日,636.96,636.96,636.96,636.96,0,0,
1996年5月14日,641.61,641.61,641.61,641.61,0,0,
1996年5月15日,637.83,637.83,637.83,637.83,0,0,
.............
要求将数据填写到四张表中,以便作相应的分析。笔者开始用CFile和CStdioFile类的方法读取件。Cfile类提供了基于二进制流的文件操作,功能类似于C语言中的fread()和fwrite()函数。CStdioFile提供了基于字符串流的文件操作,功能类似于C语言中fgets()和fputs()函数。但是笔者发现,使用这两个类进行文件操作时,对于一次文件读写的数据量的大小必须限制在65535字节以内。究其原因是在VC中访问大于65535字节的缓冲区需要Huge型指针,而在CFile和CStdioFile类中,使用的是Far型的指针。由于Far型指针不具有跨段寻址的能力,因此限制了一次文件读写的长度小于65535字节。如果传递给CFile和CStdioFile两个类的成员函数的数据缓冲区的大小大于65535字节的时候,VC就会产生ASSERT错误。
针对文件格式特点,笔者改用CArchive类进行读取如下:
CFile SourceFile;//数据文件
CString SourceData;//定义一临时变量保存一条记录
SourceFile.Open(.......);
CArchive ar(&SourceFile,CArchive::load);
while(NULL!=ar.ReadString(SourceData))//循环读取文件,直到文件结束
{
if(SourceData=="日期,开盘,最高,最低,收盘,成交量,成交金额"||SourceData=="")
continue;//跳过文件头部的提示信息
//分析并填充//
}
在进行分析时,笔者采取了逐步分析并修改的办法,过程如下:
int nYear;
CString Year= SourceData.Left(SourceData.Find("年"));//截取年前面的字符串
nYear=atoi(Year);//类型转换
SourceData=SourceData.Righ(SourceData.GetLength()-SourceData.Find("年")-2);//将年以及前面的字符删除。
重复上面分析过程,直到记录末尾。
通过上述方法,笔者成功地将文件读取并分析填充。
原文转自:http://www.ltesting.net