码迷,mamicode.com
首页 > 其他好文 > 详细

CSV文件的规范

时间:2016-01-28 07:05:53      阅读:111      评论:0      收藏:0      [点我收藏+]

标签:

CSV文件,全程Comma-separated values,就是逗号分隔的数据文件。常用于数据集成的数据交换部分标准部分。

最近看到一个项目组在讨论接口文件CSV的规范,真是替他们着急。讨论点:

  1. 文件是否有标题行(header row),一方坚持要有,接口另一方坚持不能有。
  2. 行分割符,一方坚持使用Unix style的0x0A字符,另一方坚持使用Windows/Dos风格的0x0D0x0A(或者说\r\n),回车换行两个字符。
  3. 列分隔符,一方坚持使用一个不可见字符0x05,说防止和内容字符串冲突,另一方坚持使用0x1B(ESC键)。
  4. 字符串中如果有换行怎么处理,也没有统一的意见。

不会Google真可怕,这个东西很简单,先看是否有标准,如果有严格按照标准走。如果没有标准,看是否有常见做法(或者叫事实标准)。Google一下关键字“CSV”,第一条就是维基百科(wikipedia)的解释。

An official standard for the CSV file format does not exist, but RFC 4180 provides a de facto standard for many aspects of it.
Jiger: CSV没有正式标准,但是国际互联网工程任务组(IETF)给推荐标准RFC 4180描述了CSV文件的结构。

下面一种常见配置:

  • MS-DOS-style lines that end with (CR/LF) characters (optional for the last line)
    Jiger: {使用回车换行(两个字符)作为行分隔符,最后一行数据可以没有这两个字符。}
  • An optional header record (there is no sure way to detect whether it is present, so care is required when importing).
    Jiger:{标题行是否需要,要双方显示约定}.
  • Each record "should" contain the same number of comma-separated fields.
    Jiger:{每行记录的字段数要相同,使用逗号分隔。} 逗号是默认使用的值,双方可以约定别的。
  • Any field may be quoted (with double quotes).
    Jiger:{任何字段的值都可以使用双引号括起来}. 为简单期间,可以要求都使用双引号。
  • Fields containing a line-break, double-quote, and/or commas should be quoted. (If they are not, the file will likely be impossible to process correctly).
    Jiger:{字段值中如果有换行符,双引号,逗号的,必须要使用双引号括起来。这是必须的。}
  • A (double) quote character in a field must be represented by two (double) quote characters.
    Jiger:{如果值中有双引号,使用一对双引号来表示原来的一个双引号}

如果使用了以上推荐标准,可以减少很多时间来讨论方案。

CSV文件的规范

标签:

原文地址:http://www.cnblogs.com/wangjiping/p/CSV_File_Spec_for_Data_Exchange.html

(0)
(0)
   
举报
评论 一句话评论(0
登录后才能评论!
© 2014 mamicode.com 版权所有  联系我们:gaon5@hotmail.com
迷上了代码!