*.dser 文件 ── 采用 UTF-8 编码的 Digitser 软件生成文本文件
".dser" 文件格式为 "Digitser" 公司的软件生成文件,主要使用 "UTF-8" 编码。".dser" 文件格式中的 "dser",也就是 "Digitser" 的缩写,中文可译为 "数字工作者"、 "数字技术工作者"、"数字工厂"、"数字化器"。
".dser" 文件格式构思于 2015 年,2016 年初成型。本着 "数字工作者" 的核心精神,采用易于理解、简单、直观、通用文本格式,一般不加密,方便交流、学习、分享,又区别于现有通用文本格式 ".txt"。
考虑到与其它 "工具/软件"、操作系统平台、多语言环境的兼容性问题,".dser" 文件格式主要采用 "UTF-8" 编码。Windows 平台 "记事本" 程序生成文件,默认采用 "ANSI" 格式。
所有能打开 ".txt" 文本格式的工具或软件,都能直接打开 ".dser" 文件格式。若把文件扩展名后缀由 ".dser" 改为 ".txt",就变成了大家所熟知的 ".txt" 文本格式。
采用 ".dser" 作后缀,是为区别现有通用文件格式 .txt。当采用 Digitser 公司软件抓取文本格式数据时,若把数据直接存入 .txt 文件,在某些情况下可能搞混而修改现有文件,采用 ".dser" 之后,这种可能性会大副降低。
UTF-8 编码
UTF-8 (8-bit Unicode Transformation Format) 是一种针对 Unicode 的可变长度字符编码,又称 "万国码"。由 Ken Thompson 于 1992 年创建,现已标准化为 RFC 3629。
UTF-8 用 1 至 4 个字节,编码 UNICODE 字符。用在网页上,可在同一页面显示中文简体、繁体及其它语言 (譬如:英文、日文、韩文)。
字节 FF 和 FE 在 UTF-8 编码中永远不会出现,因此,他们可用来表明 UTF-16 或 UTF-32 文本 (见 BOM) UTF-8 是字节顺序无关的。UTF-8 字节顺序在所有系统中都是一样的,因此, UTF-8 实际上并不需要 BOM。
请关注 "德云社区" 及其微信公众号,了解相关资讯
版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载;否则,将追究其法律责任。
|