python html5 bootstrap 视频教程

德云社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 5179|回复: 0

*.dser 文件 ── 采用 UTF-8 编码的 Digitser 软件生成文本文件

[复制链接]

194

主题

288

帖子

1322

积分

超级版主

Rank: 8Rank: 8

金钱
798
金币
15
威望
0
贡献
0
发表于 2016-5-3 20:12:23 | 显示全部楼层 |阅读模式
AI人工智能 语音助理 人工翻译 教程
*.dser 文件 ── 采用 UTF-8 编码的 Digitser 软件生成文本文件

".dser" 文件格式为 "Digitser" 公司的软件生成文件,主要使用 "UTF-8" 编码。".dser" 文件格式中的 "dser",也就是 "Digitser" 的缩写,中文可译为 "数字工作者"、 "数字技术工作者"、"数字工厂"、"数字化器"。


".dser" 文件格式构思于 2015 年,2016 年初成型。本着 "数字工作者" 的核心精神,采用易于理解、简单、直观、通用文本格式,一般不加密,方便交流、学习、分享,又区别于现有通用文本格式 ".txt"。


考虑到与其它 "工具/软件"、操作系统平台、多语言环境的兼容性问题,".dser" 文件格式主要采用 "UTF-8" 编码。Windows 平台 "记事本" 程序生成文件,默认采用 "ANSI" 格式。


所有能打开 ".txt" 文本格式的工具或软件,都能直接打开 ".dser" 文件格式。若把文件扩展名后缀由 ".dser" 改为 ".txt",就变成了大家所熟知的 ".txt" 文本格式。


采用 ".dser" 作后缀,是为区别现有通用文件格式 .txt。当采用 Digitser 公司软件抓取文本格式数据时,若把数据直接存入 .txt 文件,在某些情况下可能搞混而修改现有文件,采用 ".dser" 之后,这种可能性会大副降低。


UTF-8 编码

UTF-8 (8-bit Unicode Transformation Format) 是一种针对 Unicode 的可变长度字符编码,又称 "万国码"。由 Ken Thompson 于 1992 年创建,现已标准化为 RFC 3629。


UTF-8 用 1 至 4 个字节,编码 UNICODE 字符。用在网页上,可在同一页面显示中文简体、繁体及其它语言 (譬如:英文、日文、韩文)。


字节 FF 和 FE 在 UTF-8 编码中永远不会出现,因此,他们可用来表明 UTF-16 或 UTF-32 文本 (见 BOM) UTF-8 是字节顺序无关的。UTF-8 字节顺序在所有系统中都是一样的,因此, UTF-8 实际上并不需要 BOM。


请关注 "德云社区" 及其微信公众号,了解相关资讯

版权声明:
本文为独家原创稿件,版权归 德云社区,未经许可不得转载;否则,将追究其法律责任。

AI人工智能 语音助理 人工翻译 教程
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|Sitemap|小黑屋|德云社区 |网站地图  

GMT+8, 2024-11-26 20:15 , Processed in 0.028341 second(s), 27 queries .

工业和信息化部: 粤ICP备14079481号-2

技术支持 乐数软件     版权所有 © 2014-2021 德云社区    

快速回复 返回顶部 返回列表