python html5 bootstrap 视频教程

德云社区

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 27280|回复: 0

数字翻译 2019 - 高效 GUI文档 机器人工翻译 CPU多线程多进程

[复制链接]

185

主题

204

帖子

1175

积分

工程师

Rank: 5Rank: 5

金钱
759
金币
15
威望
0
贡献
0
发表于 2018-5-23 04:21:00 | 显示全部楼层 |阅读模式
AI人工智能 语音助理 人工翻译 教程
数字翻译 2019 - 高效 GUI文档 机器人工翻译 CPU多线程多进程

"数字翻译" 采用 "应用 + 小程序" 方式架构,结合 "整体-局部" 及 "精确-模糊" 批量查找-翻译-比对 "多文件-多工程" 的快速并行 "本地化" 理念,借鉴了一些现有成熟技术,经多年努力、自主创新、研发而成。


在力求 "通用-简单-易上手" 前提下,大幅降低 "GUI 文档" 翻译中间环节,提高生产效率。尤其,"静态网站-站群" 文档翻译功能,最多可调用所有线程 100% CPU 资源。


经测试,"数字翻译" 的 "批处理" 翻译效率要比一般本地化工具高 5 - 20 倍。


"数字翻译" 的 "文档翻译" 采用 100% 一对一 "精确行翻译" (当然,也有不同名称叫法的 "全文替换系列" 模糊翻译) 方式,深入文档源代码,无中间文件及二次转换,不会产生任何中间过程垃圾文件。在保持本地化结果高度接近原版的情况下,可无数次快速-灵活重构、编辑源-目标翻译文档,获得超 100% 完美本地化结果。


"数字翻译" 的 "GUI (图形用户界面) 翻译" 是针对标准翻译资源进行扩展集成、智能提速,目前支持 QT/C++ GUI (图形用户界面) 框架 *.TS 文件快速批量提取-翻译-发布,其它类似应用本地化工具还在开发中,请耐心等待。


"数字翻译" 不但是一个功能强大的 "(程序源代码) 文本编辑器",还是一个 "所见即所得" 的 HTML Bootstrap 开发环境,也是一个 "Web 浏览器"。


在更人性化,更充分发挥 PC CPU 性能的同时,节省硬盘、内存空间,减少不停 "切换应用" 所带来的 "非必要泛人类烦恼与时间-硬件成本浪费"。


主要针对 Qt/C++ 框架 *.TS *.QM 文件及各种 GUI 标准本地化资源,及 HTML Bootstrap 文档翻译流程进行优化,如:高效提取-编排-除重本地化资源,批量 "人工-机器" 翻译-发布,还集成了很多文件处理、间接排版、编码转换、语音助理等 "小程序"。


譬如 (具体集成哪些小程序,以实际发布版为准):GUI (图形用户界面) 翻译、文档翻译、QT *.TS 文件提取、QT *.TS 文件编排、QT *.QM 文件发布、文件行重复、文件字符提取、文件版本、文件空格、全文搜索、全文替换、全文插入、全文删除、简转繁、文件转 UTF8、文件搜索、文件重命名、文件序列重命名、文件移动、文件拷贝、文件克隆、文件合并、语音助理、定时关机、文件下载等。


基于 "Google 开源 Chromium" HTML5 浏览器核心 (支持 HTTP HTTPS 协议) 及 Qt/C++11 5.9 GUI (图形用户界面) 框架开发,Python3.5 作脚本-插件编程语言。


采用 "暗黑色 (保护视力)" 全扁平化外观,且所有 "菜单" 可撕离。


可编写 Python、Cython、PySide、PyQt、Qt/C++、C/C++、Go、D、C#、.Net、Go、Java、Ruby、Lua、Tcl/Tk、Perl、PHP、ASP、HTML、CSS、JavaScript、等编程语言代码。


"高速模式" 小程序会根据 "CPU 运行" 情况调用 "CPU 线程" (最多调用所有线程 100% CPU 资源),且自带无重要操作 "5 分钟" 倒计时 "自动退出" 功能。


默认自带可切换 "en-US 美式英语 | zh-CN 简体中文 | zh-TW 繁体中文" GUI (图形用户界面),其它语言可自行扩展。


"首选项窗口" 可一键切换 "标准-CMD 调试" 模式 GUI (图形用户界面),方便 "调试 编写" 插件、脚本。


截止 2018 年 05 月 01 日最新版本为 2018.5 版,2019 版仍在开发中。


高效智能 多线程-多进程 GUI文档 网站站群 批处理式 "机器 人工翻译" 工具

http://dt.digitser.cn/zh-CN/app/translate/index.html


使用时点击 App 右上角 "视图切换" 按钮,可切换成 "网页渲染  | 源代码" 表示方式。也就是,所见即所得的 Web 网页一键切换。


下载-解压后点击 "digital_translate.exe" 即可使用,无需单独安装

after download-decompression, click on "digital_translate.exe" to use, no need to install separately


首次使用会提示安装 "Microsoft Visual C++ 2015 Redistributable" 及 "Adobe Flash Player"

First use will be prompted to install "Microsoft Visual C ++ 2015 Redistributable" and "Adobe Flash Player"



主要特性

截止 2018 年 05 月,全球针对 "人工翻译" 这块的 App 工具相比 AI (人工智能) 大热之前,已多了不少,由于加入 AI (人工智能) 理念可优化 "翻译流程和效率"。但不管是 Google、Bing、百度、有道等 "机器翻译" 提供商,虽加入了 AI (人工智能) 理念,但其翻译达标情况还是那么个样,不太理想。


从目前情况来看,不管 AI (人工智能) 是虚火还是真火,若想短期内彻底颠覆 "人工翻译",有点不太现实。


"机器翻译" 主要侧重于结果的呈现,至于场景、语境、专业、效率、排版、客户满意度等,都不在其考虑范围内;相比 10 多年前大家有时还得查查 "相关资料" (且 "机器翻译" 提供商不多) 的那种情况,这已是一种很大进步,特别是这几年还出现了 "语音交互"。基于此,目前的 "机器翻译" 在大多数情况下,还需人工辅助,因此,"人工翻译" 还有存在的必要。


由于 "机器翻译" 目前还不能完全达到 "人工翻译" 效果,当需要 "大批量-高效" 翻译本地 HTML 文档时,那就更不可能了。虽说全球已存在不少本地 HTML 文档 "人工翻译" App 工具,但侧重点各有不同。


01、机器-人工翻译

德云社区 "数字翻译" App 本身还是一个 Web 浏览器,因此,其技术成形的那刻就已将 "机器翻译" 与 "人工翻译" 天然结合。


"数字翻译" App 还在不断更新中,目前仅集成了 "Google、Bing、百度" 三家 "机器翻译" 提供商的 Web 入口,并未集成-接入其 API。


02、无数次快速重构

"数字翻译" 已模糊处理 "原文件" 与 "本地化文件" 概念 (并未完全隔离),因此,可无数次快速重构-编辑-修改 "原文件" 与 "本地化文件"。


只需简单组合 "删除-拷贝-编辑-翻译等" 操作,就已完成重构;因此,"数字翻译" 并没有可见的所谓 "工程理念",已被模糊进一个个 "文件-文件夹" 中。


当采用 zh-CN、zh-TW、en-US 等国别语言字符,重命名所需 "本地化" 文件-文件夹时,这个文件-文件夹就是一个小 "工程" 单元。


03、超 100% 呈现原文

人工翻译 App 工具若不能 100% 呈现 "原文或比原文更佳" 的效果,那么,翻译结果就可能造成其它意想不到的情况。


譬如:HTML 文档排版被打乱或被改动,表示 "价格或日期" 的数字与原文有差别,原文存在错误想改却改不了,原文意思表示不对或不完整想改进等。


"数字翻译" 本身还是一个 "专业 HTML Bootstrap" Web 静态网站制作工具,当然也是一个 Web 浏览器及程序源代码文本编辑器,它可直接操作 HTML 文档 "源代码" (当然,修改前请 "备份" 原文件)。


"数字翻译" 已模糊处理 "原文件" 与 "本地化文件" 概念 (并未完全隔离),"批量-高效" 修改两者非常容易,但 "修改-翻译" 结果需借助德云社区 "数据比较 (或其它同类)" App 工具对照-备份。


"数字翻译" 的 "文档翻译" 采用 100% 一对一 "精确行翻译" (当然,也有不同名称叫法的 "全文替换系列" 模糊翻译) 方式,深入文档源代码,无中间文件及二次转换,不会产生任何中间过程垃圾文件。


04、没有中间过程

某些 "人工翻译" App,会产生大量中间过程额外附加文件。


不但会增加磁盘占用空间,特别是还会影响文档管理、整体运行效率及用户体验。


德云社区 "数字翻译" App 可直接操作 HTML 文档 "源代码" (当然,修改前请 "备份" 原文件),因此,无需存在中间过程文件。


05、点-面结合

一个 "人工翻译" 工程若有上百个 HTML 文档就算很多了,但若有上万个 HTML 文档怎么办,那个翻译工作量是很吓人的。


不用怕,德云社区 "数字翻译" App 已充分考虑到这点。当工作量小,可一次 CPU 任务调用 "术语库" 所有术语翻译所有 HTML 文档;当工作量大时,可一次 CPU 任务调用 "术语库" 一条或几条术语翻译所有 HTML 文档 (实现所谓的 "碎片式翻译",当然,小工作量工程也可采用此种方式)。


有人会想,桌面 PC 或笔记本的 CPU 核心-线程越多,是不是还会更快。没错,"数字翻译" App 不但可充分调用 "CPU 所有线程",若 CPU 仍达不到 100% 充分利用,还可再加 CPU 任务进程数 (最小进程数 = 1,最大进程数 = CPU 线程数 * 5,仅需担心 CPU 散热性能)。


06、精确-模糊翻译

"数字翻译" App 采用 "单行精确翻译为主,其它模糊翻译为辅",从理念上将两者完全分开,由用户控制。


在充分发挥 "人工翻译" 效率及 "严格可控" 的前提条件下,为你带来 "安心、舒心、放心" 的极致用户体验。


若将 "精确翻译" 与 "模糊翻译" 合二为一,表面上看,是省心省力。但随时产生的 "不确定" 翻译结果,真能让你省心吗???


若不小心错译了一些内容,德云社区 "FTS (全文搜索)" App 系列工具还能快速 "精确-模糊" 定位错译的具体文件及行位置。


07、GUI 翻译

"数字翻译" 的 "GUI (图形用户界面) 翻译" 是针对标准翻译资源进行扩展集成、智能提速,目前支持 QT/C++ GUI (图形用户界面) 框架 *.TS 文件快速批量提取-翻译-发布,其它类似应用本地化工具还在开发中,请耐心等待。


"数字翻译" App 集成了 Qt/C++ 系列 PySide、PyQt 等绑定的 *.TS *.QM 文件本地化 GUI 整个快速翻译流程 "小程序"。


250 个左右 *.PY *.PYW 源文件,若基于现有术语库,"提取-整理-除重-翻译-发布等" 整个操作在双核 4 线程 CPU 环境下,仅需 10 - 20 分钟。


当然,"数字翻译" App 也适于其它标准 GUI 本地化流程,譬如:AutoDesk Maya、基于 Qt/C++ 开发存在 *.TS 源文件的 APP、Cinema 4D 等。


08、兼容性强

从 2019 版起,支持将 *.DSCP 术语导出成 *.TXT *.CSV *.XLS 等交换文件格式。


将兼容 SDL Passolo、Trados Studio 等本地化工具,还会进一步加强 MicroSoft Office Word、PDF、Markdown 标记语言文件、等文档,及标准 GUI 本地化流程。


09、小程序

德云社区 "数字翻译" App 集成了大量 HTML4/HTML5 文档翻译、QT *.TS 文件翻译、GUI 标准翻译资源快速提取-除重-翻译、版本管理、编码转换、文本批处理、文件处理等 "小程序"


譬如 (具体集成哪些小程序,以实际发布版为准):GUI (图形用户界面) 翻译、文档翻译、QT *.TS 文件提取、QT *.TS 文件编排、QT *.QM 文件发布、文件行重复、文件字符提取、文件版本、文件空格、全文搜索、全文替换、全文插入、全文删除、简转繁、文件转 UTF8、文件搜索、文件重命名、文件序列重命名、文件移动、文件拷贝、文件克隆、文件合并、语音助理、定时关机、文件下载等。


通用特性

以下是 "德云社区" App 所具有的一般通用特性,只是某些 App 存在一些或部分差别,具体情况请参照 "最新发布应用或 IDE"。


01、功能强大

"数字翻译" App 是一个功能强大的 "(程序源代码) 文本编辑器",还是一个 "所见即所得" 的 HTML Bootstrap 开发环境,也是一个 "Web 浏览器"。


在更人性化,更充分发挥 PC CPU 性能的同时,节省硬盘、内存空间,减少不停 "切换应用" 所带来的 "非必要泛人类烦恼与时间-硬件成本浪费"。


02、CPU 多线程-多进程

采用 "应用 + 小程序" 方式架构,将应用和小程序 "进程" 彻底分开。


应用和小程序分别运行在不同进程环境,在兼顾 "多功能" 的前提条件下,尽可能支持 CPU 多线程-多进程,充分发挥 "多核心 CPU" 的所有性能。


"高速模式" 小程序会根据 "CPU 运行" 情况调用 "CPU 线程" (最多调用所有线程 100% CPU 资源)。


CPU 核心和支持线程数越多,"高速模式" 小程序运行就越快。


03、字符补全

从 2018.5 版起,Python 选项卡具有 "字符补全" 功能。


从 2018.5 版起,HTML 选项卡具有 "字符补全" 功能。


当 "字符补全" 对话框弹出时,按下键盘 "Tab 键" 会自动补全字符。


04、运行、调试、Shell

从 2018.5 版起,开始支持 Python "运行、调试" 及 "交互 Shell" 功能。


"首选项窗口" 可一键切换 "标准-CMD 调试" 模式 GUI (图形用户界面),方便 "调试-编写" 插件、脚本。


05、多国语言

默认自带可切换 "en-US 美式英语 | zh-CN 简体中文 | zh-TW 繁体中文" GUI (图形用户界面),其它语言可自行扩展。


本地化语言文件夹名为 i18n,en-US.ts 文件包含 "美国英语" 本地化之前的源 GUI 字符,可采用 "数字翻译" 本地化工具 "克隆-翻译-生成" *.qm 文件 (App 起动时会自动加载此文件,以达到本地化目的)。


"编辑" 菜单 --> 首选项窗口 --> 用户界面 --> 用户界面语言 --> 重启后 App 此处可看到相应扩展语言 (如:ja-JP 表示日语-日本、ru-RU 表示俄语-俄罗斯),使用 --> 点击 "应用" 按钮 --> 重启 App


效率优先 Qt/C++ *.ts *.qm 文件汉化 机器 人工翻译小程序流程

http://forum.digitser.cn/thread-2180-1-1.html


06、简单-易上手

由于 "数字翻译" App 本身是一个强大的 "文本编辑器",还是一个 "Web 浏览器";因此,上手并不会太难,只是 "相同或相类似" 功能做了一些 "扩展-增强"。


在尽可能的情况下,不会 "展示或设置" 太多参数 (参数太多,也不能说明这些参数都会被用到),或将某些不常用参数 "隐藏"。


07、统一入口

除 "新建文件" 外,其它功能主要入口统一为工具栏的 "打开文件-URL" 按钮,点击会弹出 "文件-URL & 搜索关键词" 对话框。


"文件-URL & 搜索关键词" 对话框功能,包括:打开文件-目录、上网搜索关键词、2019 版会出现的 "语音交互" 等。


08、语音助理

默认集成可诵读 "网页文字 | 文本" 等的 "TTS (文本转语音)" 语音助理功能。


不认识或不太熟悉的中文、英文及各种字符,都可交由此 "TTS (文本转语音)" 小程序诵读。


有时忙不过来且又想一心多用,也可采用此 "TTS (文本转语音)" 小程序诵读网页、技术资料、最新时事新闻等。


09、引领新时代

"数字翻译" App 由跨多专业 "老工程师" 指导 (或亲自动手) 编写而成,在某些方面会比 "一般翻译工具" 更深入,而在某些不必要功能方面,则会更粗略。


相信大家在使用过程中,会体会到这种 "深入与粗略"。由于是 "工程师" 编写而成,因此,也会更倾向于 "工程师" 思维,而非 "一般生手" 思维。


尤其是在当下这种 "大数据 人工智能" 时代,"深入与粗略" 更是不可或缺的。


10、人性化

很多 "窗口或对话框" 都有一个外形比较大的 "取消或关闭" 按钮,功能等同右上角的小 "x" 关闭按钮。


所有 APP "菜单" 均可撕离,方便随时调用其下功能;"小程序" 自带无重要操作 "5 分钟" 倒计时 "自动退出" 功能。


使用时点击工具栏 "视图切换" 按钮,可切换 "网页渲染  | 源代码" 表示方式。也就是,所见即所得的 Web 网页一键切换。


从 2018.5 版起,所有 App 采用 "暗黑色 (保护视力)" 全扁平化外观。


11、绿色便携

所有 "应用及小程序" 均为 "绿色" 便携版,随下随用,无需单独安装。


下载-解压后点击 "digital_***.exe" 即可使用,无需单独安装。


首次使用会提示安装 "Microsoft Visual C++ 2015 Redistributable" 及 "Adobe Flash Player"。


发展历史
时间
版本
说明
备注
2015.052015Digitser 团队在研究 "工业4.0 大数据" 时,有意无意中发现了大幅提高工作效率的最佳方式研发了一系列原型测试脚本,此时,还没有 GUI 图形用户界面
2016.052016"首选项窗口" 可一键切换 "标准-CMD 调试" 模式 GUI (图形用户界面),方便 "调试 编写" 插件、脚本
Digitser 团队开发出了具有一些 "工业4.0 大数据" 理念的 App 原型产品,并开始系列化
"小程序" 自带无重要操作 "5 分钟" 倒计时 "自动退出" 功能
App 所有 "菜单" 可撕离,方便随时调用其下功能
采用 Python2.7 作脚本-插件编程语言
采用 "Apple 公司 Safari" HTML5 浏览器核心及 Qt4.8/C++ GUI 框架开发
2017.052017首次支持 "静态网站-站群" 翻译模式
"数字翻译" 产品逐渐成熟,开始对外发布
"高速模式" 小程序会根据 "CPU 运行" 情况调用 "CPU 线程" (最多调用所有线程 100% CPU 资源)
添加了很多 "HTML5 BootStrap QT/*.TS Python 代码开发、文档 GUI 机器人工翻译" 流程相关小程序
还有一些其它功能小程序,譬如:文本批处理、版本管理、编码转换、文件处理、RE 正则表达式、语音助理等
采用 Python3.4 作脚本-插件编程语言
采用 "Apple 公司 Safari" HTML5 浏览器核心及 Qt4.8/C++ GUI 框架开发
2017.112018此为过渡版本
完善帮助文档-视频教程
把性能可优化小程序升级到 "高速模式"
采用 Python3.4 作脚本-插件编程语言
采用 "Apple 公司 Safari" HTML5 浏览器核心及 Qt4.8/C++ GUI 框架开发
2018.012018.5新增 "全文移动" 批处理工具
为 Python HTML 选项卡添加 "字符补全" 功能
所有 App 首次采用 "暗黑色 (保护视力)" 全扁平化外观
新增 Python2.7.x 3.x 代码 "运行-调试",交互 Shell 功能
开始全面兼容 HTTPS 协议,把性能可优化小程序升级到 "高速模式"
采用 C 编程语言优化核心运行效率
采用 Python3.5 作脚本-插件编程语言
采用 "Google 开源 Chromium" HTML5 浏览器及 Qt5.9/C++11 GUI 框架开发
2018.072019新增 "窗口布局" 功能切换采用 C/C++ 编程语言优化核心运行效率
采用 Python3.6 作脚本-插件编程语言
采用 "Google 开源 Chromium" HTML5 浏览器及 Qt5.11/C++11 GUI 框架开发



扫一扫关注 德云社区 微信公众号
AI人工智能 语音助理 人工翻译 教程
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

Archiver|Sitemap|小黑屋|德云社区 |网站地图  

GMT+8, 2024-11-22 23:42 , Processed in 0.059558 second(s), 27 queries .

工业和信息化部: 粤ICP备14079481号-2

技术支持 乐数软件     版权所有 © 2014-2021 德云社区    

快速回复 返回顶部 返回列表