“数字报刊与跨媒体出版系统”专题之一
数字报刊与跨媒体出版
徐 萍 楼险峰
最近十年,以报业为基础的综合性新闻网站得到高度重视,取得轰轰烈烈的发展,成为媒体研究者的焦点。但是,以报纸翻版为使命的各类“电子报”、“电子版”、“网络版”、“宽带报纸”等媒体样式,整体上也没有大的变化。即便如此, “电子报”同样保持很高的访问量。
2005年,浙江日报报业集团与北大方正电子公司共同完成了的一项重要的科技成果,它把传统报纸的数字化翻版技术和观念,提高到“报业产品数字化”的新高度,成为报社跨媒体发展的新动力。
数字报刊系统的核心是“跨媒体出版暨数字报刊自动生成系统”,在全新的系统构架中,把“传统报纸生产、数字资产管理、电子报生成、光盘出版、全文数据库形成和网络发布”等作业融为一体,实现跨媒体的多元出版;通过一系列的技术集成,把“文章、版式、图片、广告、报花、字体、字号”等报纸涵盖的所有信息,完整地结合在一起,再现版面语言的魅力;而精心设计的、更为友善的交互平台,把数字化阅读的愉悦包容其中,正在努力超越新闻纸的墨香。
从报业实际出发的跨媒体出版系统,目前已经在浙报集团所属《浙江日报》、《钱江晚报》、《新民生报》、《今日早报》、《美术报》、《浙江老年报》等报纸中全面部署应用,并通过浙江在线(WWW.ZJDAILY.COM.CN)正式对外发布。
跨媒体出版带来高效率
从平面媒体转到数字媒体,实际上是新闻信息展现形式的转变。根本上讲,是信息资源的重新组织。
传统报纸生产、数字资产管理、电子报生成、光盘出版、全文数据库形成、网络发布,以及采编人员业绩考核系统、通讯员稿酬发放系统、稿件的统计分析系统,在数据组织上,有相当高的重合性和互补性。长期以来,由于技术的局限、管理体制的局限和标准化问题的障碍,信息资源的整合十分困难,更谈不上跨媒体出版。
在“跨媒体出版暨数字报刊自动生成系统”中,以信息资源的集中管理为核心,通过流程优化,结合跨系统的技术集成与数据交换,完成一系列的技术创新,带来多方面的高效率。
首先,当报纸排版完毕,只需要十分钟左右时间,就能自动生成数字报刊和符合数字图书标准的CEB文件,可以在内部网络中提供阅览,而相关数字资产实现自动归档,同步进入内部数据库,与历史报刊数据实现一体化管理。
其二,系统根据设定的时间,自动向网站服务器提交成品文件。在技术层面看,网站发布的时间提前了6到8个小时,远远早于开印时间。
其三,在同步实施方正畅流系统的情况下,最终版面文件全部采用PDF格式,文件量相对PS方式大大减少,明显缩短卫星传版时间,印刷开机时间因此也有了15到20分钟的提前。
其四,如果报社需要出版报纸数据光盘,可以在截至日当天的凌晨就完成母盘的制作,这是以前不可能做到的。
同样的原因,系统能够在第一时间向“采编人员业绩考核系统”和“通讯员稿酬发放系统”发送完整、准确的稿件条目数据,从而减少大量人力,为“稿费日清”创造可能。
数字报刊系统生成的数字报刊页面是静态的html文件,通过脚本文件中的参数设置,可以方便地开启或屏蔽页面中的某些功能,如果在数字报刊系统所部署的网络环境中存在与某个功能相关的系统,则可设置成打开该功能,否则,如果不存在相关的系统,就屏蔽该功能。从而确保数字报刊页面可以在多种环境中浏览、阅读。这样,数字报刊页面不仅可以部署在局域网中,而且可以部署在因特网上、政府专网、图书馆上,也可以在报社内网中使用。同样,这些数字报刊系统文件还可以直接刻录到CD或DVD上,制作成数字报刊光盘或者以数字图书的标准形式进入市场。
流程再造实现自动化
在传统流程中,电子报纸的形成完全是基于PS格式分析,由于PS格式文件包含的信息比较少,要实现完全自动化的准确反解是不可能的,要提高智能化分析水平也相当有限。在这种技术背景下,报社需要大量的人工进行专门的数据标引和检查,导致效率低、成本高,也容易出现差错。
要解决数字报刊相关信息的完整、准确性和自动化问题,必须与新闻生产的各个环节打通,直接从源头获取准确的数据。为了实现这一设想,需要在新闻采编系统、飞腾排版系统、激光照排或畅流系统中,加入大量信息获取点。
首先,在采编系统和排版系统架构“网络组版插件”,将采编系统和飞腾排版系统连接起来,获取文章内容、标题、作者(包括记者所在部门、通讯员的地址等)、编辑等稿件相关属性,为数字报刊系统也为考核系统、稿酬处理系统提供数据。
在飞腾排版环节,需要记录文章、图片、广告、报花的内容、标题等方面的组成和修改,以及在排版后期才能确定版次、版面名称、见报日期以及组版编辑和签发人等信息。当排版结束,通过飞腾的“提交传版”操作后,系统将版面信息、稿件信息以及区域定位信息立刻回写到相关系统中。
另外,专门设计的“飞旋标引系统”直接嵌入到飞腾排版软件中,除了解决相关信息的自动获取外,也提供了人机交互的界面,为标引和检查相关信息提供平台。
通过调用方正畅流系统生成的PDF文件,以及版面JPG文件和局部图像JPG文件,实现相关数据的自动生成和归档,完全不需要人工干预。
实践证明,在新闻采编系统、排版系统和照排系统中,我们能够获取数字报刊自动生成所需要的几乎所有的信息。
通过流程再造,使得大部分信息已经正确“就位”,减少了人工操作。根据统计,平均每个版只需要增加1分钟不到的标引工作,但由于整个流程的优化,组版人员在其他方面的工作可以节省了3到5分钟。
原来负责标引操作的人员,现在可以完全节省了。同时,由于组版员对版面内稿件的组织、布局比较熟悉,所以准确性大大提高。
解决“开天窗”问题
国内大多数报社都采用飞腾软件排版,其最后的产品是PS文件,由于PS文件的阅读和再利用的障碍,无法通过网络直接对外发布版面。此前,我们采用“文易系统”进行数据格式转换,生成版面PDF文件。但遗憾的是,这种方式生成的文件不能保证精确完整,经常发现广告或报花丢失,出现版面“开天窗”的情况。这种有严重缺陷的文件,以报社的名义正式对外发布是危险的。
北大方正的畅流系统,可能是近年来传媒行业最重要的一次技术革命,它在解决报纸出版安全问题的同时,为报业数字资产管理以及跨媒体出版系统奠定了基础。
采用“畅流系统”后,这个问题从根本上得到了解决。在“畅流系统”中生成的版面PDF文件,采用自包含技术,一个版一个文件,包含了版面上的全部关联文件信息,不会缺图、缺字体、缺广告,可以直接用于阅读、打印和印刷,是版面信息完全保存的理想载体,这是一个非常重大的变化。
经过畅流系统生成的版面PDF文件,都是经过加密的,只有安装了密钥的代印点才能正常阅读和出片,否则即使复制了也无法打开。网站上发布供免费阅读的电子版,则通过畅流系统专门的设计,生成阅读用、低精度的PDF文件以及带区域定位的版面JPG文件,可以很好地满足数字报刊和内部数字资产管理系统的要求。
畅流系统还可以根据标引的要求,自动生成局部的JPG图像文件。利用这一技术,还同步实现了“电子剪报”的功能和效果。
实现广告的完整上网
目前国内的电子报,很少有把广告上网的,在数字报刊系统的研究中,关于如何解决版面中的报头、报花、题图、导读、表格、分类广告等各类不规则内容的网页呈现,一度成为无法逾越的难题。
我们最终设想把这些零碎的信息组合,用生成局部图像的方式在网页中呈现,使这一系列复杂的问题得到统一的解决,方正畅流系统提供了高效率的解决方案,实际效果非常理想。
以版面为中心的阅读体验
与以往采用PDF文件表现版面信息不同,在数字报刊系统中,采用高压缩比的JPG版面图的呈现,达到打开页面就能看到版面的效果,“版面图”成为界面的视觉中心。同时,在JPG版面图实现文章、图片、广告区域的自动定位,自动生成对应内容的网页链接。
数字报刊系统由于直接与先进的方正“畅流”系统实现数据交换,在完整版面图像、局部版面图像自动生成方面取得重大突破,因而在涵盖内容、呈现形式等方面,相对传统电子报有非常大的突破。
在文件格式上,系统根据需要分别提供HTML、JPG、PDF和CEB等四种类型文件,其中CEB格式支持数字图书的标准。
在布局上,大致分为三个区域,左侧是本版导航区,中间是整报导航区,右侧为检索功能区和链接区。在本版导航区,按次序排列本版的全部文章标题;在整报导航区,按次序排列报纸全部版面的版次和版面名称。
总体上的色彩搭配给人以和谐、柔和、庄重的感受,适于在线阅读。
人机交互与数字化阅读
数字报刊系统在人机交互环境的设计上,力图延续并超越传统报纸的阅读习惯。
首先,在技术平台的选择上,采用当前最流行的B/S结构,采用通用的网页浏览器,不需要安装任何专用软件,阅读者无须学习和适应。以静态页面作为主要的发布形式,还同时保证了较高的响应速度,避免用数据库实时生成页面的时间滞后,向阅读者提供高速的信息交互。
在导航设计方面,要尽可能防止访问者“迷路”。该系统的导航分为四个层次,三个模块。第一个层次是每期报纸之间的导航;第二个层次是同期报纸不同版面间的导航;第三个层次是同一版面不同稿件间的导航;第四个层次是各种功能键的导航。三个模块为日期导航模块、版面图导航模块和文字链导航模块。整体上讲,做到了简洁明了。
过多的点击层次,会引起用户烦躁,因此我们设置了两层结构,第一层是版面层,第二层就直接进入内容浏览。除了整版广告显示不得不采用三层结构以外,其余内容全部限定在两层以内,使用户在浏览信息时做到点击次数的最少化。
数字报刊系统提供了三种内容阅读方式:
1、通过点击版面图的区域来阅读文章。
2、通过点击文章标题来阅读文章。
3、还可以打开版面的PDF文件来阅读报纸。
数字报刊系统集成了网页浏览的多种功能,如文章内容及图片的放大、缩小,上下篇、上下版、上下期的方便跳转,还提供了日历跳转、指定日期查看等功能。
系统特别设计了“转版合成处理”、“竖排文字处理”等功能,实现与计算机语音合成系统的集成,实现在线朗读,力图为阅读者提供了最大程度的便利。
静态页面与数据库技术的集成
数字报刊系统采用静态页面与动态数据库相结合的模式,把两者的好处结合在一起。
为了满足访问者在阅览时对响应速度的要求,便于调整页面设计风格,便于向网站传送数据,为了适应内部网络、政府专网、因特网以及光盘出版的个性化要求,采用静态页面的方式是必然的选择。
但为了解决全文检索系统、阅读者发表评论、稿件版面统计分析、内部数字资产管理等其他方面的要求,我们必须保留并发挥数据库的特长。
在数字报刊的生产流程中,也充分体现了数据库与静态文件相结合的思想。首先,采编系统是完全采用数据库管理,采编人员绩效考核、通讯员稿酬发放处理是采用数据库管理,在飞腾排版、卫星传版和照排出片方面是文件管理,版面标引是基于数据库的,标引结果又是生成XML文件。图片、广告的处理也是采用文件与数据库相结合的形式。最终,采用方正翔宇系统把XML文件入库,再通过模板设置,自动完成数字报刊静态页面文件的生成。
由于考虑到多种文件类型管理与多种数据库管理方式的并存需要,系统设计中充分考虑了数据交换和转换的规范性要求,因而具有灵活适应和结构开放的特点,可以支持各种类型的全文检索系统,可以不断拓展新的功能。
功能配套与深度拓展
数字报刊系统除了包含最为核心的“跨媒体出版暨数字报刊自动生成系统”以外,还包括“数字报刊阅读和评论系统”、“全文检索系统”、“数字报刊指向和导航系统”、“数字报刊朗读系统”、“数字报刊信息聚类加工系统”、“数字报刊访问统计分析系统”,“数字报刊广告位管理与发布系统”。
在系统后台,实现与“新闻采编系统”、“飞腾排版系统”、“畅流系统”、“渊博系统”、“企业信息门户系统”、“采编人员绩效考核系统”、“通讯员稿酬发放系统”的数据交换和系统关联,利用“飞旋标引系统”和“翔宇网站内容管理系统”实现数据生成,也可以挂接方正Apabi网络出版系统实现电子图书(相当于报纸合订本)的自动生成。
数字报刊系统还设计了专门的“数据发布和追加通道”、“数据纠正和变更程序”以及“数据适应性定制工具”。
数字报刊系统的研究与开发,解决了报刊产品数字化的问题,在技术上有了充分的积累和准备,同时也开启了跨媒体融合的技术空间。在二期工程中,将重点解决“数据报刊”与“数字电视”、“数字图书馆”的跨煤体融合问题,以及解决落实“按篇收费”概念的“数字报刊订阅与收费管理系统”。
数字报刊,虽然还只是数字媒体的一个方面、一条通道、或者是一个开端。但我们相信,从新闻纸到数字报刊,这是一个新的历史起点。
(作者单位:徐 萍 浙江树人大学网络新闻传播教研室
楼险峰 浙江日报报业集团信息技术处)