文件大小:0.99M
媒体资产管理系统及关键技术
媒体资产管理系统及关键技术中国传媒大学信息工程学院柴利军谢桂●韩海摘要:近年来。媒体资产管理技术发展很快。并且已走向实用。本文从电视台对媒体资产管理系统的要求出发.介绍了媒体资产管理系统的组成结构和其中的关键技术。关键词:磁盘阵列元数据人.脸识别蓝光1引言目前,国内外传媒竞争激烈,广电技术正在迈向以媒体资产管理(MAM)为核心的数字化、同络化新阶段。在国外,早在1999年,CNN就由Sony公司和IBM公司合作开发了一套特别为电视和视频制作行业设计的数字资产管理系统;派拉蒙于2000年开始由IBM公司实施一个综合的媒体资产解决方案;同时瑞士电视公司(STV)和BBC都在建设这种系统。在国内,CCTV进行了中国音像资料馆MAM系统建设,上海文广集团‘也已实施MAM系统。MAM系统不是一般意义上的资源共享系统,它能解决的问题不仅仅是使用者能否迅速得到所需内容,而且还有内容调度、设备调度、同一内容多用途等。系统结构如图1所示。信息
源2媒体资产管理系统的组成及结构信息处
理子系统(数字化及压缩处理、生
成索引等)索引数据内容管理
予系统应用子系统’,EPG系统VOD系统BOSS系统其它系统带目发布平△‘3圈1嫘体资产管理系统结构图2.1内容输入,内容输入模块主要由上吓载工作站及标引编自工作站组成,主要完成对传统模拟信号的数字化或数字信号的采集,将数据同时存为高质量的MPEG--2资料和低质量的MPEG-4的素材。其中低码率数据采用MPEG-4进行编码,可供检索、简单编辑和多媒体发布。在上载的同时,自动和手动对视音频数据进行标引缩目,即先由记者或编辑傲初始化,取得一个初步的编目,而细节留待专业人员傲二次甚至多次编且,然后
完成总体的编目。为检索提供元数据信息,方便数据的检索和查询,实现数据有效的再利用。采用媒体内容和元数据分别存放的数据库技术,保证二者的关联性和一致性,加快搜索的速度。另外,上/下载工作站也能将存储中心的数字节目转换成模拟或其他数字格式的节目,肉传统的模拟设备或数字设备传送。22内窖存储。386--第六届京、津、沪、渝及全国城市有线电视技术研讨会论文集MAM系统存储部分采用包括在线(online)、近线(nearline)和离线(offline)的多级混合存储方式。不仅满足大型数据库和大规模视频资料海量存储的需要,同时又保证系统随信息量的增长是可升级、可扩充的。在线存储指设备以永久方式连接在系统中,随时保持可直接、实时、快速访问的状态,用于存储热数据,适合频繁访问、数据量较小的应用,一般采用高速硬盘阵列。近线存储主要采用装有控制机械手的磁带库或光盘库,当计算机访问近线的盘库、带库时,首先通过存储管理软件确定盘或带的存放位置,然后控制机
械手将所需的盘或带装入驱动器,并启动读写操作。离线存储指设备或介质平时不装载在系统中,在存取数据时,需要人为地将设备或介质临时性地装载或连接到系统中,当数据访问完成后可以脱开连接。在不同类型的存储方式间可以按照数据的类型、重要性、使用频率和时限进行灵活的自动迁移或即时手动迁移。存储的原则是:(1)所有媒体资产的元数据保存到在线存储器中;(2)频繁使用、较常用和长时间不用的素材分别保存到在线、近线和离线存储器中;(3)高分辨率、大数据量素材存到离线存储器中,同时在近线或在线存储器上保存低分辨率版本。2.3内容管理当数字化的媒体内容和元数据存入MAM系统后,系统将对媒体资产的元数据作更详细的描述,这被称之为编目。它包括人工添加描述词如关键字或文本描述,以及基本的评价如“好”或“差”等。通常MAM系统会提供“数据模型”来定义元数据的结构,一般会有一组预定义的“公共资产结构”来提供对基本描述字段,如“单轨”/“多轨”,“片段”/“系列”等的定义。3媒体资产管理系统的关键技术3.1音视频元数据标准要从大量的资料中快速、准确地找到所需的内容,就必须提取元数据,进行编目标引,并建立索引。目前,网上数字资源比较常用的元数据格式有MARC(中国为CNMARC,WH/T0503—96),DublinCore(DC),VRA核心类目,REACH著录元素集等。值得注意的是DC因其通俗易懂,便于使用,得到了国际社会的普遍认可,有望成为国际标准。与MARC复杂的856个字段相比,DC包含有15个基本著录项。但DC毕竟不是完全针对音视频环境而制定的标准,一般情况下,音视频元数据应当包括长度和时间,甚至包括关键场景或有代表性的典型图像。元数据是网络信息组织的重要组成部分,但由于至今没有一个对元数据进行管理的权威机构,造成目前Web上的元数据标准林立,且仍有继续制定的趋势。我们需要在对各类元数据标准、MPEG--4以及最新的MPEG21标准综合分析的基础上,研究制定一个适合于网络数字媒体内容管理的元数据格式规范。3.2视频素材检索在视频信息检索手段中,常用的方法是采用文本信息来标引媒体对象,并在标引文本信息和媒体对象之间建立某种关联,然后将标引信息存入关系数据库,并对之进行有效的管理和检索操作,从而达到检索视频信息的目的。从逻辑上讲这种方法主要突出文本注释信息,但对主要的数据却没有给予充分的考虑。采用基于视频内容的检索可以克服这个问题。它是根据多媒体对象的语义、特征,如图像的颜色、纹理、形状,视频中的场景、镜头运动,声音中的音调、响度、音色等进行分析,抽取特征和语义,建立索引并进行检索。这是一种信息检索技术,能从大型分布数据库中,以用户可以接受的响应时间,查询到所要求的信息。其核心是视频素材语义自动提取技术,它主要有:(1)文字识别数字视频中含有大量的文字信息,它通常采用以下几步进行识别。①文字区域检测.②改善字符区域的图像质量:利用双线形插值方法,将水平或垂直方向的分辨率分别提高2或4倍,然后用多个连续图像帧综合方法提高插值后的图像质量。第六届京、津、沪、渝及全国城市有线电视技术研讨会论文集—。387..③字符抽取:对字符区域的图像进行二值化处理,然后分割出每个字符。④字符识别:采用目前比较成熟的印刷体字符识别技术进行识别。(2)人脸识别目前,已存在多种人脸识别技术,如神经网络、变形模板、特征脸等。对于视频现在有人提出一种MPEG压缩域视频流上的高效人脸检测技术。该算法包括3个阶段。首先,利用训练数据获得肤色在chr空间上的统计分布,基于该统计分布信息在探测时利用贝叶斯最小风险决策算法区分某一点是否为候选的人脸区域,于是会产生一个2值掩码图像,其中“1”代表候选人脸的区域,“0”为非人脸区域。第2阶段采用人脸的形状特点等先验知识过滤掉假脸。第3阶段是对第2阶段产生的候选人脸区域进行能量分布检查过滤掉假脸。(3)语言识别目前比较流行的语音识别引擎主要是IBM的Viavoice。一个完整的语音识别系统由语言特征提取、声学模型与模式匹配(识别算法)、语言模型与语言处理3个方面,再通过语言信息到文本语义信息的转变,以及一个语音自动识别过程。事实上限于目前计算机视觉与视频分析的现状,单纯依赖视频信号对视频内容的分析和理解还有一定的局限性。所以应尽量应用多种不同的信息源,如视频帧、音频、文字,特定应用的背景及先验知识,采用多种技术途径,如计算机视觉、视频分析、语言识别、自然语言理解、人脸探测等来对视频内容做更广泛深入的理解与描述。从而实现各种视频信息的语义特征信息自动提取。3.3存储介质媒体资产存储介质有数据流磁带、硬盘和DVD光盘。对存储介质的选择应考虑资料存取时间的长短、存储寿命、信号读写速度、介质成本、兼容性等因素。根据实际情况,选用相应的存储介质。(1)数据流磁带数据流磁带用于计算机系统中的数据备份,具有容量大、技术成熟、价格较低的特点,应用范围非常广泛。考虑到在MAM系统中,由于数据量巨大,通常需要采用多级的存储体系,因此磁带以其读写速率高、价格较低、存储容量大的特点成为主体存储介质的首选。它是一种顺序化存储介质,现有的数据流磁带不压缩容量可达400GB。50Mbps高码率电视节目,单盘数据流磁带可记录4-8小时电视节目,若进行数据压缩,还可大大增加记录时间。几种常用的数据流磁带技术指标如表1所列。裹1常用数据流磁带技术指标数据流磁带容量(未压缩)(GB)传输速率(Mbps)DLT35llAIT5012V)【^806L1m40080数据流磁带机在使用上不同于磁盘或视频磁带,数据流磁带是一种基于字节流方式传输的设备,其传输速率和运行是恒定的,不能快速启停。由于外部视频设备或网络传输设备对数据传输速率的需求可能比磁带机高或低,网络传输也可能是断续的,为了与输出速率适配,通常需要将磁带上的数据复制到硬盘上,然后由硬盘输出到实际需要数据的外部设备。虽然从原理上讲必须在全部数据复制到硬盘之后才能开始真正地输出数据,但是,很多时候可以在部分数据转移到硬盘之后即开始输出数据,这样可以减少等待时间。(2)硬盘读写速度快、效率高、技术成熟、维护升级方便,但价格较贵、体积大、存储成本较高。为了保证数据的安全和稳定,建议使用RAID技术。RAID目前公认的标准是Level从0至5,RAID2与RAID4由于设计缺陷等原因现在很少使用。RAIDO从严格意义上讲并不属于RAID系列,因为它并无冗余能力。RAIDI是使用磁盘镜象技术,所以又称作为镜象磁盘阵列。RAID3是并行工作的,它的每次访问都需要读阵列中的每一磁盘以便计算奇偶校验信息,当阵列某组中的一个磁盘损坏时,可以通过奇偶信息与其余磁盘信息的奇..388—.第六届京、津、沪、渝及全国城市有线电视技术研讨会论文集偶相关性来恢复出损坏盘上的信息,每组磁盘数至少三个。RAID5是以扇区作数据分段,奇偶校验数据以循环的方式分布在各磁盘上,这是它与RAID3的最大区别之处。RAID5的每个磁盘上既有数据信息,也有奇偶校验信息,以解决多重操作争用校验盘的问题,因此RAID5内允许在同一组内同时进行多个读写操作,RAID5特别适合小容量文件的频繁操作的系统,并支持多个用户同时进行读写要求。是一种快速、容错分布合理的磁盘阵列。但其控制复杂,价格贵,当一组中的某个磁盘故障,虽不影响正常使用,但对整个系统的性能影响较大。77(3)DV.D光盘目前市场上大规模使用的DVD光盘技术已经比较成熟,这里主要介绍下一代DVD光盘技术:蓝光技术和HD—DVD技术。蓝光光盘的直径为12era,和普通光盘(CD)及数码光盘(DVD)的尺寸一样。这种光盘采用MPEG-2压缩技术,利用405nm蓝色激光在单面单层光盘上可以录制长达27GB的视频数据,比现有的DVD的容量大5倍以上(DVD的容量一般为4.7GB),更可录制13小时普通电视节目或2小时高清晰度电视节目。当然,这只是单层容量,双层更可以达到46或54GB容量,足够刻录一个长达8小时的高清晰电影。而容量为100或200GB的,分别是4层及8层。与蓝光相对的是HD—DVD阵营,原本东芝已经加入蓝光阵营,然而利益的分配以及相关技术特性诱使东芝断然退出该组织,转而联合NEC开发AdvancedOpticalDisk,并且得到DVD—Forum的鼎力支持,改名为HD—DVD。由于蓝光DVD和当前的DVD格式不兼容,直接加大了厂商过渡到蓝光DVD生产环境的成本投入,因此大大延迟了蓝光成为下一代DVD标准的进程。东芝和NEC联合推出的AOD技术相比于蓝色激光最大的优势就在于能够兼容当前的DVD,并且在生产难度方面也要比蓝光DVD的生产难度低得多。由于离线存储数据的海量和冷数据性质,蓝光光盘高达100G的存储容量使其成为离线存储介质的合适选择,但由于蓝光光盘的向下不兼容性且市场价格暂时还比较昂贵,所以蓝光光盘在推广中还存在不少困难,建议电视台在建设媒资管理系统中选择离线存储介质时应根据自己的需求和经济势力统筹考虑。4结语媒资管理系统的核心作用是将有形的媒体资产转化为无形地媒体资本,充分发挥其潜在的经济效益,提高使用效率。MAMS的建立,可实现节目资源的采、编、播、管、存的数字化、网络化、一体化管理目标,创立了基于数字媒体资源为核心的运营模式,转变了在媒体资料管理上原有的无序、杂乱的堆砌式磁带管理
方式,实现了节目资源的网络化共享利用,带来了更为广阔的业务拓展空间,建立了具有扩展性的全业务平台。它是对当前资源独享的巨大变革,是实现全面数字化数字电视播出、节目传输、网上发布、交换出售等增值服务的前提,对有线数字电视节目平台业务的全面展开和深入发展,具有十分重要的实际意义。