视频编目与数据应用

2018-04-02 15:29郝秀利郝利强
数字传媒研究 2018年3期
关键词:责任者

郝秀利 郝利强

1.内蒙古广播电视台 内蒙古 呼和浩特市 010050 2.国家新闻出版广电总局694台 内蒙古 呼和浩特市 010105

随着社会的不断进步,信息化时代如何将大量视频资料转化成有效的信息数据,成为了电视媒资当前的主要任务。之前的经验表明,要想达到谷歌或百度搜索一样的用户体验,仅仅将视频资料按照《广播电视节目资料编目规范》编目完成,再用媒资系统自带的通用搜索引擎检索是很难能达到预期效果的。不同领域、不同背景的用户往往具有不同的检索目的和需求,通用搜索引擎所返回的结果包含大量用户不关心的视频数据,达不到精准快捷的检索需求。谷歌和百度搜索引擎是利用爬虫技术和对海量用户的行为分析来聚焦的。目前,电视台的媒资管理系统用户局限在全台网或者企业云内部,而非互联网用户,用户数量有限,不可能为了提高检索时的用户体验,而部署非常多的服务器进行大运算。因此,在现有条件下提高数据应用最有效的方法是,与用户需求相结合提高编目的针对性和有效性。

1 制定有针对性的编目规范

现在编目遵循的是《广播电视节目资料编目规范》,这是媒资厂商设计系统和广播电视台编目的依据。但在实际应用中,不管是系统集成商还是最终编目员或者检索使用者,很多人不知道如何正确地使用《广播电视节目资料编目规范》,造成使用过程中检索查全率不高、命中率不高和检索效率差。很多人认为是《广播电视节目资料编目规范》编写的不好,殊不知《广播电视节目资料编目规范》是纲领性文件,它的核心意义在于提供设计思路,提供编目的思考依据和方法。在实际应用中,应针对实际情况进行扩展和甄别性的选取。

以内蒙古广播电视台视频编目为例,为了更详细更精准的对素材资料进行编目,达到方便快速检索与及时应用,以《广播电视音像资料编目规范》为依据,总结了对节目类资料的编目经验,制定了《视频素材类资料的编目规范》。首先将视频素材资料分为三大类,即:原始拍摄素材、编辑素材和无字幕播出节目素材。原始拍摄素材是指为前期拍摄的大量原始视频素材。编辑素材是指编辑成品但未最终上字幕及合成特技的素材。无字幕播出版素材是没有加字幕、角标、LOGO等元素的完整的播出节目,内容与播出版一致。这类新闻素材要求按照条目切分至片段层,综艺素材要求按照每个节目单元切分至片段层。这类素材已经进行了剪辑及特效处理,再利用价值不高,所以场景层、镜头层可选择切分。原始拍摄素材所反应的事件在节目成片中已经体现,切分时不必考虑素材内容主题与逻辑关系。为了让后期制作使用更加便利,大多数资料不进行片段层切分,直接切分场景层和镜头层,增加了提取关键帧的数量。对重大活动、珍贵的历史资料、重要人物、重拍有难度的场景画面都要用场景、镜头层更好的诠释。编辑素材按照事件进程、内容层次和场景变换进行切分。

2 制定有效性的编目著录标准

制定了适合自己的编目规范后,就要考虑视频内容编目的核心要素应该是什么了。视频编目的重点在两个方面:内容+画面。视频与报纸图书不同,有其特殊性,图书是一事一议,视频的画面可以重新表达。因此,视频编目在完成新闻六要素等内容揭示时,必须把重点放在画面描述上,才能为再利用服务。

以内蒙古广播电视台视频编目为例,电视新闻节目编目著录要求如下:

(1)节目层主要著录项:正题名、关键词、责任者、内容描述、节目形态、版权情况、首播时间等。

(2)片段层主要著录项:正题名、系列题名、关键词、受访者、版权情况、空间范围等。

(3)场景层主要著录项:正题名、关键词、空间范围等。

(4)镜头层主要著录项:正题名、拍摄者、拍摄方式、角度、景别等。

关键帧选取要体现节目主体、重要人物和景物等。对节目主题的提示说明作用的画面也要提取。还有选取有标注性的字幕帧。

另外,在编目时不停地强调数据完整性是对的,但完整性针对的是内容属性完整,就是说新闻六要素等与画面的揭示,不是说每一个元数据项必填。例如,网络推送来的视频是附带节目文稿的,但编目时工作人员还要求在内容描述内或分层的内容描述内再次叙述,这会造成大量数据冗余。片段层已经揭示过的内容在场景层内没有必要再次描述,否则将来检索的数据冗余问题会很突出。

3 做到与用户导向相一致

最后再谈一下如何做到与用户需求导向相一致的方法。笔者认为可以通过分析用户习惯用语和习惯性检索方式,多与编辑记者交流,熟悉不同场景的描述语言习惯。编目中在内容描述时要尽量使用习惯用语著录。通过检索平台研发数字用户角色,识别用户的共性和个性偏好,结合用户行为分析理论,将用户各个属性进行分解,进行数字研判,为用户量身定制该用户的专属浏览体验,针对用户进行内容优化,主动推送相关信息。其次,在编目时要正确使用规范用语。例如,在全国两会报道内容中“参政议政”是中国人民政治协商会议全国委员会和地方委员会的主要职能之一,报道中涉及政协委员时,可使用“参政议政”。全国人民代表大会和地方各级人民代表大会是人民行使国家权力的机关,报道中涉及人大代表时,不能使用“参政议政”,可使用“履行职责”或“行使权力”;“代表、委员”并提时,最好把“履行职责”与“参政议政”写全。再如在同一届次会议上,政协委员的“界别”不要写为“届别”。“届”是从时间上说的,指的是九届、十届、上一届、本届等;“界”则是针对委员的工作领域分类而言,如“经济界委员”等。最后,标签化视频的核心关键词。核心关键词是指经过关键词分析确定下来的词语,通俗讲是目标客户可能用来检索的关键词。一般情况下,核心关键词具有这些特征:一般在节目层的正题名中出现。一般是2~4个字构成的一个词或词组,名词居多。工作人员可以根据视频内容主旨,列出核心关键词。这段视频表达了什么内容?这些内容如果用几个词语概括,分别是什么?通过这样的思路,很容易找到关键词。另外,检索平台的内容呈现主要围绕核心关键词展开。在每日检索中都有一定数目的搜索量。通过搜集核心关键词的视频内容,作为专辑或主题定期呈现在检索平台上,可以引导用户发现这一阶段热点素材。

猜你喜欢
责任者
参考文献著录项目
——责任者著录规则(一)
专著中的析出文献的著录格式
参考文献著录细则
参考文献著录细则
参考文献著录要求
专著中的析出文献的著录格式
参考文献著录细则
文后参考文献——责任者的著录方法
科技期刊中文目次页责任者署名情况调查及分析
200字段责任者项著录的规范化问题