基于智能移动端的中药资源普查数据采集系统设计与实现

2017-12-15 00:10戚元华王慧张小波金艳格小光景志贤王凌赵宇平郭兰萍黄璐琦
中国中药杂志 2017年22期
关键词:移动端数据采集

戚元华 王慧 张小波 金艳 格小光 景志贤 王凌 赵宇平 郭兰萍 黄璐琦

[摘要]该研究基于手机端,融合GPS定位、偏移校正、语言识别以及软件和数据库网络技术,开发了中药资源普查(一般调查)移动端数据采集系统,实现了中药资源种类、位置、图片、时间、标本5项核心内容15个核心指标的采集记录功能,采集数据导入全国中药资源普查信息管理系统两方面的功能。基于手机移动端的数据采集系统可以快速的定位经纬度、海拔信息,方便拍摄各种类型的中药资源照片、标本照片、生境等照片,实现和中药基原信息的自动关联,还可以通过语音识别功能来协助记录资源特征、环境特征等信息,并有效记录标本的采集相关信息。基于中药资源普查数据填报客户端的数据整理平台,可以有效辅助内业整理,将移动端的数据导出到电脑端,数据整理完毕后并上传到中药资源数据普查填报数据库中,为第四次全国中药资源普查野外调查工作提供强有力的技术支撑。

[关键词]中药资源普查; 移动端; 一般调查; 数据采集

[Abstract]In this paper, a data acquisition system based on mobile terminal combining GPS, offset correction, automatic speech recognition and database networking technology was designed implemented with the function of locating the latitude and elevation information fast, taking conveniently various types of Chinese herbal plant photos, photos, samples habitat photos and so on The mobile system realizes automatic association with Chinese medicine source information, through the voice recognition function it records the information of plant characteristics and environmental characteristics, and record relevant plant specimen information The data processing platform based on Chinese medicine resources survey data reporting client can effectively assists in indoor data processing, derives the mobile terminal data to computer terminal The established data acquisition system provides strong technical support for the fourth national survey of the Chinese materia medica resources (CMMR)

[Key words]Chinese materia medica resources survey; mobile terminal; commonlysurvey; data acquisition

中藥资源普查工作包括一般调查和重点调查等主要工作任务,一般调查是随机调查,在野外中药资源调查的过程中,随时发现各种药用植物并做好记录工作;重点调查是在提前预设的样地、样方套内进行普查作业。重点调查基于PDA的数据采集端[1],协助普查队员进行重点调查数据信息采集,尚无协助普查队员进行一般调查的采集系统。

1需求分析

一般调查的目的是掌握区域内可药用资源种类和分布等信息,要求每条调查记录中必须包括,采集人、时间、位置、照片和实物等方面的信息。外业调查工作中,完成每一条记录数据信息的采集,普查队员需要同时携带GPS定位设备、相机、纸质调查表等设备来完成普查任务。野外调查工作中需要记录药用资源的名称、位置等信息、还需要拍摄植物照片、采集标本实物等,普查队员每天需要采集的数据信息多、工作时间长;同时,携带的仪器设备多、随着工作时间的增加、队员的负重逐渐增加,对普查队员的体能和耐力等提出了更高的要求。

为客观反映每个区域中药资源种类,中药资源普查要求每一种中药资源的位置、照片和实物等方面的信息和实物要一一对应。普查队员外业调查过程中,通常,将采集到的中药资源信息手工记录在纸质调查表上,在内业整理过程再将纸质调查表中的信息手工录入到电脑中,实现普查数据信息的数字化。如,位置信息的获取,一般需要普查队员先根据GPS的定位信息,手工将包括10几位数字的经纬度信息抄写在纸质调查表上,内业整理过程中再将10几位数字的经纬度信息从纸质调查表上录入到电脑中。在获取录入每条中药资源信息的过程中,由于数字录入工作量大、对应关系多、操作过程中的错误录入不可避免,影响数据质量。

如何以新技术新方法为依托,开发设计集定位、拍照和信息记录3方面功能于一体的系统辅助普查数据信息的获取和数字化,成为此次中药资源普查信息化的面临的主要问题,该问题的解决将大大方便中药资源野外调查,提高工作效率。目前,一般可以通过GPS、PDA、手机和相机等获取位置信息。手机的使用人群迅速发展壮大,几乎每个野外普查队员都在使用手机,随着手机技术的发展一般都带有GPS定位、拍照、时间、上网等功能。开发手机端的中药资源普查数据采集系统,可有效辅助普查人员进行外业调查,提高数据信息的准确性、减少由于人工录入产生的错误,降低一般调查作业强度,提高工作效率。endprint

2系统总体功能架构

基于智能移动端的中药资源普查数据采集应用系统(以下简称“采集APP系统”)的架构设计遵循平台化、组件化的设计思想,采用统一的数据交换、统一的接口标准、统一的安全保障。

移动端采集APP系统主要分为数据采集子系统和数据整理子系统两部分。数据采集子系统开发采用Android 60开发,支持魅族、华为、小米等国产手机。Android是基于Linux平台的,采取的是分层的架构,各层清晰分工明确,主要分为3层:操作系统、中间件、应用程序。由于中药资源普查数据填报系统是采用NET技术框架开发,为了便于数据的整理和技術对接以及后期的维护升级,中药资源普查数据整理子系统在电脑端实现,技术架构开发采用NET技术架构和Access数据库。

中药资源普查数据采集子系统能够支持最少3种主流国产手机和平板,支持Android 60操作系统,自适应屏幕分辨率;基于开源的移动端操作系统进行研发;支持移动端APP自动升级。具有以下功能:通过GPS自动获取经纬度、海拔信息,基原名、药材名的快速查找和自动关联,照片(名称)、采集号和基原名的自动关联,照片连拍,采集号自动生成,语音记录和识别,药材名等基本信息的记录和导出等功能。数据整理子系统,能将移动端采集的数据导入到“中药资源普查数据填报系统”,同时支持对移动端采集数据的编辑、中药名录的快速查找关联、采集号的自动生成、手机录音的语音识别、数据导出、定义数据导出标准以及普查图片的快速录入等功能。

系统总体功能架构见图1,2。

3核心技术方法

31采用百度地图定位SDK,实现采集地点的实时定位

GPS(global positioning system)即全球定位系统,是由美国建立的一个卫星导航定位系统,利用该系统,用户可以在全球范围内实现全天候、连续、实时的三维导航定位和测速[2];利用该系统,用户还能够进行高精度的时间传递和高精度的精密定位。

采集APP系统采用百度地图定位SDK进行GPS定位,具有精度高、覆盖广、速度快、流量小、内存/CPU占用率低的优势。采用百度地图SDK进行GPS定位的整体定位成功率高达995%,误差范围在10~20 m,移动、联通、电信全网络覆盖,基站覆盖率99%,WIFI覆盖率99%,网络定位速度在1 s以内,耗费流量小于03 K/次。

32采用语音识别技术,提高中药资源调查效率

语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或命令的高端技术。语音识别技术[34]主要包括特征提取技术、模式匹配准则及模型训练技术3个方面。

采集APP系统采用百度语音识别技术,能够确保音频数据源的真实性;全平台REST API可适用于任何平台的语音识别;利用该技术能够进行深度语义解析,可支持多达35个垂类领域的语义理解定制;该技术还可以根据用户使用的场景设定特定领域,使得识别结果更准确。

4采集APP系统的详细设计

41数据采集内容设计

根据《全国中药资源普查技术规范》[5],对数据采集内容进行设计,在一般调查中需要采集的信息主要有7个方面21个指标。

基原信息,包括种中文名称(或别名)、种拉丁名、科中文名称、科拉丁名、生活型、个体照片等6个指标。

药材信息,包括药材名称、药材别名、入药部位、入药部位照片等4个指标。

照片信息,包括生境照片、植物群落照片等2个指标。

标本信息,包括标本采集号、标本照片名称等2个指标。

位置信息,包括经纬度、海拔等3个指标。

时间信息,包括调查时间、标本采集时间等2个指标。

普查队信息,包括调查人、调查地点等2个指标。

42数据采集子系统功能设计

421新增记录创建一个新的调查记录,包括照片采集录入、基原名称选录、采集号录入、采集地区录入、位置信息获取和语音处理,可对中药资源的名称、图片、位置、采集地点、外貌特征、环境特征等数据进行获取及保存。

照片信息可以从手机图库选择或者调用手机相机进行实时数据拍照。系统支持从图库中选择需要的照片,选择照片的最大总数量默认为20张;另外,系统支持使用手机照相机进行拍照,支持单张拍照和连续拍照,拍照的照片能自动显示在该记录界面上,见图3。

基原名称录入:提供输入和下拉列表框选择2种方式,输入基原的首字母简写或者部分字,系统可从数据库中自动获取与之关联的基原名称,以供选择。输入时支持模糊搜索(如“蒲公英”,可输入“蒲”),支持首字母简写搜索(如“PGY”),方便用户操作。

标本信息录入:系统可自动生成采集号和标本编号,同一地区的同1 d内,标本编号自动增长,用户可自行修改。

位置信息:采集地点(采集号输入框右侧框)自动填充为登录页选择的地区信息,用户可在其后添加详细地址信息。打开手机GPS,系统自动获取经纬度、海拔信息,为保证数据完整性和真实性,系统不提供经纬度信息的修改操作。

植物特征与环境特征录入支持汉字和语音2种方式,即可手工录入关于植物特征的描述信息,也可录入语音信息,到达有效时长时自动结束保存,录入后最下方会有对应的语音按钮。

422浏览已有记录该功能主要完成新建记录的分类浏览、数据删除、数据导出、数据批量选择和数据查询。可浏览不同地区的调查记录信息、批量选择、导出、删除调查记录信息、查询导出/未导出的数据等。数据导出时对数据压缩打包和标记,采用异步操作方式,提高了数据导出效率,见图4。

423已有调查记录修改系统对未导出过的记录支持2次编辑重新导出,该功能和添加记录相似,所有数据自动从数据库获取并填充,不同的地方是可进行多次重定位,然后覆盖原始的位置信息。采用事务异步方式进行数据的修改操作,修改成功后返回。已导出过的记录只能浏览不能进行2次编辑。endprint

424系统设置用户可根据需要设置语音的记录条数、每次调查的每种植物的照片采集数量、每次语音录入时长以及进行版本更新操作。语音记录条数:每条调查记录界面内的植物特征语音只能录入的语音条数,默认为5条。照片采集设置:每条调查记录界面内的植物照片数量限制,默认最多为20张。语音录入時间:每次语音录入的有效时长,默认为2 min。版本更新:显示当前版本信息,可查看服务器是否有新版本需要更新,有更新则下载更新到最新版本。

425普查队设置该功能实现对数据采集地点的设置以及采集人信息的录入。采用省、市、县三级联动的方式,根据省市县三级信息(名称、行政编码等)进行关联,实现了动态所属关系的展现。

43数据整理子系统功能设计

431数据导入通过手机端与电脑的连接,可以将采集设备(手机)采集的数据导入到电脑中。不同的手机型号,连接电脑后,会出现不同的设备接口调试的提示和打开功能,用户可根据常见问题,完成主流手机的调试接口的打开操作。通过数据导入操作,将手机端数据导入到电脑端的本地数据库,完成数据的无缝衔接。

432数据维护如果野外普查人员对中药资源种类鉴别不准确,内业整理中需要对外业调查数据进行修改,结合拍摄照片、语音记录信息,对手机采集的基原信息进行完善。

数据维护主要完成对手机端采集数据的完整性、规范性核查和补录,包括基原信息完善、照片补录、语音处理,并提供数据完整性校验和数据查询功能。

433数据导出完成数据维护后,可将数据以标准格式导出。对于不符合系统规范的记录,系统会以红色底色标示,提醒用户编辑不符合规范的数据。用户可选择导出数据存放的位置。导出数据以Excel表格形式存放。用户可以以基原记录为单位进行查看,并分为基本数据和图片数据两部分,其中图片信息是以电脑位置信息的形式存放。

5小结

采集APP系统实现了快速的定位经纬度、海拔信息,可以方便的拍摄各种类型的照片,并实现和中药基原信息的自动关联,可以通过语音识别功能来协助记录中药资源的特征、环境特征等信息,可以有效记录标本的采集相关信息。基于中药资源普查数据填报客户端的数据整理平台实现了有效的辅助内业整理,将移动端的数据导出到电脑端,上传到中药资源数据普查填报系统的客户端数据库中。

[参考文献]

[1]马卫峰, 孙冠楠, 张小波,等 中药资源普查野外数据采集系统设计与实现[J] 中国现代中药, 2013, 15(10):823

[2]张守信 GPS卫星测量定位理论与应用[M] 北京:国防科技大学出版社, 1996

[3]禹琳琳 语音识别技术及应用综述[J] 现代电子技术,2013(13):43

[4]王敏妲语音识别技术的研究与发展[J] 微型机与应用,2009(23):1

[5]黄璐琦,王永炎 全国中药资源普查技术规范[M] 上海:上海科学技术出版社,2015

[责任编辑吕冬梅]endprint

猜你喜欢
移动端数据采集
基于开源系统的综合业务数据采集系统的开发研究