地拉那

霍仁龙姚勇基于地理信息系统的历史数据库

发布时间:2020/10/23 14:48:12   点击数:
擅长白癜风研究专家 http://www.bdfyy999.com/zhuanjiatuandui/102986.html

大数据时代的到来为历史学研究者带来了机遇与挑战,借助数据库方法来搜集、整理历史文献资料并进行科学研究成为越来越多的历史学研究者的选择。

地理信息系统(GeographicalInformationSystem,简称为GIS)方法因集数据整合、存储、管理、更新、分析和可视化等功能于一体,被越来越多的应用在历史地理信息平台的建设当中。本文试图分析地理信息系统在创建具有空间属性的历史数据库中的优势,并以近代西南边疆游记数据库为例,研究基于地理信息系统的历史数据库的创建及分析方法。

一、地理信息系统与历史数据库建设

随着科学技术的发展,历史学研究对文献资料的利用与分析的深度不断提高,历史数据库的建设不应该只停留在提供简单的文献资料检索上面,而是要为研究者提供一个观察环境,甚至开拓新的分析工具和研究方法。基于地理信息系统的历史数据库建设,可以实现多源数据整合与查询、空间分析和可视化展示等功能,是创建具有空间属性的历史数据库的有效途径。

地理信息系统自年被R.F.Tomlinson首次提出,随着20世纪80年代以来计算机技术的快速发展,凭借其快速处理数据和强大的可视化表达等优势,已经被广泛运用在土地利用、资源管理、环境监测、交通运输等相关的行业中。与此同时,为更好的向学术界和公众服务,许多国家纷纷建立了本国的历史地理信息系统。

在欧美地区,较有代表性的历史地理信息系统有大英历史地理信息系统(TheGreatBritainHistoricalGIS,GBHGIS)、美国国家历史地理信息系统(TheU.SNationalHistoricalGeographicInformationSystem,NHGIS)和德意志历史地理信息系统(HGISGermany:AnInformationSystemonGermanStatesandTerritoriesfrom-)等,以上国家历史地理信息系统的建设意在处理政区边界变化的时空过程,建立一套标准的精确图标化历史数据,并与人口、经济等其他统计资料进行衔接,制作专题历史地图,进而可视化这些数据的空间分布状况。

由台北“中央研究院”主持的中华文明时空基础架构(CCTS)提出要“建构以中国为空间范围,并以原始社会迄今的中国历史为时间纵深,以中国文明为内涵的整合性资讯应用环境。”提供地名查询、历史地图叠加与展示等功能。由复旦大学和哈佛大学共同创建的中国历史地理信息系统(CHGIS),试图建立一套中国历史时期连续变化的基础地理信息库,为研究者提供GIS数据平台、时间统计以及查寻工具和模型,可逐年展示基础历史地理信息,研究者下载数据后可按照需要加入自己的数据进行空间分析和专题制图,大大推进了中国历史地理基础信息(主要是行政区划)的建设进程。近年来,丝绸之路历史地理信息开放平台(SRHGIS)的建设,“针对丝绸之路沿线的环境、民族、经济、交通、文化等要素进行空间定位,利用空间数据库资源实现多学科、多角度解读丝绸之路空间走廊的发生与发展史。”尤其是该平台实现了多种空间分析模块、模拟模块和系统的嵌套与耦合,方便用户进行多类型检索、重组和数据挖掘,推动了历史地理信息系统建设的进一步发展。

地理信息系统是通过空间特征、时间特征和属性特征来表达和解释地理现象的,基于地理信息系统的历史数据库建设具有以下特点:

多源数据的融合与管理。GIS可以将多源数据资料进行整合,结构化后转化为地理空间数据,如历史文献资料、影音资料、地图资料、卫星图片等都可以整合进地理信息系统当中,并进行统一管理与更新。

空间分析功能。利用GIS方法对数据进行空间分析是一种数据挖掘、定量研究和知识发现的过程,从大量数据中挖掘出隐含的、先前未知的知识和规则,可以更好的发挥数据的价值。利用GIS方法对大量数据进行空间分析,能够准确、定量描述各种自然和人文现象的空间分布特征,进而分析空间现象的形成机理,为科学研究和决策制定提供重要的参考。

可视化展示功能。与文本和统计报表等相比,GIS以地图的方式对数据进行展示,更加直观和形象,具有一图胜千言的效果。在地理信息系统中,较为典型的可视化方法为多图层叠加与展示,将自然地理数据、人文数据和图像数据等按照需求进行叠加,可以更加直观、形象、动态地表达地理事物的空间分布与特征。

数据库是地理信息系统的核心,是地理信息系统管理、分析和展示的数据来源。地理信息系统数据库中的数据涉及到两种类型:空间数据和属性数据(非空间数据)。空间数据和属性数据必须同步才能进行查询、分析和可视化。

空间数据是指具有明确空间属性的数据,表示空间实体的位置、大小、形状及其分布特征,并可以定位于以现代地理坐标系统为参照系的地图上,如一个点的经度和纬度数据。然而历史文献中的空间信息往往是通过点(point,如县治所)、线(line,如国界线)、面(polygon,如湖泊)等地理信息来表现的,谭其骧先生主编的《中国历史地图集》是把传统的空间信息描述方法转移到以现代地理坐标为基础的现代纸质地图上,而CHGIS则是将纸质地图中的基础地理信息转移到电子地图上。属性数据是表示空间实体的属性特征,是对地理空间数据进行描述的数据,如省治所的人口数量、国界线的长度和湖泊的面积等。

在地理信息系统中,空间数据和属性数据需要具有明确空间信息的要素来承载,即载体数据。载体数据是可以承载属性数据,并落实到具体空间位置上的实体数据。如在表达区域人口分布时,与人口统计相对应的行政区就可以作为人口数据的载体,同时行政区也是作为一种地理现象而存在,具有明确的空间属性,并随时间而变化。作为载体数据,必须具有合适的空间尺度、较好的稳定性和可能性等特征。

近代西南边疆游记资料往往以游历时间为经,以游历点为纬,记载了游历过程中不同游历点的自然和人文见闻,具有较好的空间特征、时间特征和属性特征,故基于地理信息系统方法构建游记文献数据库具有较好的适用性。

二、基于文献性质和需求分析的数据库建设

近代以来,我国西南边疆危机不断加剧,外有西方列强的觊觎,内有民族和区域矛盾的升温。在此背景下,大量西方人涌入我国西南边疆地区,其中既有以商业经济和科学考察为目的的游历,也有以政治和传教为目的的探查活动。与此同时,国人也开始重视西南边疆的考察与研究,大量官方和学术团体及个人纷纷到西南边疆进行考察和游历。据相关研究的统计,自19世纪40年代中期法国传教士古伯察(Régis-EvaristeHuc)和秦噶哔(JosephGabet)自青海游历到拉萨,并于年被押解经察木多、巴塘至成都始,至年间,仅是到过康区活动的外国人就达到人,分别来自24个国家,如果以整个西南边疆地区为区域进行统计的话其数量或可达到数千人,可见其数量之大。中西方游历者对西南边疆的考察和游历留下了大量的游记资料,详细记载了近代西南边疆的民族、社会、经济、文化等方方面面,一直以来都是近代西南边疆史地、民族学、藏学、生物学等学科研究的重要学术资源宝库。

国内外学术界对近代西南边疆游记资料的整理、研究和利用方面取得了一定的成果。国外的相关研究主要集中在对游历者游历路线和历史事件的复原上,缺乏系统的整理与较为深入的研究,国内学术界的相关研究则较为深入。

首先,在游记资料的目录整理方面。民国时期一些学者即认识到国内外游记资料的重要性,进行了一定程度的整理与研究。何璟整理了关于康藏研究的中、英、日等文献目录,包括了部分中外游记目录。徐尔灏对-年间西方人在西南边疆地区次的游历路线和目的进行了论述,并对游记文献目录进行了整理。吴传钧对90余名到中国西部考察的西方人的著述进行了目录汇编。徐近之将余种西文有关西藏、青海、西康等地区的著作进行了分类编目,极大的方便了研究者对文献资料的检索与利用。王尧等的《中国藏学史(年前)》和刘洪记等编的《中国藏学论文资料索引》收录了部分中西方人在藏区的游记目录。李小缘的《云南书目》,收录了大量中西方游历者在云南游历所存留下的游记资料,并对部分游记资料进行了题解。方国瑜对近代以来中外人士在云南边疆进行考察游历的目的、路线、经过及史料价值进行了考释。萧霁虹等对近代西方人在云南的游记及其史料价值进行了论述。《民国时期总书目-历史·传记·考古·地理》亦汇编了部分中西方人士在西南边疆地区的游记资料。这些游记资料目录索引的整理有利于研究者更方便地使用游记资料进行科学研究。

其次,在游记资料的翻译与出版方面也取得了一定的成果。吴丰培的《川藏游踪汇编》辑录了二十余篇清代人的入藏游记,“考昔年入藏之途,厥分为五:一曰四川,一曰西宁,一曰云南,一曰新疆,一曰国外印度。……今汇编此类书籍,使五路进藏之途,均可遍得。”方国瑜主编的《云南史料丛刊》、边丁主编《中国边疆行纪调查记报告书等边务资料丛编》(初编、二编)、姚乐野等编《中国西南地理史料丛刊》、赵心愚等主编《康区藏族社会历史调查资料辑要》等资料汇编主要收录了中国人在近代游历西南边疆所留存的游记资料。另外,马大正主编的《民国边政史料汇编》、《民国边政史料汇编续编》、姚乐野主编的《〈康藏前锋〉〈康藏研究月刊〉〈康导月刊〉校勘影印全本》等对近代时期的西南边疆刊物和文献资料汇编也汇集了许多中西方人士在西南边疆的游记资料。

对外文游记资料的翻译出版也是游记资料整理和研究的重要工作之一,清末民国时期,西南边疆危机的出现刺激了中国学者,国内学者对这一区域,尤其是康藏地区认识的薄弱,借助国外游历者对这一区域的考察所得到的知识,既可以弥补学术界研究的不足,同时也是边疆危机背景下救亡图存的需要。如《蒙藏丛书发刊词》所言:“内地士民,尚多闭窒,蒙藏回疆,罔能认识。戈壁平沙,冈底斯域,英日俄人,著作千百。回顾我邦,何乃守默?”将西方人关于边疆之调查翻译刊发,“付之刊勒,贡献邦人,研求靡忒。注意边防,急其所急。”这些游记资料的翻译和出版对当时国人认识西南边疆社会具有重要的意义,也激起了国人对西南边疆研究和游历的热情。年代以来,对国外游记资料的翻译和出版工作具有规模性和针对性的特点,如“中国大探险丛书”、“西人中华西南行纪丛书”、“洋人眼中的西藏译丛”、“西方学者云南探险译丛”、“雪域旧旅丛书”、“西藏文明之旅书系”等。

最后,在近代西南边疆游记资料的研究方面,近代西南边疆游记资料为历史学、民族学、生物学等学科的研究提供了丰富的资料来源。任乃强在研究西南边疆史地、康藏纠纷、以及地图绘制等方面时,都非常重视和大量参考了游记资料。如在绘制《康藏标准地图》时,即大量参考中西方人在中国西南边疆游历后所绘制的地图:“余所收藏康藏地图,精粗巨细共凡余种,均经审核其精度,订正其译名,厘矫其论谬,参验以探险考察者之游记与报告书,必其确定无疑者始予绘入。……甘孜以东依谭寿田、李庚扬两氏所测定者。甘孜、昌都间各地,依英人柯尔斯、台克满二氏之图。……康南近滇之部,参依台维斯云南地图及中华民国新地图。大小凉山一带,参用法教士川南教图及常隆庆氏地质考察图。贡噶岭及康、青、川、甘间,依澳人骆克旅行图。昌都以西,西藏、青海之部,依英文土伯特与其邻部地图。”可见西方人由于使用了现代科学的考察方法和测量技术,其在西南边疆进行游历和考察后形成的文字和地图资料具有非常重要的史料价值。其后,一些专家学者利用这些游记资料对近代西南边疆进行了大量的专题研究,如冉光荣、房建昌、王川、徐君等利用游记资料对康藏基督教传播的研究,王远大、周伟洲等对中外关系的研究,罗桂环等对西南边疆生物多样性的研究等,证明了这些游记资料所具有的珍贵价值和利用潜力。

近年来,在近代西南边疆游记资料的开发与利用上达到了一个新的高潮期,出现了一批高质量的学位论文。赵艾东、向玉成、妥超群、杨梅的四篇博士学位论文分别对近代西方人在康区、安多地区和云南的考察活动进行了深入分析,对相关的游记资料进行了系统整理。曹春梅则对民国时期国人在西康的社会调查进行了研究。这些学位论文以及在此基础上发表的一系列学术文章在目录整理、利用方法和史实考订等方面推动了近代西南边疆游记研究的进一步发展。

从以上的研究回顾中可以看出,对近代西南边疆游记资料的研究在文献目录整理、利用游记资料进行专题研究、游记资料的翻译和汇编出版等方面都取得了丰硕的成果,为本文的研究提供了重要的参考。但也存在着一些问题:首先,从游记资料的整理方面上来看,主要以西方或中国的游记文献目录整理和资料的汇编、翻译为主,并以传统纸质出版的方式为主,还没有出现针对近代西南边疆游记资料所进行的数据库建设,一定程度上限制了对大量游记资料进行研究和利用的潜力。其次,从游记资料的运用上来看,仍以单篇游记资料的利用和研究为主,缺少对大量游记资料的综合利用,这主要是由于游记资料数量庞大而又分布分散所导致的。第三,以西方人的游记研究为主,对国人游记资料的研究和利用重视不够。

地理信息系统具有多源数据资料整合、空间分析与可视化等功能,基于地理信息系统的近代西南边疆游记数据库可以较好地弥补当今在近代西南边疆游记资料的整理、研究与利用上的不足。

三、近代西南边疆游记数据库结构设计

地理信息系统是对人文社会科学研究中具有时空信息的数据进行分析和研究的理想方法,针对近代西南边疆游记资料的多样性与复杂性,基于地理信息系统的近代西南边疆游记数据库建设,将建设成为一个集游记资料整合与管理、数据分析与专题地图制作、可视化展示等功能于一体的平台,为近代西南边疆游记资料整理、各学科更好地利用游记资料进行科学研究提供一个综合信息平台。在中国“一带一路”建设的大背景下,从历史的角度对近代西南边疆游记地理信息文献进行整理与研究,可以从更宏大的视角解析当今“一带一路”倡议形成的逻辑与面临的挑战。

-年间是中西方人士进入西南边疆进行考察和游历的高潮期,留存了大量的游记资料,本数据库中的历史文献资料主要集中在-年的年。近代以来,英、法、俄等国家的侵略活动除从沿海沿江向内地推进外,在西南边疆,也从南亚、东南亚等地区向我国的西南边疆地区扩展,从而实现贯通英属印度与长江流域的设想,故对我国西南边疆的探察活动多涉及今天的西藏、四川、云南和广西等地区,是本数据库文献资料搜集的重点区域。由于当时的中外游历者来自四面八方,如印度、缅甸、越南,或中国新疆和内地等,所以本数据库除对涉及我国西南边疆的资料进行搜集和整理外,对同一条游历路线涉及国外或中国其他区域的,也一并收录,以保持数据的完整性。

近代西南边疆游记数据库按内容分为三个子数据库:文献目录数据库、游记资料数据库和历史地图数据库,分别存储在相互关联的信息表中。

1.文献目录子数据库,主要记录游记文献的信息,包括文献目录信息表、游历人信息表、出版社信息表和出版刊物信息表等四个相互关联的信息表。文献目录信息表是传统文献目录整理的升级与整合,也是游记数据库建设工作的重要组成部分。文献信息表除参考既有游记目录的成果外,还将扩大目录搜集和整理的范围,编制一个更加全面的游记目录索引,并随着资料搜集的进程而不断更新。

2.游记资料子数据库,是近代西南边疆游记文献数据库的核心数据。这一子库中的数据主要包括属性数据和空间数据两部分,属性数据和空间数据的数据结构和获取方式不同,但都可以存储在关系数据库中,并使用数据库管理系统进行统一管理。

属性数据是游记资料子数据库的核心数据,主要包括游历见闻信息表、游历点信息表、图片信息表、游历路线信息表、行政区划信息表、交通信息表等六个相互关联的信息表,在MicrosoftAccess软件中设计各信息表的结构,并构建一个相互关联的关系型数据库。其中,游历见闻信息表是主表,以游历路线为线索,以游历时间为经,以游历点为纬,将每条游历路线中每个游历点的数据进行分类提取,进行二次分类与整理,分别录入到游历见闻信息表中,以便于用户按类别对某一游历点的资料进行聚类检索与利用。

在游记资料子数据库中,以具有明确空间属性的游历点为载体数据,定位在以现代地理坐标系统为参照系的电子地图上,将属性数据和空间数据连接起来。空间数据则采用多种比例尺的基础地理数据、影像数据等。基础地理数据采用全国1:万基础地理数据,包括全国范围内的行政区划、地名(包括居民地地名和自然地名)、水系(点、线、面)、居民地及设施、交通等信息。影像数据采用Google开源地图作为底图影像数据,可选择政区、地形和遥感影像等为底图以实现多种展示效果。

3.历史地图子数据库。近代以来至西南边疆游历的中西方人士,尤其是西方人利用现代的地理测绘技术测量并编绘了大量的中国西南边疆地图,是研究近代中国西南边疆史地和国界争端等问题的重要资料来源,任乃强先生曾搜集康藏与其相邻地方的地图余种,余幅,并据之编撰康藏标准地图。在历史地图子数据库中,将游记中以现代测绘技术绘制的西南边疆地图进行配准,叠加在当代基础地理信息图层上面,以方便用户查阅与利用;对于以传统方式绘制的示意图,则将其配准到其所在的大体位置。

在历史数据库结构设计的基础上,结合WebGIS、ArcGIS、PostgreSQL、HTML5、Javascript、xadmin、Django、Solr、Bootstrp、Leaflet等主流技术或成熟框架,部分关键模块利用了开源技术进行自主研发,最终实现了基于地理信息的历史数据库平台建设。

四、近代西南边疆游记数据库的功能

基于GIS的近代西南边疆游记数据库平台可以为用户提供文献资料查询、空间分析、专题地图制作和可视化展示等多种服务。

首先,书目检索。中外关于近代以来西南边疆游记资料数以千记,目前尚无一个较为完整的书目索引,游记数据库将在借鉴前人研究成果的基础上,利用当代便利的网络资源,广泛搜集中外关于近代西南边疆的游记资料,编制一个较为完整的、不断更新的书目索引。用户可按书名、作者、国籍和游历区域等对书目进行查询,对查询到的书目,数据库平台向用户提供按游历点和游历内容类别两种方式来呈现游历资料。

第二,文献检索。文献检索分为全文检索和基于空间关系的检索两种。全文检索可按关键词进行普通检索,也可以将关键词、时间、地点、交通方式、游历者等结合进行高级检索。关键词可以是人名、地名或事件。时间可进行手动输入或操作时间条进行输入。所有的检索结果都将以游历路线的形式呈现在地图上,使用者只需点击游历点即可看到经过分类整理过的游记资料全文。

基于空间关系的检索,空间实体之间存在包含、相交和邻近等多种空间关系,如点和点、点和线、点和面之间的空间关系。点与点的连接形成线,游记资料的记载具有线性的特点,考虑到使用者可能会对点与点之间的游历线路进行检索,如经过成都到拉萨的游历,我们专门设计了针对这一需求的检索方法。在进行地点检索时,可检索一个地点,也可检索两个地点,中间用and或or来进行选择,如选择and来检索两个地点,则会出现同时经过两个地点的游历路线,如果用or来检索,则会出现所有经过其中一个点的游历路线。点、线与面的关系可形成包含、相交和邻近的空间关系,在游记数据库中,我们为用户提供了点、线与面包含或相关关系的查询,如使用者可查询所有在当今西藏自治区内或经过西藏自治区的游历点或游历路线。

第三,可视化展示,包括空间和时间的可视化。在游记数据库平台上面,用户可选择不同的底图进行叠加,从全国1∶万基础地理数据、Google地图和历史地图子数据库中进行调取,如地形图、政区图、交通图和历史地图等。在用户进行全文检索时,检索结果会以游历路线的形式呈现在地图上,呈现出一幅近代西南边疆游历的路线网络。用户在进行了相关查询后,可点击游历点查看每个游历点的全文数据和照片资料等。

第四,空间分析与专题地图制作。地理信息系统最重要的一个功能就是对数据资料进行空间分析并输出专题地图。游记数据库平台提供两种空间分析方式,一种是游记数据库平台本身提供了多种空间分析工具,如游历区域和游历点的热点分析、聚类分析、叠加分析等。另一种是本数据库将支持数据下载,用户下载本数据库上的数据到个人电脑上,使用ArcGIS或Mapinfo等软件进行空间分析与专题地图制作。

第五,将传统历史文献学方法与现代科学技术相结合,不仅仅是文献资料利用的方便,还可以利用这一平台进行分析和研究,发现新的问题,形成更多的学术增长点,为近代西南边疆的民族、经济和交通的相关研究提供新的研究方法和视角,也是对GIS方法在文献数据库建设应用中的一种创新。

结论

随着科学技术的发展,历史数据库建设的目标也逐渐从单纯的文献数字化与全文检索向数据分析与挖掘的方向发展。地理信息系统因其具有的多源数据整合、空间分析与可视化等功能,被越来越多的应用在创建具有空间属性的历史数据库当中。

近代以来西南边疆游记资料往往具有较好的空间特征、时间特征和属性特征,故基于地理信息系统方法构建游记文献数据库具有较好的适用性。基于地理信息系统的近代西南边疆游记数据库建设,将建设成为一个集文献资料整合与管理、数据分析与专题地图制作、可视化展示等功能于一体的信息平台,可以较好地弥补当今在近代西南边疆游记资料的整理、研究与利用上的不足。

地理信息系统不仅仅是一种绘图工具,更是一种研究方法,在历史学研究中的应用也被受到越来越多的重视,在建设近代西南边疆游记数据库中显示出了其优越的综合性能,也可以为其他具有空间特征的历史数据库建设提供一些借鉴。

注:为了阅读方便,参考文献从略

作者简介:霍仁龙,四川大学中国西部边疆安全与发展协同创新中心助理研究员,博士,研究方向:历史地理学、数字人文、山地环境变化研究;姚勇,四川大学中国西部边疆安全与发展协同创新中心助理研究员,博士,研究方向:历史人文学、西南边疆区域社会史。

文献来源:《西南民族大学学报》(人文社会科学版),年第12期。

预览时标签不可点收录于话题#个上一篇下一篇

转载请注明:http://www.dengwendidi.com/dlnmj/18574.html
------分隔线----------------------------

热点文章

  • 没有热点文章

推荐文章

  • 没有推荐文章