中国测绘专访数喆数据创始人、总裁谭继军:专注数据 助力资源普查摸清“家底”

数喆数据谭继军:专注数据 助力资源普查摸清“家底”

党的二十大报告明确提出,加快建设数字中国,加快发展数字经济。如今,数据和数字技术越来越多地应用在各个领域,便利人们的生活。

作为新型生产要素,数据是数字化、网络化、智能化的基础,已快速融入生产、分配、流通、消费和社会服务管理等各环节,深刻改变着生产方式、生活方式和社会治理方式,对传统土地、劳动力、资本、技术等要素市场发挥了重要的驱动作用。

上海数喆数据科技有限公司创始人、总裁谭继军表示,在高质量发展的时代背景下,无论是“有用的信息是数据”,还是“有用的数据是信息”,数据在经济社会发展和产业中的应用已经被提到了非常高的高度。数字经济成为我国经济增长的新引擎和新动能,成为稳增长的重要支撑。就测绘而言,测绘产生数据,而数据相关技术和方法又提升了测绘技术手段和行业发展水平。

2016年成立的数喆数据,是一家专注于数据采集、数据分析和数据智能技术应用的国家高新技术企业和政务数据科技服务机构。数喆数据坚持“京沪引领、全国布局、基层扎根”的战略方针,不断加大创新力度,结合自身在数据技术方面的优势,与测绘技术和相关应用场景深度融合。依托统计与普查、数据分析和应用,以及数据智能化建设三类核心业务,为各级政府、企业客户提供“全流程、一站式”专业服务,助力资源普查调查摸清“家底”,使数据成果应用更好地服务千行百业。

面向“为高质量发展提供丰富的数据要素保障”这一目标要求,数喆数据如何利用数据融合技术,赋能数据要素采集、分析和智能化应用,让数据要素发挥更大的价值?面对日益增长的数据需求,数喆数据有哪些设想?《中国测绘》记者采访了谭继军,请他谈一谈对数据的理解和数喆数据在数据领域的探索实践和创新应用。

统计到普查 数喆数据以能力修身

大数据时代已经到来,并正在进入人工智能时代,我国数字经济步入了快速发展新阶段,处在从量变到质变的关键节点上,从原来的工业控制、计算机控制,到现在的智能化,向着元宇宙、人工智能方向迈进。谭继军表示,“未来,数字世界发展可能比物理世界发展更重要,有着更广阔的空间。”谭继军对数据要素有着自己的认识和见解。

以数据智能和服务创新为抓手,数喆数据凭借多年在政务统计普查工程项目、数据智能化领域深耕和积累的经验,依托“技术-产品-服务”新型政务数据服务模式,走出了一条数据采集、数据分析和数据智能技术应用的“数喆模式”。

数据显示,我国数字经济规模已经连续多年位居世界第二,数据为数字经济发展提供了重要驱动力。预计到2025年,我国产生的数据总量将达到48.6ZB,约占全球的27.8%。

人工智能(AI)技术应用的热浪一波接着一波。正当虚拟数字人还在持续学习,慢慢“长大”之时,去年底,聊天机器人程序ChatGPT横空出世,其智能水平令人震撼,由此拉开了大模型时代的帷幕。

谭继军认为,在全球科技进步和产业变革的新形势下,人工智能、大数据、云计算等新兴技术和创新模式不断涌现。大数据、大算力推动了人工智能走向大模型时代,这是大势所趋。如何运用大数据、大模型来提升生产力和竞争力,成为业界关注的主要话题。“数字经济是当前新一轮国际竞争的重点领域,而数据要素是数字经济持续发展壮大的核心引擎。在这样的背景下,我们从统计领域进入到了数据领域。”谭继军认准了数据这个新型生产要素的发展动能,带领数喆数据专注于数据领域,创新发展。

传统统计数据到大数据不仅是量的积累,更是质的飞跃。在谭继军看来,统计是基于已有结构化数据的纵向归类,大数据是基于对已有海量数据的处理,并对还未产生的数据做出预测和推荐。“统计数据+大数据”构成了现在的数据要素。而数据本身涉及到的数据采集、数据挖掘和数据利用,这些内容原来的统计领域也都有。所以,数喆数据适应时代之需,适应自身发展之需,自然而然延伸到了数据领域。

谭继军表示,站在新的起点上,数喆数据正在加快从统计模型扩展到人工智能模型和大模型技术上来,跟上时代科技步伐,实现高质量发展。公司从创业起,就一直专注于数据,专注于数据价值,在不断探索中恰好赶上了数据时代潮流这个机遇,瓜熟蒂落。这就犹如置身在湍急的河流中,要不停地奋勇向前,努力浮出水面,当巨潮把你从小河冲到大江里,你不会因为自身能力不足而被淹没。“从哲学的角度讲,是偶然和必然的关系。我们可能改变不了潮流,但可以勇敢的顺应潮流,顺应时代,体现自我价值。”谭继军如是说。

数据作为新型生产要素,是高质量发展的必然要求。数喆数据以创新驱动发展,不断提高企业核心竞争力,利用大数据技术优势助力普查成果高质量、智慧化应用,赋能千行百业。

测绘技术赋能普查数据提质增效

数据是数字经济的核心资源,作为新型生产要素,数据对提高生产效率、对全面数字化转型的作用日益凸显。随着空间信息、人工智能等新型技术的融合与发展,各级政府部门、企业和社会对普查调查数据要求也越来越高。

数喆数据借助自身算法能力和技术优势,以及与时空信息、大数据、人工智能等关键领域的集成创新,成为调查普查的“全能选手”。谭继军表示,数喆数据不仅可以做全样调查,而且工作效率高、速度快,数据处理实现秒级,助力我国数据资源普查调查摸清“家底”,确保了数据质量。

成立7年来,数喆数据先后参与过多项国家级大型统计普查和数据应用工程,如“第四次全国经济普查”“第七次全国人口普查”“第一次全国自然灾害综合风险普查”“第三次全国土壤普查”“农村宅基地基础信息调查”“林草种质资源普查”“城市地下市政基础设施普查”等项目。除此之外,还进行了许多文化和旅游领域的相关项目的研究工作,包括“文化和旅游资源普查”“文物保护单位测绘”“第四次全国文物普查”等项目。

业界常说,人类活动中80%的信息与地球上的位置有关,物体位置与所处的空间关系是人类政治、经济和社会活动的基本参考。数喆数据创新性地将测绘地理信息时空数据和技术引入到各类普查调查中,一方面赋能高质量普查;另一方面也推动了测绘地理信息技术进步。

谭继军举例说,针对正在开展的城市地下市政基础设施普查,数喆数据利用外业数据测绘调查技术优势,开发了普查数据采集移动终端,进行现场数据采集,大大提高了数据采集能力,包括建筑物、道路、控制点、管线埋深及走向等普查要素。在数据处理过程中,还利用地理信息系统(GIS)系列应用软件进行数据汇总和拼接入库。在数据资源利用方面,开发设计的“城市地下市政综合信息管理平台”与“地下市政外业采集平台”等系统工具,已在多个相关项目中得到应用。

地下管线是城市“生命线”。地下空间埋设着包括给水、排水、燃气、热力、电信、电力等几大类管线,作为“数字城市”重要支撑的地下管线系统,发挥着城市信息传递、能源输送、排涝减灾等功能,不仅是城市基础设施的重要组成部分,也是社会经济和城市健康可持续发展的重要基础和保障。所以,必须摸清线路现有的各种地下管线分布情况,为工程建设和管理提供实时准确和可靠的地下管线信息。为了避免人为因素导致数据不准,数喆数据测绘技术团队在项目中创新性地引入了电子围栏技术。“如果普查员不到井盖旁边填报调查数据,移动调查终端就会报警,终端与后台管理系统联动,做到及时发现。”谭继军说,过去地下管线普查多是通过现场督查方式进行监管。引入这一测绘技术手段后,保证了测绘数据采集的高效优质,也为守护城市一方平安贡献了数喆数据人的一份力量。

在第三次全国土壤普查中,数喆数据将多图层数据应用植入于样点校核系统中,此次技术的深度融合应用,实现了样点校核和路径规划的数字化集成,大大提升了数据准确性与工作效率。

农村宅基地基础信息调查,其精度要求更高,工作难度更大。每块宅基地有多大面积、属于哪个地块、门牌号、归属谁、家里有多少人口、身份证号等相关信息都要挂接上。底图数据有许多不相关的干扰信息,额外增加了许多工作量。数据怎么清洗?数据挂接难题如何解决?谭继军介绍,数喆数据技术团队成员经讨论后决定,重新开发一个“宅基地数据提取+属性挂接”数字模型。用技术人员的话说,凡是技术上的都不是问题,模型算法是数喆数据的看家本领。他们也不负众望,普查团队顺利完成任务。据估算,如果按传统“跑现场”方法,一个村庄,大概需要两人两天时间才能完成;采用新模型算法进行数据清洗和挂接,只需要1人半个小时就能完成。

“将各类普查数据叠加上位置信息,全链条支撑普查工作,大大提升了数据采集、处理、质检效率。”谭继军特别提到,正在全国开展的第五次全国经济普查工作,其中有一个利用遥感影像地图对建筑物进行轮廓提取的工作环节。以前提取,需要普查员跑到现场,拿着底图用手绘的方式在图上一点点勾画出来,非常费时费力费工。此次普查,数喆数据创新性地采用了遥感和模型计算相融合的提取技术,使工作效率大幅度提高。

日前,数喆数据在上海松江区新浜镇区域做了一个对比实验,普查员采用传统手绘方式进行提取,两个人用了两天时间才画完该区域建筑轮廓。而采用创新技术提取,1人用时3到5分钟就完成了。这一技术还用在了宅基地调查、风险普查等多个国家普查项目上。

就在此次采访的数天前,数喆数据在上海长宁区和徐汇区开展的第五次全国经济普查,两个区的房屋建筑轮廓提取只用了20分钟。如果采取传统“跑现场”方式,大概要二三个月才能完成。该技术不仅极大地提高了数据采集的工作效率,对整个工作进程的控制和数据质量的把控都起到很好的支撑,避免了漏画或重复劳动。

“其实,数据采集和入库都是基础工作,数据应用和数据价值的开发才是重头戏。”谭继军告诉记者,国内多地都开展了自然灾害监测预警信息化平台建设,灾害监测预警评估需要跨部门协同联合,多数据融合。然而,对水库、大坝、学校、医院、地质隐患点这些承灾体进行评估却遇到了数据壁垒难题。以城市内涝监测预警为例,下雨之后,雨水往哪里流、怎么排的、速率是多少等,需要了解城市地下管网情况,还有大江大河断面、泥沙、流量等数据支撑,以精准测算出哪些地方可能被淹、淹没深度、持续时间、人员及房屋受灾情况等等,从而将预防为先的防灾减灾理念落到实处,有效实现从减少灾害损失向减轻灾害风险转变。

“现在确实还存在数据壁垒。”谭继军坦言,让数据真正跑起来,“活”起来,需要多方统筹。我们预计,未来3到5年内,数据壁垒难题可能会得到较大改善,数据应用和数据价值开发将迎来高速发展期,数据与人民的生产和生活将结合的越来越紧密。

专注数据核心竞争力布局未来

“下一步,数喆数据有一个非常重要的发展方向,跟测绘领域关系非常大。”谭继军介绍说,数据领域分为几个层面:一是数字空间,即元宇宙领域。将来,数字政府、数字企业、数字家庭等这些应用平台的智慧大脑和神经网络系统,将由大模型来做控制,因为人工智能技术发展走到了这个时代,目前人工智能对于非常抽象的人类自然语言识别能力已经很强。或者说,目前人工智能大脑和神经网络能力已经到了一个临界点,极有可能很快就会取得突破。

在数字空间领域,数喆数据正在积极投入和探索。比如在城市和乡村空间方面,包括地面各种建筑、地下空间、地下管网等。在生态和文化空间方面,包括山川、地形、河流、海洋等各种自然和地理资源,以及这个空间里留存的各种遗迹、文物、遗址等。之所以说数字空间与测绘关系非常大,是因为数字空间的布局和建设都会交给测绘行业来完成,让专业人干专业事。

数喆数据会跟着国家普查和建设规划的进程,探索发展自己的业务。未来几年,数喆数据会在地面文物、文化遗产测绘方面展开探索。首先,对于数据资源的采集技术的研究和发展。其次,探索这些数据资源的开发和利用,包括继续探索在算法模型方面的突破性研究。

谈到数喆数据核心竞争力,在谭继军看来,第一,得益于数喆数据拥有多个领域的专家和人才队伍,他们过往的学术和教育背景,成就了数喆数据顺应潮流,顺利从统计领域进入到了数据领域,可谓近水楼台,向阳花木,甚至有一点点先发优势,天时地利人和,自然天成。当然,努力也很重要,数喆数据抓住先发优势,积极进取。

第二,数喆数据始终把研发放在核心位置。从技术维度来讲,涉及到各种各样的数据采集技术,包括统计技术、测绘技术、计算机数据集成技术等的研发和创新,让数喆数据保持在行业领先地位。从领域维度来讲,涉及到国民经济发展的各个领域、各个行业,如企业、人口、住房、建筑、土地、耕地、城乡划分、地上地下空间等,数喆数据都做了细分研究。能够把这么多领域的数据采集技术交叉结合起来去拓展业务,这是数喆数据非常重要的优势。

第三,组织管理模式创新。数喆数据不同于传统咨询机构,不同于传统服务行业,而是一个带有制造业特征的服务业。从资源获取,到加工步骤,到流程控制,到产品形成和交付,特别像制造业或建筑业的生产过程,只是说生产出来的是无形产品和服务。所以,只有在组织管理模式上创新,才能适应这种新业态,这也是数喆数据多年一直摸索和探索的一大成果,也让数喆数据更好地适应了新业态发展,并且不断推动新的组织管理创新。

“这方面我深有体会。”谭继军有感而发,比如数据采集环节,有五六道工序,每一个阶段内部、这个阶段和下一个阶段的过渡衔接,我们都进行了更精细化控制。在数据生产过程中,涉及到许多门类技术,还要适当地引入一些新技术、新模型算法,我们也都做了合理化集成,真的就像工业化大生产,多技术集成才能把一个产品生产出来。此外,就是协同,要把不同专业背景和不同技术背景的人员和团队协同起来,既有专业化的团队,又有协同化的工作组织,既有项目实施团队,又有非常强大的中后台技术。有了这样的研究团队支撑,才能推动企业高效运转,助力高质量发展。

数喆数据一步一个脚印快速成长。目前,已在全国设立39家全资子公司,办公场地面积合计超过1万平方米,全职员工2000余人(不包括每年近7000人的短时工),累计取得包括发明专利、软件著作权等百余项知识产权,覆盖数据采集、治理、应用等基础数据技术领域。在数据智能化建设方面,数喆自主研究开发了自然灾害监测预警平台、应急管理综合应用平台、统计大数据监测平台、旅游资源云平台等,助力普查数据成果和服务高质量发展。

如何加快释放数据生产要素活力,打通数据壁垒?谭继军表示,国家正在加快推进数据要素市场建设。技术就在这儿,区块链的分布式账本技术适应了数据资产的虚拟性,借助区块链能够准确记录数据资产的交易信息,可解决数据资产交易信用的问题。

“未来,在区块链技术基础上,很可能会产生和个人相关联的数据账户,与未来数据潜在需求者和使用者之间进行便捷交易。”谭继军介绍说,其实,类似的交易已经存在,比如调查问卷,只是交易成本还很高,一份简单的调查问卷可能要花几百元,对于企业来讲是无法承受之重。如果未来在区块链技术支持下,这样的交易更加便捷,保护性更好,有效信息获取效率更高,像市场调研这种业态会产生快速变化,更好地发展。

数据从“资源”变成“资产”,可以带来增量价值。“待相关法律制度和配套制度建设逐步完善以后,不光是数喆数据一家能受益,几乎对所有各方都会创造更多的价值。”谭继军憧憬着未来,那将是一个多彩的沉浸式数字生活世界:大到一个国家,小到一家企业、一个人,将业务迁移到元宇宙中来,数字人承担起虚拟与现实世界的交互。整个元宇宙场景中,一方面会有政府主导,代表全民来管理数据,通过一种交易机制让需求方去使用。另一方面还会存在非政府主导的、类似于物理场景中的菜市场,自由买卖,公平交易。

那时,每个人或许都将会有一个虚拟人分身,代自己处理很多虚拟世界的事情,数字交易也会非常便捷。假如一些交易的个人信息有公共价值,能够为企业生产生活或者为需求者创造价值的话,可能会快速交易,甚至每天每时每刻都在交易,集腋成裘,一天下来产生几百元的收入都是有可能的。