藏文,被称作“写在世界屋脊上的文字”,属汉藏语系藏缅语支,是世界上最古老的文字之一,记载和传承着藏民族悠久的文化,也是藏民族至今最基本、最广泛的交流交际工具。
21世纪以来,科技革命的浪潮席卷全球,以信息技术为标志的现代技术在改变人们生活方式的同时极大地推进了文化的发展。为适应现代信息社会,在信息技术的推动下,古老的西藏文化也迈开了自身更新、创新的大步伐,正加快与全球文化的交流和互动,藏文信息技术应运而生。藏文信息技术是用计算机对藏文的音、形、义等信息进行处理和加工的学科,它是自然语言处理的一个分支,是一门与计算机科学、藏语言学等多种学科相关联的新兴、交叉学科。
在自治区党委的关怀和支持下,西藏自上世纪80年代开始开展藏文信息技术工作,以西藏大学为代表的科研单位经过近30年的辛勤努力,建立起了完备的藏文信息处理交换标准体系,建立起了藏文信息技术人才培养的完整体系,搭建起了国内高水平藏文信息技术科研平台,推进了我国藏文信息技术工程化整体进度取得突破。我区藏文信息技术实现了跨越式发展,这对加快建设中华民族特色文化保护地、扩大西藏特色文化的国际影响力、增强我国藏族地区信息化自我发展能力、加速藏语言文字与现代化接轨的步伐等方面起到了极大的促进作用,有力地推动了西藏文化的发展和繁荣。
多年来,西藏大学积极开展跨学科藏文信息技术研究,在制定藏文信息处理交换标准体系、藏文信息技术工程化和藏文信息技术人才培养等方面取得了多项全国乃至世界领先成果。1997年,西藏大学研制出《信息技术信息交换藏文编码字符集 基本集》国际标准,使藏文成为我国少数民族语言中第一个具有国际编码标准的语言文字。之后,又相继研发了跨平台藏文输入系统、藏文文字识别系统、藏文Office办公套件等一批符合标准、技术含量高、实用性强的藏文处理技术产品及应用系统。2006年,为集中力量发展藏文信息技术,西藏大学依托计算机应用技术和藏语言文学两个重点学科,成立了藏文信息技术研究中心。中心秉承“练内力、借外力、重创新”的科研工作思路,以服务西藏经济社会发展为立脚点,以传承、保护和发展优秀藏民族文化为出发点,确定藏语自然语言处理、藏文模式识别、藏文信息安全、藏文数字媒体技术与工程、藏文嵌入式等5个研究方向,致力于藏文信息技术标准研究、藏文软件研发、藏文信息技术成果转化、人才培养、社会服务等工作。经过多年探索,西藏大学藏文信息技术研究工作取得了显著成果,研究成果广泛应用于社会各个领域,为西藏经济社会发展做出了突出贡献,先后获得国家科技进步奖二等奖1项、中国标准创新贡献奖一等奖2项、西藏自治区科学技术奖一等奖2项等。中心先后被批准为教育部工程研究中心和国家发展改革委国家地方联合工程研究中心,2009年,中心科研团队被教育部批准为“长江学者和创新团队发展计划”创新团队。
在移动互联网时代,为取得更大突破,西藏大学加强与国内高科技公司合作,强强联合,优势互补,以形成大团队,申报大项目,快出大成果。2010年,根据藏族地区对藏语语音技术的急切需求,西藏大学和科大讯飞股份有限公司结合西藏大学在藏文信息技术的积累和科大讯飞国际领先的智能语音技术,合作成立了“西藏大学语音及语言联合实验室”(以下简称“联合实验室”),主要从事藏语自然语言处理和藏语语音技术两方面研究,下设藏语资源建设组、藏语语音合成组、藏语语音识别组、藏文手写识别组、汉藏机器翻译组等小组。
经过6年的发展,联合实验室建设了大规模藏文语音语料库,突破了藏语语音、藏文联机手写、汉藏机器翻译等关键技术,研发出了一系列符合西藏经济社会发展、贴近民生的高端智能藏文软件,填补了藏语信息技术研究空白。2015年6月,联合实验室研发的汉藏机器翻译系统在西藏自治区高级人民法院进行应用,青海省高级人民法院也即将应用该系统。2016年11月,西藏大学和科大讯飞在拉萨举行“西藏大学·讯飞语音及语言联合实验室产品发布会暨藏语智能语音云平台全球首发仪式”,重磅推出了三位一体藏语输入法、汉藏互译通、PC端藏语合成系统等产品,启动了基于藏语合成、藏语识别、藏汉翻译等研究成果的藏语智能语音云平台,集中展示了西藏大学·讯飞语音及语言联合实验室成立以来取得的突出技术成果,受到广泛关注。
西藏大学·讯飞语音及语言联合实验室在藏语合成、藏语识别、藏汉翻译等方面取得的技术成果,彰显了中国智能语音技术的国际领先地位。相关语音产品应用的推出以及藏语智能语音云平台的正式发布,在加强民族交流融合、促进藏语文化保护和传承、加强藏语技术方面的创新创业等具有深远意义。
放眼未来,西藏大学将继续加强与内地兄弟高校及科研院所的合作,坚持源头核心技术的自主创新,在藏语语音及语言技术的研究及应用上不断突破,引领人工智能技术在西藏的推广应用,为雪域高原的创新发展持续贡献力量。