新闻中心

EEPW首页 > 国际视野 > 业界动态 > 俄科学家用人工智能破译古代典籍

俄科学家用人工智能破译古代典籍

作者:环球时报时间:2022-09-20来源:新浪网收藏

【环球时报综合报道】科学院西伯利亚分院蒙古学、佛学和藏学研究所收藏有藏文和蒙文古文献十余万册,称得上是古代智慧宝库,但其中只有一小部分文字被翻译成俄文。目前,该研究所东方手写文献和刻本研究中心的科学家已开始破译这些古代典籍,他们使用了系统。

本文引用地址:http://www.eepw.com.cn/article/202209/438373.htm

  教系统“阅读”

  “目前,我们正教系统阅读藏文”,该研究所所长巴扎罗夫(Boris Bazarov)院士介绍说,“为此扫描了500页手稿和刻本(木刻板印刷古代书籍),然后通过使用将藏文转换为拉丁字母的威利(Wylie)系统手动输入拉丁字母。”这500页文献成为神经网络“教材”,程序员教神经网络记住图像并将其与随附文本相关联。培训只用了2个小时,神经网络就通过了考试,已能以94%的准确率识别藏文。不过,科学家们并不满足于此。

  “藏文文字特点在于音节文字,而非字母”,东方手写文献研究中心主任林奇诺夫(Oleg Rinchinov)说,“刻本与其他文献的不同之处在于多相性——有的地方刻得比较清晰,有的地方刻得比较模糊。而且,这些文献还受到岁月蚕食。目前,还没有达到文本识别的最高准确率。”科学家认为,可将准确率提高到99%,但每提高一个百分点都需要大量细致的工作,例如要将准确率提高到95%,需要多用上千个示例“教”神经网络,准确率从95%提高到96%则需要用上万个示例。因此,该项目至少延长了5年。相比之下,一个藏学家翻译一部作品需要3年到10年。

  古代智慧宝库前景广阔

  “这是世界上首次尝试解译藏文”,巴扎罗夫院士介绍说,“翻译典章和医学文献等可以更充分地了解古代知识,而且使大量材料得以通用。尽管该项目延期,但我们的所有努力都是为了提高文本识别的准确性。之后,我们借助神经网络就能轻松地将原始文献翻译成其他语言了。”

  科学院院长谢尔盖耶夫(Alexandr Sergeev)和科学院西伯利亚分院院长帕尔蒙(Valentin Parmon)不仅从文化角度,还从实践角度对古代智慧宝库的前景予以高度评价,他们认为,医学书籍中的处方可用来制作生物活性添加剂,还可以制药,这对在布里亚特共和国建立生物医学产业集群尤其具有现实意义。

  中国药学家的启示

  “2015年中国药学家屠呦呦因发现治疗疟疾的新药获得诺贝尔奖。这种药是从青蒿中提取的,可以有效降低疟疾患者的死亡率”,巴扎罗夫举了一个现代人使用古代知识的鲜活例子,“藏族智慧还包含多少造福人类的发明?我们很快就会知道。我们发明这个算法,实现系统工作稳定后,一定会开始破译古蒙古文文献。我相信,我们在这方面也会取得科学突破。”他说。

  俄罗斯科学院西伯利亚分院蒙古学、佛学和藏学研究所收藏的古代藏文和蒙古文典籍、档案文件、音频、照片和视频属全球最大规模之一。这些稀有珍品收集了上百年。藏品中有十多万册藏文典籍和7000册古蒙古文文献,包括哲学、医学和宗教文学。最古老的文献可以追溯到16世纪。这些珍品中有约170部独立医学著作,涉及冥想方法、针刺疗法、外科手术和药理学,其中只有10%被译成了俄语。




评论


相关推荐

技术专区

关闭