您现在的位置是:科技前沿科技前沿

AI 破译失传的古代文字,被称“现代版罗塞塔石碑”

2019-07-23 14:20:46科技前沿人已围观

简介
MIT CSAIL 和谷歌大脑的研究者联合用机器学习破译了乌加里特文和线性文字 B。乌加里特文(Ugaritic)是一种楔形文字,属于闪米特语族,在公元前6000年前后就

 
http://wxioti.com:8089/admin/kindeditor/attached/image/20190715/20190715160382408240.png
       MIT CSAIL 和谷歌大脑的研究者联合用机器学习破译了乌加里特文和线性文字 B。乌加里特文(Ugaritic)是一种楔形文字,属于闪米特语族,在公元前6000年前后就初现踪迹,在公元前1190年前后灭亡。线性文字 B(Linear B)由一种人类还没有破译出来的线性文字 A 演化而来,是希腊语的一种古代书写形式,主要存活于公元前1500年到公元前1200年。



       研究者们利用同一语族内不同语言之间的联系,用机器学习的方法来破译这两种失传的语言。为了破解这两种文字,研究者们提出了一个基于字符的 seq2seq 模型。模型主要包含通用字符嵌入、剩余连接、单调排列正则化几个部分。
 
http://wxioti.com:8089/admin/kindeditor/attached/image/20190715/20190715160338443844.png
 
       其中,线性文字 B 的字母和希腊文需要进行对应。之后,借助神经解密算法,在具有不同语言特征的多种语言中提供强大的性能。
 
http://wxioti.com:8089/admin/kindeditor/attached/image/20190715/20190715160391259125.png
 
       运行成果还不错,乌加里特文在无噪声条件下优于现有方法3.1%,在有噪声条件下优于现在的贝叶斯方法5.5%。而线性文字 B,在无噪声条件下准确率高达84.7%,在更具挑战性的 Linear B 名称数据集中达到67.3%的准确度。



很赞哦! ()

  • 传感网创新示范区

锡物联:

无锡市物联网产业协会(Wuxi Association for Internet of Things Industry,简称WXIoT)是在江苏省、无锡市各部门的关心和支持下,在无锡市经济和信息化委员会、无锡市工商业联合会的业务指导下,由中国电信股份有限公司无锡分公司发起,主要集聚物联网上下游产业链中从感知层、网络层、平台层、到应用层企业组成,以“打造公信力、专业性、凝聚力的创新型互益组织,打造物联网产业服务创新生态魔方”为目标的非营利性社会组织,是引领以物联网为龙头的新一代信息技术产业、物联网科技创新的重要平台,并致力于成为与国家物联网示范城市相匹配的物联网专业协会。

Copyright© 2019 All Rights Reserved. 备案号:苏ICP备18044011号