浏览:2,937

  统计机器翻译开源工具Moses的主要负责人之一Hieu Hoang,也是Moses代码的最大贡献者在3月28日的邮件列表里发布了一个通知“Moses release”,除了告知最新的Moses源代码包的下载地址外,还列出了自上一次发布之后的12点改进,这些改进来自于Moses开源社区许许多多开发者的贡献。以下是Hieu Hoang的全文: 阅读全文

浏览:1,623

  由于工作的关系,有一段时间没有仔细关注过统计机器翻译开源系统Moses了。前些天看到哈工大郎君师兄的文章《钱老与Moses》以及近段时间有读者询问一些和Moses相关的问题,就又回到Moses的主页和它的邮件列表中找寻一些感觉。 阅读全文

浏览:2,784

  第五届全国机器翻译研讨会已于10月16日至17日在南京大学举行完毕,虽未亲自参加整个会议,但是还是比较关注这次会议的一些情况。从师弟那里得知,明年由于COLING 2010在北京举行,将不再举办机器翻译研讨会。而后年由于第十三届机器翻译峰会将在厦门举行,第六届全国机器翻译研讨会将紧随机器翻译峰会在厦门举办。 阅读全文

浏览:4,300

  Moses目前支持三个语言模型工具包:SRILM(The SRI language modeling toolkit),IRSTLM(IRST language modeling toolkit)和RandLM(the RandLM language modeling toolkit). SRILM我已经多次介绍过了,这里再介绍一下IRSTLM。 阅读全文

浏览:3,251

  打开SMT官网主页下的这个页面:http://www.statmt.org/matrix/,会发现一个漂亮的“欧洲矩阵(Euro Matrix)”,这是一个由11*11小方块组成的矩阵:在其对角线上,有欧洲11个国家的名字和国旗;而对角线之外的小方块里,则是机器翻译里的BIEU评分。这个矩阵图展示了欧盟11个国家官方语言间的110种翻译结果的BLEU评分值,而这幅图的背后,则是宏伟的EuroMatrix工程! 阅读全文

浏览:3,094

  Google吴军在《数学之美系列八》里讲贾里尼克(Frederick Jelinek)的故事时,说他离开IBM后去约翰霍普金斯大学建立了世界著名的CLSP实验室,每年夏天都会邀请世界上20-30名顶级的科学家和学生到CLSP一起工作,使得CLSP成为世界上语音和语言处理的中心之一。 阅读全文

浏览:8,158

  SRILM是著名的约翰霍普金斯夏季研讨会(Johns Hopkins Summer Workshop)的产物,诞生于1995年,由SRI实验室的Andreas Stolcke负责开发维护。 阅读全文

浏览:4,617

  众所周知,在Moses中除了语言模型的训练是利用srilm的ngram-count模块单独训练外,其它模型的训练都是利用train-factored-phrase-model.perl模型训练脚本进行一站式训练 阅读全文

浏览:2,170

  最近又要开始做些机器翻译方面的实验,于是按wmt08的介绍训练相关的模型,这些去年都做过,这次只是换用wmt08的提供的欧洲平行语料库做相关实验,却发现在利用moses的训练脚本train-factored-phrase-model.perl训练模型时出错 阅读全文

浏览:8,241

  实验室换了新机器,重新安装了最新的ubuntu8.10,这样不得不重新搭建moses测试平台。拿自己写的<<Moses相关介绍>>作参考,感觉写得不够细,这里把安装的全过程记录下来,属于一个step-by-step的过程,希望对大家有用。 阅读全文



订阅52nlp:

Add to Google Reader or Homepage



Switch to our mobile site