Weka学习记录

weka基本介绍

原来weka在我心里是一个很不美观的东西,因为用java做的图形用户界面一般是很丑陋的,说实话我知道的用java做GUI还稍微流行起来的就两个,citespace和weka
在发布jdk1.0的时候,当年的Sun公司希望在windows系统做出来的东西像windows风格,unix系统表现出unix风格,但是最后的结果就是十分丑陋(官方承认不够美观)

继续阅读“Weka学习记录”

ROC和AUC

ROC(Receiver Operating Characteristic,接收者操作特征)曲线和AUC常被用来评价一个二值分类器(binary classifier)的优劣,对于分类器,或者说分类算法,评价指标主要有precision,recall,F-score以及ROC和AUC。

继续阅读“ROC和AUC”

Moses 全安装记录——Ubuntu16.04

这个使用perl,c,c++什么的搞得,需要编译安装,原来这个搞的不太多,所以弄了很长时间,现在算是懂了一些安装这些工具的套路了。
看懂moses的官方教程,我觉得必须要明白一件事情,就是moses的流程是:
准备数据(分词->大小写转换->清洗)--> 训练关于某种语言的语言模型 --> 利用语言模型训练翻译模型 --> 微调 --> 测试

继续阅读“Moses 全安装记录——Ubuntu16.04”