GMM高斯混合模型

文章相关代码参见github:xinlp

EM算法的一个重要应用是高斯混合模型的参数估计。
高斯混合模型(Gaussian Mixed Model)指的是多个高斯分布函数的线性组合,理论上GMM可以拟合出任意类型的分布,常用于解决同一集合下的数据包含多个不同的分布的情况(或者是同一类分布但参数不一样,或者是不同类型的分布,比如正态分布和伯努利分布)。 继续阅读“GMM高斯混合模型”

EM算法学习

意图识别 <= Bi-LSTM+CRF <= 先懂CRF <= 先懂HMM <= 先懂EM
学习书籍:《概率论与数理统计》陈希儒.《统计学习方法》李航. 《PRML》神书.
此外参考了一些博客,看懂EM还是花了一些时间的,在李航那本书上做了很多笔记,所以整理出来这篇博客。

文章相关代码参见github:xinlp

这一篇就是从EM开始讲,EM的各种变量也统一是用《统计学习方法》这本书的,言归正传。 继续阅读“EM算法学习”

一个mnist的GAN

自己想从0实现一个GAN,读了很多博客,看了开始大神Ian J.Goodfellow的那篇论文,也看了一些视频(觉得还是看论文好,博客写的都是轻描淡写,胡扯一堆,一到具体公式就摸瞎,论文写的真的很清楚;还有就是原始论文都是用多层感知器,梯度上升什么的,现在变化很多,一般都会加卷积核什么东西,效果比论文里要好很多)

继续阅读“一个mnist的GAN”

Vim学习

vi编辑器是Visual Interface的简称,是linux最基本的文本编辑器。
vim是vi的加强版,定位就是开发工具,不是文本编辑工具,增加了很多适合程序编写的新功能。
参考书籍和网站:
《Linux系统命令及shell脚本实践指南》
菜鸟教程

继续阅读“Vim学习”

ES中的TransportClient学习——Java代码全记录

ES里有多种方式可以使用Java client对现有集群执行标准的index、get、delete和search操作,也可以在运行的集群上执行管理任务
获取client非常简单的。最常见的获取client的方式是创建TransportClient。
TransportClient的必须大版本是相同的,比如都是2.x或者5.x,小版本不同会有一些小问题。理想情况下,和ES的版本完全对应。
TransportClient在7.0会被声明不推荐deprecated,8.0就是完全移除。
建议用rest client,具体迁移有个说明,但还是要先懂TransportClient的功能,这也是这篇的意义。 继续阅读“ES中的TransportClient学习——Java代码全记录”

一文看完《Java多线程编程核心技术》这本书(上)

chapter1——线程基本知识

线程不同步:如果多个线程对同一个对象中的同一个实例变量进行操作,会出现值被更改、值不同步的情况,影响程序的执行流程。

关键字synchronized是在任意对象及方法上加锁,加锁的代码叫做"互斥区"或者临界区。这种方法叫做同步方法。

继续阅读“一文看完《Java多线程编程核心技术》这本书(上)”