Seq2Seq模型及注意力机制介绍
文章摘要

本文介绍了循环神经网络RNN中的一种常用架构:Seq2Seq,通常使用编码器-解码器 (Encoder-Decoder) 架构对其进行搭建;此外,本文还介绍了注意力机制,并通过一个实例展示了如何将注意力机制引入到Seq2Seq模型中


阅读正文 >>

GloVe和词嵌入介绍
文章摘要

本文第一部分介绍了将单词转换为词向量的GloVe方法,转换后的词向量可以表达不同单词之间的关联性;第二部分通过一个实例介绍了如何使用词嵌入将预训练好的词向量直接应用到实际问题中


阅读正文 >>

循环神经网络RNN介绍
文章摘要

循环神经网络RNN主要用于处理序列数据,本文第一部分介绍了RNN的基础结构;为解决RNN的梯度消失问题,增强其处理长序列的能力,本文第二部分介绍了它的两个变体:LSTM、GRU;最后本文介绍了可以同时考虑序列前后依赖的Bidirectional RNN


阅读正文 >>

EM算法和变分推断介绍
文章摘要

本文介绍了在贝叶斯统计和机器学习中的一个常用的优化方法:EM算法,以及如何使用变分推断估计EM算法中的后验概率


阅读正文 >>

使用机器学习进行时间序列预测
文章摘要

本文从数据预处理、特征提取和模型检验三个方面介绍了将时间序列的预测转化为有监督的机器学习问题的基本方法


阅读正文 >>

线性回归分析之模型基础
文章摘要

本文从数理统计的角度出发介绍了如何使用最大似然估计求解多元线性回归模型中的参数,以及如何推导参数估计值的统计分布和特性


阅读正文 >>

Siamese Network介绍
文章摘要

本文主要对孪生神经网络(Siamese Network)进行介绍,不同于一般的神经网络架构,Siamese Network主要用于衡量两个输入的相似程度


阅读正文 >>

YOLO v3算法介绍
文章摘要

本文对目标检测算法中的YOLO v3算法进行了梳理,主要介绍了算法的数据前处理、模型架构、损失函数以及模型预测


阅读正文 >>

Residual Network和Inception Network网络架构介绍
文章摘要

本文主要介绍了Residual Network以及Inception Network的特点与基本结构,并使用这些基本结构搭建了ResNet50以及GoogLeNet (Inception V1)模型

阅读正文 >>

使用迁移学习完成图像的多标签分类任务
文章摘要

本文通过一个实例介绍了如何通过迁移学习将预训练好的模型应用到图像的多标签分类问题中

阅读正文 >>

自动化特征工程—Featuretools
文章摘要

本文介绍了一个可以自动进行特征工程的python库:Featuretools,它的主要原理是针对多个数据表以及它们之间的关系,通过转换和聚合操作自动生成新的特征


阅读正文 >>

神经网络:算法推导与应用技巧
文章摘要

本文第一部分以多分类算法为例介绍了神经网络的前向传播、后向传播以及使用梯度下降进行训练;第二部分介绍了神经网络在实际应用中的一些技巧,包括参数初始化、Adam、Dropout、Mini-Batch梯度下降、Batch Normalization等


阅读正文 >>