文章摘要
本文介绍了循环神经网络RNN中的一种常用架构:Seq2Seq,通常使用编码器-解码器 (Encoder-Decoder) 架构对其进行搭建;此外,本文还介绍了注意力机制,并通过一个实例展示了如何将注意力机制引入到Seq2Seq模型中
文章摘要
本文第一部分介绍了将单词转换为词向量的GloVe方法,转换后的词向量可以表达不同单词之间的关联性;第二部分通过一个实例介绍了如何使用词嵌入将预训练好的词向量直接应用到实际问题中
文章摘要
循环神经网络RNN主要用于处理序列数据,本文第一部分介绍了RNN的基础结构;为解决RNN的梯度消失问题,增强其处理长序列的能力,本文第二部分介绍了它的两个变体:LSTM、GRU;最后本文介绍了可以同时考虑序列前后依赖的Bidirectional RNN
文章摘要
本文介绍了在贝叶斯统计和机器学习中的一个常用的优化方法:EM算法,以及如何使用变分推断估计EM算法中的后验概率
文章摘要
本文从数据预处理、特征提取和模型检验三个方面介绍了将时间序列的预测转化为有监督的机器学习问题的基本方法
文章摘要
本文从数理统计的角度出发介绍了如何使用最大似然估计求解多元线性回归模型中的参数,以及如何推导参数估计值的统计分布和特性
文章摘要
本文主要对孪生神经网络(Siamese Network)进行介绍,不同于一般的神经网络架构,Siamese Network主要用于衡量两个输入的相似程度
文章摘要
本文对目标检测算法中的YOLO v3算法进行了梳理,主要介绍了算法的数据前处理、模型架构、损失函数以及模型预测
文章摘要
本文主要介绍了Residual Network以及Inception Network的特点与基本结构,并使用这些基本结构搭建了ResNet50以及GoogLeNet (Inception V1)模型
文章摘要
本文通过一个实例介绍了如何通过迁移学习将预训练好的模型应用到图像的多标签分类问题中
文章摘要
本文介绍了一个可以自动进行特征工程的python库:Featuretools,它的主要原理是针对多个数据表以及它们之间的关系,通过转换和聚合操作自动生成新的特征
文章摘要
本文第一部分以多分类算法为例介绍了神经网络的前向传播、后向传播以及使用梯度下降进行训练;第二部分介绍了神经网络在实际应用中的一些技巧,包括参数初始化、Adam、Dropout、Mini-Batch梯度下降、Batch Normalization等