深度学习中基础知识及概念。
损失函数:交叉熵损失、均方差损失,损失函数等。
初始化函数:随机初始化、均值初始化、Xavier初始化函数等。
Sigmoid二分类器、Softmax多分类器。
学习率:warmup概念,。
梯度下降算法,,FullBatchSGD,MiniBatchSGD。
三种主要的特征提取算子(DNN、CNN、RNN)。
DNN,深度神经网络的两个阶段:前向以及反向传播,反向传播的梯度推导。
CNN,卷积神经网络的基本概念:特征图、卷积核、步长、Padding、激活函数、感受野。
RNN,循环神经网络两个常见的单元——LSTM、GRU,多层RNN以及BidirectionalRNN等。
医学领域的常见任务。
结构化的数据,例如生理、生化数据适用的模型算法。
涉及到病历等自然语言记录的数据适用的算法。
判断某个医学影像中是否存在某种疾病,例如判断病理切片中是否是“葡萄胎”、肺CT是否存在肺炎症状。
医学影像中,需要分割出疾病区域,例如人脑补CT的肿瘤分割,皮肤病的病灶区域分割。
二、结构化数据以《淋巴癌的生存率预测》数据为例,进行结构化数据的介绍。其数据的典型特点为:
结构化数据的处理方法。
如何快速读取结构化数据。
使用pandas对数据快速进行统计学分析。
传统机器学习算法对问题进行建模。
基于scikit-learn中的算法,例如LR、SVM、RF、GBDT等常见的监督算法。
基于XGBoost的建模方法。tree_method、max_depth等重要参数的介绍。
基于LightGBM的建模方法。eta、objective等重要参数介绍。
案例上手练习:基于DNN的深度学习建模方法。
DNN模型在Tensorflow如何搭建。tensorflow中的一些主要API的参数以及用法介绍。
Tensorflow训练DNN的基本流程。model、train、lossfunction等相关技术的串联。
如何对模型进行部署测试。对于训练好的模型,使用测试集对模型的性能进行测试。
三、涉及自然语言的数据以《鼻窦炎预后效果分析》数据为例,介绍带有自然语言数据的任务的处理方法。其数据的典型特征为:
1.数据的预处理方法
文本等自然语言数据的进行分词,基于jieba分词的工具使用介绍。
字典如何输入到jieba中,使特定的单词不被分割。
去掉停用词等,保留文本的主要信息。
2.数据的编码方式
将文字信息,转化成一个向量表示。Embedding的技术。
可以考虑使用wordnet、word2vec等开源的Embedding的库,基于预训练的模型对特征进行迁移。
.案例上手练习:基于RNN的深度学习建模方法。
RNN网络如何使用Tensorflow进行搭建。
将编码好的文字信息输入到RNN当中,并且训练对应的模型。
对RNN模型进行部署测试。使用已经训练的模型对未知的数据进行测试,评估效果。
预览时标签不可点收录于话题#个上一篇下一篇