导航:首页 > 源码编译 > 医学影像深度算法

医学影像深度算法

发布时间:2023-02-15 18:24:44

❶ 智能医疗的前景怎么样

最近几年,人工智能被炒的这么火,但大家一直都在大谈特谈无人驾驶、智能家居,却在这些海市蜃楼中忘记了其实它们短时间内都难以落地,而忽略了在大数据时代就已经落地了的智能医疗。

现在,大数据已经被运用到智慧医疗方面,即让患者就医更方便、疾病诊断更加高效,以及医疗信息更加准确。更快速也更精准的在医疗行业进行多点落地。

大数据+医疗发展现状

目前国内智能医疗技术相对成熟,已有多家三甲医院引入“人工智能辅助诊断系统”,智能系统以机器人医生的形象呈现在众人面前,通过固定格式的问题和病人互动,根据症状描述开具检查单,检查结果出来后,系统自动出具诊断结论,一线临床医生再对结论予以确认。

据小智君了解,机器人上周已经跟国内200多位医学专家进行了PK,并取得时效上的明显优势。工作人员将100份患者数据输入给机器人,现场连接天河超级计算机,4.8秒钟完工。出乎意料的是,机器人的诊断与医生的原始诊断达到100%吻合。

二、数据是发展的关键

数据是“医疗+人工智能”行业发展的关键。小智君认为,医疗与人工智能结合的关键在于“算法+有效数据”。先进的算法提升数据处理效率与识别准确率,而有效数据是先进算法应用的基础。

目前,深度学习等算法的发展已经相对成熟,医疗数的“量”和“质”是阻碍人工智能在医疗行业应用发展的主要原因。

三、智能诊断与医学影像识别较为成熟

智能诊断与医学影像识别是“人工智能+医疗”发展相对成熟的两个领域。

目前,发展相对成熟的领域包括“智能诊断”和“医学影像识别”领域,两个领域的发展将分别提升“门诊”和“影像科”医疗资源的供给,解决目前医疗行业严峻的供需矛盾。

小智总结

在医疗领域,大数据有着广泛的应用空间,可以用在包括疾病预防、临床应用、互联网医疗等方面。可以说,医疗大数据是未来医疗领域的发展趋势。目前,在医疗行业应用大数据方面,我国还处于初级阶段,政府、医院及数据挖掘技术人员需要共同努力,才能让大数据在医疗领域发挥作用。

❷ 人工智能里面的深度学习是学习什么

人工智能深度学习指的自主学习和算法能力,主要锻炼的是机器人的自主学习能力,开始机器行动都是按照人们的指令和已经设置好的程序运动,深度学习后机器会具有自主学习的能力,可以根据周围环境判断行动方向和行动方式,更进一步的提高了其自主自动的能力。

❸ 医疗人工智能的要素是

1.数据

医疗人工智能系统需要医疗大数据作为基础,通过机器学习等技术形成一定的智能,用来提供辅助诊断和辅助治疗的功能。

医疗大数据主要包括医学教科书、病历尤其是针对某类疾病的病历、数字化医疗影像、学术论文等。

对于医学影像人工智能系统来说,则是需要数字化影像数据,包括CT、MRI、超声、病理等影像数据,作为机器学习的原料。

因为病历数据、数字化医疗影像数据等属于医院的知识财产,所以人工智能系统的知识产权归属原则和管理方法,需要在实践中不断探索。

3.人工智能平台的计算能力

构建一个算力强大的计算平台是人工智能开发成功的根本要素之一。因为深度学习中需要非常巨大数量的数据输入给训练模型,训练模型则需要进行巨大规模的运算来训练模型使其具有智能,所以人工智能平台的计算能力(算力)是其成功的一个关键要素。

目前,人工智能计算平台主要使用GPU芯片,医学影像人工智能系统更是依赖于GPU来进行训练和学习。也有一些AI系统使用CPU、FPGA、高性能处理器(TPU)等芯片。

❹ 自然和医学图像的深度语义分割:网络结构

原文链接: https://www.yanxishe.com/blogDetail/18223?from=jianshu0312

一、写在前面:

网络架构的设计主要是基于 CNN 结构延伸出来的。主要的改进方式有两点:新神经架构的设计(不同深度,宽度,连接性或者拓扑结构)或设计新的组件(或者层)。下面我们逐个去分析了解。

本文涉及到的论文范围如下图:

二、网络架构的改进

2.1.1 FCN

传统的 CNN 分割,为了对一个像素分类,使用该像素周围的一个图像块作为 CNN 的输入用于训练和预测。缺点很多:比如存储开销大,计算效率低,像素块大小也限制了感知域的大小。基于存在的这些问题,由 Long 等人在 2015 年提出的 FCN 结构,第一个全卷积神经网络的语义分割模型。我们要了解到的是,FCN 是基于 VGG 和 AlexNet 网络上进行预训练,然后将最后两层全连接层改为的卷积层。

FCN 具体处理过程是怎么样的?从 pool1 开始,每个 pool 后图像都会变为上个池化后图像的 1/2。Pool1 为原图的 1/2,以此类推,pool5 后为原图的 1/2^5,conv6,和 conv7 之后的图像保持不变,进行 stride=32 的反卷积,得到 FCN-32s。也就是直接对 pool5 进行 32 倍上采样获得 32 upsampled feature,再对 32 upsampled feature 每个点做 softmax prediction,就可以获得 32*upsampled prediction(分割图)。

FCN 这三个创新点有哪些? 全卷积 :用于解决逐像素的预测问题。通过将基础网络最后面几个全连接层换成卷积层,可实现任意大小的图像输入,并且输入图像大小与输入相对应。 反卷积 :端到端的像素级语义分割需要输出大小和输入图像大小一致。但是传统的 conv+pooling 结构会缩小图片尺寸。基于此作者引入反卷积(deconvolution)操作,对缩小后的特征进行上采样,恢复原始图像大小。 跳跃结构 :语义分割包括语义识别和目标定位。卷积网络的高层特征图可以有效的反应语义信息,而低层特征图可以有效反应目标的位置信息。语义分割任务同时进行语义识别和目标定位。作者提出的跨层连接结构(skip architecture),将低层的目标位置信息和高层语义信息进行融合,以此来提升语义分割性能。在此基础上进行 2 倍采样,2 倍 upsample 之后与 pool4 的像素点相加,进行 stride=16 的 upsample,为此 FCN-16s,重复上面类似的步骤,得到 FCN-8s。

了解到以上信息,应该对 FCN 有个整体的认识了。还有一些细节部分,比如 FCN 采用的简单的 softmax 分类损失函数,采用双线性差值 + 反卷积进行上采样,在微调的时候没有采用类别平衡策略。分割结果来看,FCN-8s>FCN-16s>FCN-32s。也就是说使用多层特征融合有利于提高分割准确性。

2.1.2 SegNet

SegNet 主要动机是在场景理解 。它在设计的时候考虑的是预测期间保证内存和计算时间上的效率。其中,SegNet 和 FCN 有很多相似之处,编码网络使用 VGG16 的前 13 层卷积;移除全连接;解码器使用从相应的编码器的 max-pooling indices 进行 upsampling。

对比 SegNet 和 FCN 实现 Decoder 的过程。FCN 是利用双线性插值初始化的反卷积进行上采样。而 SegNet 则是在每次 pooling 时,都存下最大值的位置,在 upsample 时将 input 值直接赋给相应的位置,其他位置的值置零。

2.1.3 U-Net

接下来,我们需要了解的是 U-Net。U-net 网络架构,由收缩路径(contracting path)和扩展路径(expanding path)组成。每一层使用两个 3 乘 3 的 conv kernel,每次卷积都进行 Relu 和 stride=2 的 maxpooling 进行下采样。四次操作后输出结果称之为 feature map。

2 乘 2 的反卷积,上采样,通道数减半,并将左边对称位置的 feature map 到右边进行 concate 操作,来融合下采样的浅层位置信息和高层语义信息。合并后在进行 3*3 的卷积操作。最后 output 之前,通道数表示分类的类别产生 N 类分割结果,最后选择出概率值最大的分割结果,作为最后的分割图。

U-Net 中常常会问为什么适用于医学图像这个问题.。首先分析医学影像数据特点:图像语义较为简单,结构较为固定:都是一个固定的器官的成像。而且器官本身结构固定,语义信息没有特别丰富,所以高级语义信息和低级特征都非常重要。(U-net 的 skip connection 可以解决这个问题);数据量少:医学影像的数据较难获取,为了防止过拟合,设计的模型不宜过大;多模态:医学影像是具有多种模态的;可解释性:医生需要进一步指导病灶在哪一层,哪一层的哪个位置,分割结果能求体积么?而且 U-Net 在自然图像分割也取得了不错的效果。

需要注意的一点:Unet 融合浅层信息是 maxpooling 之前还是之后的结果?是 maxpooling 之前的结果。因为 Maxpooling 之后会丢失准确的位置信息。

2.1.4 V-Net

V-Net 也就是 3D 的 U-net 的一种版本,3D 卷积,引入残差模块和 U-Net 的框架。整个网络分为压缩路径和非压缩路径,也就是缩小和扩大 feature maps,每个 stage 将特征缩小一半,也就是 128-128-64-32-16-8,通道上为 1-16-32-64-128-256。每个 stage 加入残差学习以加速收敛。 图中的圆圈加交叉代表卷积核为 5 乘 5 乘 5,stride 为 1 的卷积,可知 padding 为 2 乘 2 乘 2 就可以保持特征大小不变。每个 stage 的末尾使用卷积核为 2 乘 2 乘 2,stride 为 2 的卷积,特征大小减小一半(把 2x2 max-pooling 替换成了 2x2 conv.)。整个网络都是使用 keiming 等人提出的 PReLU 非线性单元。网络末尾加一个 1 乘 1 乘 1 的卷积,处理成与输入一样大小的数据,然后接一个 softmax。

而且 V-Net 采用 Dice coefficient 损失函数,如下:

Pi 为预测的前景,Gi 为标记的前景,使用这个函数能有效避免类别不平衡的问题。

2.1.5 Dense-UNet

Dense U-net(原名:one-hundred layers Tiramisu Network)该架构是由密集连接块(dense block)构建的。该架构由向下过度的两个下采样路径和向上过度的两个上采样路径组成。且同样包含两个水平跳跃连接,下采样 Dense 模块的输出与同水平的上采样 Dense 模块输入的相应特征图拼接在一起。上采样路径和下采样路径的连接模式并不完全相同:下采样路径中,每个密集块外有一条跳跃性连接,从而导致 feature map 数量线性增长,上采样中没有此操作。

主要创新点是融合了 Dense-Net 和 U-Net 网络。

2.1.6 DeepLab 系列网络

DeepLabV1:首次把空洞卷积(dilated convolution) 引入图形分割领域, 融合卷积神经网络和概率图模型:CNN + CRF,提高了分割定位精度。

DeepLabV2:ASPP (扩张空间金字塔池化):CNN+CRF。

DeepLabV3:改进 ASPP,多了 1 乘 1 卷积和全局平均池化(global avg pool);对比了级联和并联空洞卷积的效果。

DeepLabV3+:加入编解码架构思想,添加一个解码器模块来扩展 DeepLabv3;将深度可分离卷积应用于 ASPP 和解码器模块;将改进的 Xception 作为 Backbone。

2.1.7 PSPNet

PSPNet 全名是 Pyramid Scene Parsing Network(金字塔场景解析网络)。提出了金字塔池化模块(pyramid pooling mole)能够聚合不同区域的上下文信息,从而提高获取全局信息的能力。

输入图像后,使用预训练的带空洞卷积 ResNet 提取特征图。最终的特征映射大小是输入图像的 1/8;在特征图上,我们使用 C 中的金字塔池化模块收集上下文信息。使用 4 层金字塔结构,池化内核覆盖了图像的全部、一半和小部分。他们被融合为全局先验信息;在 c 的最后部分将之前的金字塔特征映射与原始特征映射 concate 起来;在进行卷积,生成 d 中的最终预测图。

总结

基于深度学习的图像语义分割模型大多遵循编码器-解码器体系结构,如 U-Net。近几年的研究成果表明,膨胀卷积和特征金字塔池可以改善 U-Net 风格的网络性能。

参考文献:

Deep Semantic Segmentation of Natural and Medical Images: A Review

阅读全文

与医学影像深度算法相关的资料

热点内容
文件夹压缩过程中点击取消压缩 浏览:215
顺丰app专享优惠券怎么用 浏览:667
酷狗音乐分享文件夹 浏览:826
服务器mgmt旁边的接口是什么 浏览:844
单片机发光二极管原理图 浏览:50
在北京当程序员6年 浏览:128
编译器gcc如何用 浏览:412
androidbringup 浏览:977
算法设计与分析英文版 浏览:911
java程序员加班吗 浏览:142
编译检查的是什么错误 浏览:405
加密兔f码生成器免费 浏览:292
思科路由器命令明文加密 浏览:171
方舟生存进化服务器如何改名字 浏览:892
央行数字货币app怎么注册 浏览:431
51单片机显示时间 浏览:770
我的世界网易版怎么压缩地图 浏览:682
qq小程序云服务器和 浏览:740
方舟服务器怎么玩才好玩 浏览:561
单片机的部件 浏览:623