与#飞腾#相关的内容第2页 - PmDaddy

全部分类数据库前端云计算

OLOR：已开源，向预训练权值对齐的强正则化方法 | AAAI 2024

随着预训练视觉模型的兴起，目前流行的视觉微调方法是完全微调。由于微调只专注于拟合下游训练集，因此存在知识遗忘的问题。论文提出了基于权值回滚的微调方法OLOR（One step Learning, One step Review），把权值回滚项合并到优化器的权值更新项中。这保证了上下游模型权值范围的一

ScaleDet：AWS 基于标签相似性提出可扩展的多数据集目标检测器 | CVPR 2023

论文提出了一种可扩展的多数据集目标检测器(ScaleDet)，可通过增加训练数据集来扩大其跨数据集的泛化能力。与现有的主要依靠手动重新标记或复杂的优化来统一跨数据集标签的多数据集学习器不同，论文引入简单且可扩展的公式来为多数据集训练产生语义统一的标签空间，通过视觉文本对齐进行训练，能够学习跨数据集的

SURE：增强不确定性估计的组合拳，快加入到你的训练指南吧 | CVPR 2024

论文重新审视了深度神经网络中的不确定性估计技术，并整合了一套技术以增强其可靠性。论文的研究表明，多种技术（包括模型正则化、分类器改造和优化策略）的综合应用显着提高了图像分类任务中不确定性预测的准确性来源：晓飞的算法工程笔记公众号论文: SURE: SUrvey REcipes for buil

MViTv2：Facebook出品，进一步优化的多尺度ViT | CVPR 2022

论文将Multiscale Vision Transformers (MViTv2) 作为图像和视频分类以及对象检测的统一架构进行研究，结合分解的相对位置编码和残差池化连接提出了MViT的改进版本来源：晓飞的算法工程笔记公众号论文: MViTv2: Improved Multiscale Vi

MViT：性能杠杠的多尺度ViT | ICCV 2021

论文提出了多尺度视觉Transformer模型MViT，将多尺度层级特征的基本概念与Transformer模型联系起来，在逐层扩展特征复杂度同时降低特征的分辨率。在视频识别和图像分类的任务中，MViT均优于单尺度的ViT。来源：晓飞的算法工程笔记公众号论文: Multiscale Vision

LeViT：Facebook提出推理优化的混合ViT主干网络 | ICCV 2021

论文提出了用于快速图像分类推理的混合神经网络LeVIT，在不同的硬件平台上进行不同的效率衡量标准的测试。总体而言，LeViT在速度/准确性权衡方面明显优于现有的卷积神经网络和ViT，比如在80%的ImageNet top-1精度下，LeViT在CPU上比EfficientNet快5倍来源：晓飞的算

CaiT：Facebook提出高性能深度ViT结构 | ICCV 2021

CaiT通过LayerScale层来保证深度ViT训练的稳定性，加上将特征学习和分类信息提取隔离的class-attention层达到了很不错的性能，值得看看来源：晓飞的算法工程笔记公众号论文: Going deeper with Image Transformers 论文地址：https:/

还在困惑需要多少数据吗？来看看这份估计指南 | CVPR 2022

论文基于实验验证，为数据需求预测这一问题提供了比较有用的建议，详情可以直接看看Conclusion部分。来源：晓飞的算法工程笔记公众号论文: How Much More Data Do I Need? Estimating Requirements for Downstream Tasks 论

CvT：微软提出结合CNN的ViT架构 | 2021 arxiv

CvT将Transformer与CNN在图像识别任务中的优势相结合，从CNN中借鉴了多阶段的层级结构设计，同时引入了Convolutional Token Embedding和Convolutional Projection操作增强局部建模能力，在保持计算效率的同时实现了卓越的性能。此外，由于卷积的

DeepViT：字节提出深层ViT的训练策略 | 2021 arxiv

作者发现深层ViT出现的注意力崩溃问题，提出了新颖的Re-attention机制来解决，计算量和内存开销都很少，在增加ViT深度时能够保持性能不断提高来源：晓飞的算法工程笔记公众号论文: DeepViT: Towards Deeper Vision Transformer 论文地址：https

DDP：微软提出动态detection head选择，适配计算资源有限场景 | CVPR 2022

DPP能够对目标检测proposal进行非统一处理，根据proposal选择不同复杂度的算子，加速整体推理过程。从实验结果来看，效果非常不错来源：晓飞的算法工程笔记公众号论文: Should All Proposals be Treated Equally in Object Detectio

DVT：华为提出动态级联Vision Transformer，性能杠杠的 | NeurIPS 2021

论文主要处理Vision Transformer中的性能问题，采用推理速度不同的级联模型进行速度优化，搭配层级间的特征复用和自注意力关系复用来提升准确率。从实验结果来看，性能提升不错来源：晓飞的算法工程笔记公众号论文: Not All Images are Worth 16x16 Words:

Swin Transformer：最佳论文，准确率和性能双佳的视觉Transformer | ICCV 2021

论文提出了经典的Vision Transormer模型Swin Transformer，能够构建层级特征提高任务准确率，而且其计算复杂度经过各种加速设计，能够与输入图片大小成线性关系。从实验结果来看，Swin Transormer在各视觉任务上都有很不错的准确率，而且性能也很高来源：晓飞的算法工程

讯飞有一个可以根据描述文本自动生成PPT的AI接口，有趣

文档：https://www.xfyun.cn/doc/spark/PPTGeneration.html 价格方面提供了免费1000点的额度，生成一次是10点，正好100次，如果要购买的话最低要购买1344元的，没有按量付费的模式，个人小开发者可买不起。让我们跑起来玩玩，官方提供了python的s

Github Fork仓库的冲突与同步管理

在使用Github进行协作开发时，fork一个仓库并在本地进行开发是常见的工作流程。然而，当源仓库（上游仓库）有了更新时，如何同步这些更新并解决可能的合并冲突是一个关键问题。本文将详细介绍如何管理这些操作。步骤一：Fork并克隆仓库首先，fork你感兴趣的源仓库，并将其克隆到本地： git cl

CeiT：商汤提出结合CNN优势的高效ViT模型 | 2021 arxiv

论文提出CeiT混合网络，结合了CNN在提取低维特征方面的局部性优势以及Transformer在建立长距离依赖关系方面的优势。CeiT在ImageNet和各种下游任务中达到了SOTA，收敛速度更快，而且不需要大量的预训练数据和额外的CNN蒸馏监督，值得借鉴来源：晓飞的算法工程笔记公众号论文:

PVT：特征金字塔在Vision Transormer的首次应用，又快又好 | ICCV 2021

论文设计了用于密集预测任务的纯Transformer主干网络PVT，包含渐进收缩的特征金字塔结构和spatial-reduction attention层，能够在有限的计算资源和内存资源下获得高分辨率和多尺度的特征图。从物体检测和语义分割的实验可以看到，PVT在相同的参数数量下比CNN主干网络更强大

T2T-ViT：更多的局部结构信息，更高效的主干网络 | ICCV 2021

论文提出了T2T-ViT模型，引入tokens-to-token（T2T）模块有效地融合图像的结构信息，同时借鉴CNN结果设计了deep-narrow的ViT主干网络，增强特征的丰富性。在ImageNet上从零训练时，T2T-ViT取得了优于ResNets的性能MobileNets性能相当来源：晓

CSS布局概念与技术教程

以下是一份CSS布局学习大纲，它涵盖了基本到高级的CSS布局概念和技术引言欢迎来到CSS教程！如果你已经掌握了HTML的基础知识，那么你即将进入一个全新的世界，通过学习CSS（Cascading Style Sheets，层叠样式表），你将能够赋予网页丰富的视觉效果和布局。CSS是前端开发中不可

SpringBoot项目添加2FA双因素身份认证

什么是 2FA（双因素身份验证）? 双因素身份验证（2FA）是一种安全系统，要求用户提供两种不同的身份验证方式才能访问某个系统或服务。国内普遍做短信验证码这种的用的比较少，不过在国外的网站中使用双因素身份验证的还是很多的。用户通过使用验证器扫描二维码，就能在app上获取登录的动态口令，进一步加强了账

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化