与#视觉#相关的内容第3页 - PmDaddy

全部分类数据库前端云计算

最强AI直播换脸软件，DeepFaceLive下载介绍

DeepFaceLive是一款专注于直播实时换脸的AI软件，使用经过长时间训练的人脸模型替换摄像头中的人脸，能够产生接近电影质量的面部合成效果，提供高保真的视觉体验，在新版本中也支持了图片换脸（视频换脸只能预览，不能保存） · DeepFaceLive在直播场景下的效果高度逼真，强大的遮罩功能使你可

PeLK：101 x 101 的超大卷积网络，同参数量下反超 ViT | CVPR 2024

最近，有一些大型内核卷积网络的研究，但考虑到卷积的平方复杂度，扩大内核会带来大量的参数，继而引发严重的优化问题。受人类视觉的启发，论文提出了外围卷积，通过参数共享将卷积的复杂性从 \(O(K^{2})\) 降低到 \(O(\mathrm{log} K)\)，有效减少 90% 以上的参数数量并设法将内

VisionPro学习笔记（2）——图像转换工具ImageCovertTool

如果需要了解其他图像处理的文章，请移步小编的GitHub地址传送门：请点击我如果点击有误：https://github.com/LeBron-Jian/ComputerVisionPractice 前言众所周知，VisionPro是一款功能强大的机器视觉软件，用于开发和部署机器视觉应用程序。其

暗夜发光,独自闪耀,盘点网页暗黑模式(DarkMode)下的特效和动效,CSS3实现

众所周知，网页的暗黑模式可以减少屏幕反射和蓝光辐射，减少眼睛的疲劳感，特别是在夜间使用时更为明显。其实暗黑模式也给霓虹灯效应（Neon Effect）提供了发挥的环境。霓虹灯效应是一种视觉效果，其特点是在深色背景上使用鲜艳的颜色来产生强烈的视觉冲击。这种效应通常用于设计海报、广告、标志和网页等。霓

基于百度AI实现文字和图像敏感内容审核

前言百度AI是指百度公司的人工智能技术全称。它采用深度学习技术，包括自然语言处理、语音识别、计算机视觉、知识图谱等，可应用于各个领域如互联网、医疗、金融、教育、汽车、物流等。百度AI的发展将帮助人类更好地理解世界和提高生活品质，接下来就通过一个小案例演示实现百度AI在文字和图像敏感审核应用。项目

AR空间音频能力，打造沉浸式声音体验

随着元宇宙的兴起，3D虚拟现实广泛引用，让数字化信息和现实世界融合，目前大家的目光主要聚焦于视觉交互层面，为了在虚拟环境中更好的再现真实世界的三维空间体验，引入听觉层面必不可少，空间音频孕育而生。空间音频是一种音频体验，会让用户更容易体验到声音的立体感和深度，将环绕声更准确地定位在合适的方位，让用

带你读AI论文丨针对文字识别的多模态半监督方法

摘要：本文提出了一种针对文字识别的多模态半监督方法，具体来说，作者首先使用teacher-student网络进行半监督学习，然后在视觉、语义以及视觉和语义的融合特征上，都进行了一致性约束。本文分享自华为云社区《一种针对文字识别的多模态半监督方法》，作者： Hint 。摘要直到最近，公开的真实场

总结了6种卷积神经网络压缩方法

摘要：神经网络的压缩算法是，旨在将一个庞大而复杂的预训练模型（pre-trained model）转化为一个精简的小模型。本文分享自华为云社区《卷积神经网络压缩方法总结》，作者：嵌入式视觉。我们知道，在一定程度上，网络越深，参数越多，模型越复杂，其最终效果越好。神经网络的压缩算法是，旨在将一个

ReactPortals传送门

ReactPortals传送门 React Portals提供了一种将子节点渲染到父组件以外的DOM节点的解决方案，即允许将JSX作为children渲染至DOM的不同部分，最常见用例是子组件需要从视觉上脱离父容器，例如对话框、浮动工具栏、提示信息等。描述

详解神经网络基础部件BN层

摘要：在深度神经网络训练的过程中，由于网络中参数变化而引起网络中间层数据分布发生变化的这一过程被称为内部协变量偏移（Internal Covariate Shift），而 BN 可以解决这个问题。本文分享自华为云社区《神经网络基础部件-BN层详解》，作者：嵌入式视觉。一，数学基础 1.1，概率

详解神经网络中反向传播和梯度下降

摘要：反向传播指的是计算神经网络参数梯度的方法。本文分享自华为云社区《反向传播与梯度下降详解》，作者：嵌入式视觉。一，前向传播与反向传播 1.1，神经网络训练过程神经网络训练过程是：先通过随机参数“猜“一个结果（模型前向传播过程），这里称为预测结果 a；然后计算 a 与样本标签值 y 的

实践Pytorch中的模型剪枝方法

摘要：所谓模型剪枝，其实是一种从神经网络中移除"不必要"权重或偏差的模型压缩技术。本文分享自华为云社区《模型压缩-pytorch 中的模型剪枝方法实践》，作者：嵌入式视觉。一，剪枝分类所谓模型剪枝，其实是一种从神经网络中移除"不必要"权重或偏差（weigths/bias）的模型压缩技术。关于什

介绍3种ssh远程连接的方式

摘要：SSH（安全外壳协议 Secure Shell Protocol，简称SSH）是一种加密的网络传输协议，用于在网络中实现客户端和服务端的连接，典型的如我们在本地电脑通过 SSH连接远程服务器。本文分享自华为云社区《ssh 远程连接方式总结》，作者：嵌入式视觉。 SSH（安全外壳协议 Secu

详解ResNet 网络，如何让网络变得更“深”了

摘要：残差网络(ResNet)的提出是为了解决深度神经网络的“退化”（优化）问题。ResNet 通过设计残差块结构，调整模型结构，让更深的模型能够有效训练更训练。本文分享自华为云社区《Backbone 网络-ResNet 网络详解》，作者：嵌入式视觉。摘要残差网络(ResNet)的提出是为

通过4种经典应用，带你熟悉回溯算法

摘要：回溯的处理思想，有点类似枚举搜索。本文分享自华为云社区《深入浅出回溯算法》，作者：嵌入式视觉。一，如何理解回溯算法深度优先搜索算法利用的就是回溯算法思想，但它除了用来指导像深度优先搜索这种经典的算法设计之外，还可以用在很多实际的软件开发场景中，比如正则表达式匹配、编译原理中的语法分析等。

掌握动态规划，从“什么问题适合用”及“解题思路”入手

摘要：一般是用动态规划来解决最优问题。本文分享自华为云社区《深入浅出动态规划算法(中)》，作者：嵌入式视觉。一，“一个模型三个特征”理论讲解一个模型指的是适合用动态规划算法解决的问题的模型，这个模型也被定义为“多阶段决策最优解模型”。具体解释如下：一般是用动态规划来解决最优问题。而解决问题

CSS布局概念与技术教程

以下是一份CSS布局学习大纲，它涵盖了基本到高级的CSS布局概念和技术引言欢迎来到CSS教程！如果你已经掌握了HTML的基础知识，那么你即将进入一个全新的世界，通过学习CSS（Cascading Style Sheets，层叠样式表），你将能够赋予网页丰富的视觉效果和布局。CSS是前端开发中不可

ScaleDet：AWS 基于标签相似性提出可扩展的多数据集目标检测器 | CVPR 2023

论文提出了一种可扩展的多数据集目标检测器(ScaleDet)，可通过增加训练数据集来扩大其跨数据集的泛化能力。与现有的主要依靠手动重新标记或复杂的优化来统一跨数据集标签的多数据集学习器不同，论文引入简单且可扩展的公式来为多数据集训练产生语义统一的标签空间，通过视觉文本对齐进行训练，能够学习跨数据集的

Web 页面性能衡量指标-以用户为中心的效果指标

以用户为中心的性能指标是理解和改进站点体验的关键点一、以用户为中心的性能指标 1. 指标是用来干啥的？指标是用来衡量性能和用户体验的 2. 指标类型感知加载速度：网页可以多快地加载网页中的所有视觉元素并将其渲染到屏幕上加载响应速度：页面加载和执行组件快速响应用户互动所需的 JavaScrip...

牛逼！50.3K Star！一个自动将屏幕截图转换为代码的开源工具

1、背景在当今快节奏的软件开发环境中，设计师与开发者之间的协同工作显得尤为重要。然而，理解并准确实现设计稿的意图常常需要耗费大量的时间和沟通成本。为此，开源社区中出现了一个引人注目的项目——screenshot-to-code，它利用AI人工智能技术（机器学习算法和视觉分析技术），将屏幕截图自动转

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化