与#gpu#相关的内容第3页 - PmDaddy

全部分类数据库前端云计算

CUDA C编程权威指南：1-基于CUDA的异构并行计算

什么是CUDA？CUDA（Compute Unified Device Architecture,统一计算设备架构）是NVIDIA（英伟达）提出的并行计算架构，结合了CPU和GPU的优点，主要用来处理密集型及并行计算。什么是异构计算？这里的异构主要指的是主机端的CPU和设备端的GPU，CPU更擅长逻

模型部署 — PaddleNLP 基于 Paddle Serving 快速使用（服务化部署 - Docker）— 图像识别 + 信息抽取(UIE-X)

[TOC] 图像识别 + 信息抽取(UIE-X)，部署接口供别的应用调用最终在自己部署的环境中识别时报错，不知道是不是和GPU有关，还在尝试中 ## 流程 - 在百度 BML CodeLab 中跑好模型（免费算力，玩玩够了） - 下载模型（比较大，我这个有10G了，可以适当做裁剪） - Linu

一份保姆级的Stable Diffusion部署教程，开启你的炼丹之路

在经历了一系列的探索后，我为你总结出了一套零基础的、非常好上手的借助京东云GPU云主机部署安装Stable Diffusion WebUI以及相关工具和插件的保姆集教程，请查收。

【短道速滑十】非局部均值滤波的指令集优化和加速（针对5*5的搜索特例，可达到单核1080P灰度图 28ms/帧的速度）。

通过指令集以及其他优化方式加速非局部均值滤波算法的速度，比网络中公开的算法速度（CPU版本）至少快二倍以上，结合多线程技术，可以做到接近其GPU的速度。针对5*5的搜索特例，做了特别优化，可达到单核1080P灰度图 28ms/帧的速度，如果用双线程，可满足实时处理的需求。

大模型学习 - 内网环境搭建

大模型学习 - 内网环境搭建环境：内网，以下安装均为离线安装系统：Linux cdh12 3.10.0-1160.e17.x86_64 内存（377G）、GPU（P40-25G）*8）安装Anaconda 参考： linux离线环境下安装anaconda anaconda python 版本

[转帖]Harbor：修改默认的172网段

背景： harbor 默认启动会随机创建 172 网段的ip地址，跟集群规划的网段冲突 Harbor 网段修改步骤 0. 原来Harbor占用的网段 # 网桥名：harbor_harbor [root@gpunode2 test]# docker network ls NETWORK ID NAME

AlexNet论文解读

前言作为深度学习的开山之作AlexNet，确实给后来的研究者们很大的启发，使用神经网络来做具体的任务，如分类任务、回归（预测）任务等，尽管AlexNet在今天看来已经有很多神经网络超越了它，但是它依然是重要的。AlexNet的作者Alex Krizhevsky首次在两块GTX 580 GPU上做神

d3d12龙书阅读----绘制几何体（下）

d3d12龙书阅读绘制几何体（下）本节在上一节的基础上，对整个绘制过程进行优化，将绘制单个几何体的内容拓展到了多个几何体，同时对根签名进行了进一步地探索。帧资源在之前绘制每帧的结尾，我们都要使用flushingcommandqueue方法，要一直等待gpu执行完所有命令，才会继续绘制下一帧，

事实胜于雄辩,苹果MacOs能不能玩儿机器/深度(ml/dl)学习(Python3.10/Tensorflow2)

坊间有传MacOs系统不适合机器(ml)学习和深度(dl)学习，这是板上钉钉的刻板印象，就好像有人说女生不适合编程一样的离谱。现而今，无论是Pytorch框架的MPS模式，还是最新的Tensorflow2框架，都已经可以在M1/M2芯片的Mac系统中毫无桎梏地使用GPU显卡设备，本次我们来分享如何在

[转帖]Perf IPC以及CPU性能

https://plantegg.github.io/2021/05/16/Perf_IPC%E4%BB%A5%E5%8F%8ACPU%E5%88%A9%E7%94%A8%E7%8E%87/ 为了让程序能快点，特意了解了CPU的各种原理，比如多核、超线程、NUMA、睿频、功耗、GPU、大小核再到分支

[转帖]CPU的制造和概念

https://plantegg.github.io/2021/06/01/CPU%E7%9A%84%E5%88%B6%E9%80%A0%E5%92%8C%E6%A6%82%E5%BF%B5/ 为了让程序能快点，特意了解了CPU的各种原理，比如多核、超线程、NUMA、睿频、功耗、GPU、大小核再到分

如何优化大场景实时渲染？HMS Core 3D Engine这么做

在先前举办的华为开发者大会2022（HDC）上，华为通过3D数字溪村展示了自有3D引擎“HMS Core 3D Engine”（以下简称3D Engine）的强大能力。作为一款高性能、高画质、高扩展性的3D引擎，3D Engine不仅能通过实时光追、水体渲染、体积云雾、多维GPU粒子系统等技术还原真

DeepSpeed框架：1-大纲和资料梳理

DeepSpeed是一个深度学习优化软件套件，使分布式训练和推理变得简单、高效和有效。它可以做些什么呢？训练/推理具有数十亿或数万亿参数的密集或稀疏模型；实现出色的系统吞吐量并有效扩展到数千个GPU；在资源受限的GPU系统上进行训练/推理；实现前所未有的低延迟和高吞吐量的推理；以低成本实现极限压缩，

CUDA C编程权威指南：2.1-CUDA编程模型

本文主要通过例子介绍了CUDA异构编程模型，需要说明的是Grid、Block和Thread都是逻辑结构，不是物理结构。实现例子代码参考文献[2]，只需要把相应章节对应的CMakeLists.txt文件拷贝到CMake项目根目录下面即可运行。 1.Grid、Block和Thread间的关系 GPU中最

详解视频中动作识别模型与代码实践

摘要：本案例将为大家介绍视频动作识别领域的经典模型并进行代码实践。本文分享自华为云社区《视频动作识别》，作者：HWCloudAI。实验目标通过本案例的学习：掌握 C3D 模型训练和模型推理、I3D 模型推理的方法；注意事项本案例推荐使用TensorFlow-1.13.1，需使用 GPU 运

JS引擎中的线程，事件循环，上下文

线程浏览器中有哪些进程呢？ 1.浏览器进程：浏览器的主进程，负责浏览器的界面界面显示，与用户交互，网址栏输入、前进、后退，以及页面的创建和销毁。 2.渲染进程(浏览器内核)：默认一个tab页面一个渲染进程，主要的作用为页面渲染，脚本执行，事件处理等。 3.GPU进程：用于3D绘制等，将开启了3D绘

首页
上一页
1
2
3
下一页
尾页

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化