与#gp#相关的内容第6页 - PmDaddy

全部分类数据库前端云计算

Cursor，程序员的 AI 代码编辑助手

相信大家都或多或少地听说过、了解过 chatGPT ，半个月前发布的 GPT-4 ，可谓是 AI 赛道上的一个王炸那么今天咸鱼给大家分享一个开源的 AI 代码编辑器——Cursor，让各位程序员在编程之路上一骑绝尘 :) PS：为了完整截图，本篇文章中的图片里文字有点小，请见谅介绍 Cursor

博客与AI

最近AI自动生成技术文章和答案在圈子里面引起了很大轰动，Stack Overflow暂时拒绝接收GPT生成的结果。我也经常性地浏览或者编写博客，但是最近我使用new bing或者ChatGPT的过程中，我不需要再从博客中去一篇篇搜索相关的信息，AI会直接将答案展现给我，虽然答案也不一定完全正确，但是

英伟达又向开源迈了一步「GitHub 热点速览」

大家是否还记得 2012 年，Linux 之父 Linus Torvalds 在一次活动中“愤怒”地表达了对英伟达闭源 Linux GPU 驱动的不满？这个场景曾是热门表情包，程序员人手一个。

LLM推理 - Nvidia TensorRT-LLM 与 Triton Inference Server

1. LLM部署-TensorRT-LLM与Triton 随着LLM越来越热门，LLM的推理服务也得到越来越多的关注与探索。在推理框架方面，tensorrt-llm是非常主流的开源框架，在Nvidia GPU上提供了多种优化，加速大语言模型的推理。但是，tensorrt-llm仅是一个推理框架，可以

我的日常AI使用

从去年年初开始，AI技术真正走入了我们的日常生活。从OpenAI到如今字节跳动的coze，我们通过AI大模型可以做很多事情，工具和平台众多，如何选择和使用有必要总结一下。编程和debug方面尽管gpt-4和gpt-4o确实很强，但对于持续代码改进和代码调试方面，依然不够好，并且它对于非Plus会

将强化学习重新引入 RLHF

我们很高兴在 TRL 中介绍 RLOO (REINFORCE Leave One-Out) 训练器。作为一种替代 PPO 的方法，RLOO 是一种新的在线 RLHF 训练算法，旨在使其更易于访问和实施。特别是， RLOO 需要的 GPU 内存更少，并且达到收敛所需的挂钟时间也更短。如下面的图表所示:

cuda性能优化-2.访存优化

在CUDA程序中, 访存优化个人认为是最重要的优化项. 往往kernel会卡在数据传输而不是计算上, 为了最大限度利用GPU的计算能力, 我们需要根据GPU硬件架构对kernel访存进行合理的编写.

Nivdia向量数据库图检索最新标杆——CAGRA

本文连接：https://wanger-sjtu.github.io/CARGA/ CAGRA 是 N社在RAFT项目中最新的 ANN 向量索引。这是一种高性能的、 GPU 加速的、基于图的方法，尤其是针对小批量情况进行了优化，其中每次查找只包含一个或几个查询向量。与其他像HNSW、SONG等这

改造 Kubernetes 自定义调度器

原文出处：改造 Kubernetes 自定义调度器 | Jayden's Blog (jaydenchang.top) Overview Kubernetes 默认调度器在调度 Pod 时并不关心特殊资源例如磁盘、GPU 等，因此突发奇想来改造调度器，在翻阅官方调度器框架[1]、调度器配置[2]和参

全面系统的AI学习路径，帮助普通人也能玩转AI

前言现如今AI技术和应用的发展可谓是如火如荼，它们在各个领域都展现出了巨大的潜力和影响力。AI的出现对于我们这些普通人而言也是影响匪浅，比如说使用AI工具GPT来写文档查问题、使用AI辅助编程工具帮助我们写代码、并且可是使用AI来实现人工客服等。那么普通人如何学习AI呢？别再当别人的韭菜了，今天大

Pytorch入门—Tensors张量的学习

Tensors张量的学习张量是一种特殊的数据结构，与数组和矩阵非常相似。在PyTorch中，我们使用张量来编码模型的输入和输出，以及模型的参数。张量类似于NumPy的ndarrays，只是张量可以在GPU或其他硬件加速器上运行。事实上，张量和NumPy数组通常可以共享相同的底层内存，从而无需复制

开源医疗大模型排行榜: 健康领域大模型基准测试

多年来，大型语言模型 (LLMs) 已经发展成为一项具有巨大潜力，能够彻底改变医疗行业各个方面的开创性技术。这些模型，如 GPT-3，GPT-4 和 Med-PaLM 2，在理解和生成类人文本方面表现出了卓越的能力，使它们成为处理复杂医疗任务和改善病人护理的宝贵工具。它们在多种医疗应用中显示出巨大的

LLM优化：开源星火13B显卡及内存占用优化

本文主要是针对开源星火13B的显存及内存占用过大的一个代码优化。核心思想是使用CPU预加载模型，再转换至GPU。

Pytorch DistributedDataParallel（DDP）教程二：快速入门实践篇

一、简要回顾DDP 在上一篇文章中，简单介绍了Pytorch分布式训练的一些基础原理和基本概念。简要回顾如下： 1，DDP采用Ring-All-Reduce架构，其核心思想为：所有的GPU设备安排在一个逻辑环中，每个GPU应该有一个左邻和一个右邻，设备从它的左邻居接收数据，并将数据汇总后发送给右邻。

微软开源了一个助力开发LLM 加持的应用的工具包 semantic-kernel

在首席执行官萨蒂亚·纳德拉（Satya Nadella）的支持下，微软似乎正在迅速转变为一家以人工智能为中心的公司。最近微软的众多产品线都采用GPT-4加持，从Microsoft 365等商业产品到“新必应”搜索引擎，再到低代码/无代码Power Platform等面向开发的产品，包括软件开发组件P

解码Transformer：自注意力机制与编解码器机制详述与代码实现

> 本文全面探讨了Transformer及其衍生模型，深入分析了自注意力机制、编码器和解码器结构，并列举了其编码实现加深理解，最后列出基于Transformer的各类模型如BERT、GPT等。文章旨在深入解释Transformer的工作原理，并展示其在人工智能领域的广泛影响。 > 作者 TechLe

pytorch学习笔记——timm库

当使用ChatGPT帮我们工作的时候，确实很大一部分人就会失业，当然也有很大一部分人收益其中。我今天继续使用其帮我了解新的内容，也就是timm库。毫不夸张的说，Chat GPT比百分之80的博客讲的更清楚更好，仅次于源码。当提到计算机视觉的深度学习框架时，PyTorch无疑是最受欢迎的选择之一。P

探索ChatGPT的Fine-tuning和Embeddings

1.概述今天我们将深入探索ChatGPT的两项核心技术：Fine-tuning（微调）和Embeddings（嵌入）。这些技术在现代自然语言处理领域扮演着至关重要的角色，为模型的性能提升和适应特定任务需求提供了关键支持。ChatGPT作为GPT家族的一员，已经在多个领域展现了出色的表现，而其背后的

[转帖]英特尔正式发布第四代Xeon至强可扩展处理器，Intel7工艺；i9-13900KS首秀，开箱即用六个G

https://new.qq.com/rain/a/20230111A06IFM00 11 日消息，英特尔今日正式发布了第四代至强可扩展处理器（代号 Sapphire Rapids）和至强 CPU Max 系列（代号 Sapphire Rapids HBM），以及英特尔数据中心 GPU Max 系列

[转帖]Linux系统下rpm命令使用详解

简介 rpm命令是RPM软件包的管理工具。rpm原本是Red Hat Linux发行版专门用来管理Linux各项套件的程序，由于它遵循GPL规则且功能强大方便，因而广受欢迎。逐渐受到其他发行版的采用。RPM套件管理方式的出现，让Linux易于安装，升级，间接提升了Linux的适用度。 rpm命令十分

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化