与#模型#相关的内容第3页 - PmDaddy

全部分类数据库前端云计算

知识蒸馏、轻量化模型架构、剪枝…几种深度学习模型压缩方法

摘要：模型压缩算法旨在将一个大模型转化为一个精简的小模型。工业界的模型压缩方法有：知识蒸馏、轻量化模型架构、剪枝、量化。本文分享自华为云社区《深度学习模型压缩方法综述》，作者：嵌入式视觉。一，模型压缩技术概述因为嵌入式设备的算力和内存有限，因此深度学习模型需要经过模型压缩后，方才能部署到嵌入

详解4种模型压缩技术、模型蒸馏算法

摘要：本文主要为大家讲解关于深度学习中几种模型压缩技术、模型蒸馏算法：Patient-KD、DistilBERT、DynaBERT、TinyBERT。本文分享自华为云社区《深度学习实践篇[17]：模型压缩技术、模型蒸馏算法：Patient-KD、DistilBERT、DynaBERT、TinyBE

共探AI大模型时代下的挑战与机遇，华为云HCDE与大模型专家面对面

摘要：近日，华为开发者大会2023（cloud）“开发者生态创新发展圆桌会议”在东莞华为溪流背坡村成功举办。 2023年7月8日，华为开发者大会2023（cloud）“开发者生态创新发展圆桌会议”在东莞华为溪流背坡村成功举办。以大模型为代表的的新一轮人工智能技术浪潮汹涌而来，在圆桌会议上，华为技术专

盘古大模型加持，华为云开天aPaaS加速使能千行百业应用创新

摘要：开天aPaaS，让优秀快速复制，支撑开发者及伙伴上好云、用好云。本文分享自华为云社区《盘古大模型加持，华为云开天aPaaS加速使能千行百业应用创新》，作者：开天aPaaS小助手。 7月7-9日，华为开发者大会（Cloud）2023在东莞隆重召开。此次大会，华为云开天aPaaS带来了主题演讲、

大咖论道，大模型时代软件研发效率革命

摘要：开发者如何拥抱这波AIGC浪潮？本文分享自华为云社区《大咖论道，大模型时代软件研发效率革命》，作者：华为云社区精选。根据GitHub的一项调查，92%的受访开发者正在借助AI编码工具来完成工作和其他项目。另一方面，AI已经通过了大厂L3工程师入职测试，可自如应对数组/字符串、动态规划等技术

解决大模型“开发难”，昇思MindSpore自动并行技术应用实践

本文介绍MindSpore常用的分布式并行训练技术，以及如何将并行技术应用到大模型预训练中。

下一代MES系统架构分析与选型参考

通用模型框架层由实力大厂主导、行业/工艺层由具有行业Know-How的应用开发商ISV来承担、企业用户层由系统集成商SI/企业IT人员来实施，发挥各自优势。

跑AI大模型的K8s与普通K8s有什么不同？

在面对大模型AI火热的当下，咱们从程序员三大件“计算、存储、网络”出发，一起看看这种跑大模型AI的K8s与普通的K8s有什么区别？有哪些底层就可以构筑AI竞争的地方。

需求太多处理不过来？MoSCoW模型帮你

MoSCoW模型是在项目管理、软件开发中使用的一种排序优先级的方法，以便开发人员、产品经理、客户对每个需求交付的重要性达成共识。

大模型时代，如何快速开发AI应用

本文分享自华为云社区《【云享问答】第3期：大模型时代，如何快速开发AI应用》，作者：华为云社区精选。大模型快速普及应用的当下，AI浪潮汹涌而至，对于开发者来说，开发一款属于自己的AI应用并不是遥不可及。华为云AI生态技术专家、中科院计算所博士坐阵，从数据处理、算法开发、模型训练到部署，全方位拆解

OLOR：已开源，向预训练权值对齐的强正则化方法 | AAAI 2024

随着预训练视觉模型的兴起，目前流行的视觉微调方法是完全微调。由于微调只专注于拟合下游训练集，因此存在知识遗忘的问题。论文提出了基于权值回滚的微调方法OLOR（One step Learning, One step Review），把权值回滚项合并到优化器的权值更新项中。这保证了上下游模型权值范围的一

深度解读昇腾CANN模型下沉技术，提升模型调度性能

如何减少Host Bound模型的Device空闲时间，从而优化模型执行性能显得尤其重要，GE（Graph Engine）图引擎通过图模式的Host调度和模型下沉调度的方式，可提升模型调度性能，缩短模型E2E执行时间。

拆解LangChain的大模型记忆方案

之前我们聊过如何使用LangChain给LLM（大模型）装上记忆，里面提到对话链ConversationChain和MessagesPlaceholder，可以简化安装记忆的流程。下文来拆解基于LangChain的大模型记忆方案。

大语言模型的应用探索—AI Agent初探！

前言大语言模型的应用之一是与大语言模型进行聊天也就是一个ChatBot，这个应用已经很广泛了。接下来的一个应用就是AI Agent。 AI Agent是人工智能代理（Artificial Intelligence Agent）的概念，它是一种能够感知环境、进行决策和执行动作的智能实体，通常基于机

如何让其他模型也能在SemanticKernel中调用本地函数

在SemanticKernel的入门例子中： // Import packages using Microsoft.SemanticKernel; using Microsoft.SemanticKernel.ChatCompletion; using Microsoft.SemanticKerne

煤矿安全大模型：微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答

煤矿安全大模型————矿途智护者使用煤矿历史事故案例，事故处理报告、安全规程规章制度、技术文档、煤矿从业人员入职考试题库等数据，微调internlm2模型实现针对煤矿事故和煤矿安全知识的智能问答。本项目简介：近年来，国家对煤矿安全生产的重视程度不断提升。为了确保煤矿作业的安全，提高从业人员的安

我对《RAG/大模型/非结构化数据知识库类产品》技术架构的思考、杂谈

1、前言在6.28/29的稀土掘金开发者大会RAG专场上，我们公司CEO员外代表TorchV分享了我们在《RAG在企业应用中落地的难点与创新》其中最后分享了两个观点： AI在应用场景落地时有三个特点：功能小、质量高、价值大如果说做产品是把一横做好的话，那么去做企业落地服务就是一竖，从需求和方案

对Transformer的一些理解

在学习Transformer这个模型前对seq2seq架构有个了解时很有必要的先上图输入和输出首先理解模型时第一眼应该理解输入和输出最开始我就非常纠结有一个Inputs，一个Outputs(shift right)和一个Output Probabilities，首先需要借助这三个输入/输出来

python 无监督生成模型

本文详细介绍了python 无监督生成模型，主要介绍了无监督生成模型是生成对抗网络（Generative Adversarial Networks, GANs）的方法。

你要的AI Agent工具都在这里

只有让LLM（大模型）学会使用工具，才能做出一系列实用的AI Agent，才能发挥出LLM真正的实力。本篇，我们让AI Agent使用更多的工具，比如：外部搜索、分析CSV、文生图、执行代码等。

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化