与#训练营#相关的内容第8页 - PmDaddy

全部分类数据库前端云计算

PaliGemma 正式发布 — Google 最新发布的前沿开放视觉语言模型

PaliGemma 是 Google 推出的新一代视觉语言模型家族，能够接收图像与文本输入并生成文本输出。 Google 团队已推出三种类型的模型：预训练（PT）模型、混合模型和微调（FT）模型，这些模型分辨率各异，提供多种精度以便使用。所有模型均在 Hugging Face Hub 的模型库中发

PPO近段策略优化玩cartpole游戏

这个难度有些大，有两个policy，一个负责更新策略，另一个负责提供数据，实际这两个policy是一个东西，用policy1跑出一组数据给新的policy2训练，然后policy2跑数据给新的policy3训练，，，，直到policy（N-1）跑数据给新的policyN训练，过程感觉和DQN比较像，

万事通，专精部分领域的多功能 Transformer 智能体

介绍我们很高兴分享“万事通”(Jack of All Trades，简称 JAT) 项目，该项目旨在朝着通用智能体的方向发展。该项目最初是作为对 Gato (Reed 等，2022 年) 工作的公开复现启动的，Gato 提出训练一种能够执行视觉与语言以及决策任务的 Transformer。于是我们

使用小波分析和深度学习对心电图 (ECG) 进行分类 mcu-ai低成本方案 mcu-ai低成本方案

具体的软硬件实现点击 http://mcu-ai.com/ MCU-AI技术网页_MCU-AI人工智能此示例说明如何使用连续小波变换 (CWT) 和深度卷积神经网络 (CNN) 对人体心电图 (ECG) 信号进行分类。从头开始训练深度 CNN 的计算成本很高，并且需要大量的训练数据。在很多应用中

机器学习策略篇：详解开发集和测试集的大小（Size of dev and test sets）

在深度学习时代，设立开发集和测试集的方针也在变化。可能听说过一条经验法则，在机器学习中，把取得的全部数据用70/30比例分成训练集和测试集。或者如果必须设立训练集、开发集和测试集，会这么分60%训练集，20%开发集，20%测试集。在机器学习的早期，这样分是相当合理的，特别是以前的数据集大小要小得多

OpenAI的离线音频转文本模型 Whisper 的.NET封装项目

whisper介绍 Open AI在2022年9月21日开源了号称其英文语音辨识能力已达到人类水准的Whisper神经网络，且它亦支持其它98种语言的自动语音辨识。 Whisper系统所提供的自动语音辨识（Automatic Speech Recognition，ASR）模型是被训练来运行语音辨识与

GAN！生成对抗网络GAN全维度介绍与实战

> 本文为生成对抗网络GAN的研究者和实践者提供全面、深入和实用的指导。通过本文的理论解释和实际操作指南，读者能够掌握GAN的核心概念，理解其工作原理，学会设计和训练自己的GAN模型，并能够对结果进行有效的分析和评估。 > 作者 TechLead，拥有10+年互联网服务架构、AI产品研发经验、团队管

前馈神经网络解密：深入理解人工智能的基石

> 本文深入探讨了前馈神经网络（FNN）的核心原理、结构、训练方法和先进变体。通过Python和PyTorch的实战演示，揭示了FNN的多样化应用。 > 作者TechLead，拥有10+年互联网服务架构、AI产品研发经验、团队管理经验，同济本复旦硕，复旦机器人智能实验室成员，阿里云认证的资深架构师，

ChatGPT 通过谷歌算法面试，年薪 18.3 万美金

本文已收录到 AndroidFamily，技术和职场问题，请关注公众号 [彭旭锐] 提问。声明：此图片由 MidJourney 生成未经训练，不属于任何真实人物大家好，我是小彭。 2023 开年以来，全球媒体最火爆的热点莫过于一个生成式 AI 聊天机器人 —— ChatGPT，我们都被大量的信

批量生成,本地推理，人工智能声音克隆框架PaddleSpeech本地批量克隆实践(Python3.10)

云端炼丹固然是极好的，但不能否认的是，成本要比本地高得多，同时考虑到深度学习的训练相对于推理来说成本也更高，这主要是因为它需要大量的数据、计算资源和时间等资源，并且对超参数的调整也要求较高，更适合在云端进行。在推理阶段，模型的权重和参数不再调整。相反，模型根据输入数据的特征进行计算，并输出预测结果

聊聊Hugging Face

## 概述 HuggingFace是一个开源社区，提供了开源的AI研发框架、工具集、可在线加载的数据集仓库和预训练模型仓库。HuggingFace提出了一套可以依照的标准研发流程，按照该框架实施工程，能够在一定程度上规避开发混乱、开发人员水平不一致的问题，降低了项目实施的风险及项目和研发人员的耦合度

【转帖】ChatGPT的前身：InstructGPT

https://www.jianshu.com/p/6daf35cbc46a ChatGPT的论文目前还没有发布，在其官方博客（https://openai.com/blog/chatgpt/）中对方法有这样的简述：我们使用来自人类反馈的强化学习（RLHF）来训练这个模型，使用与Instructi

【转帖】什么是RLHF

什么是RLHF？ **字面翻译：**RLHF (Reinforcement Learning from Human Feedback) ，即以强化学习方式依据人类反馈优化语言模型。强化学习从人类反馈（RLHF）是一种先进的AI系统训练方法，它将强化学习与人类反馈相结合。它是一种通过将人类训练师的智

[转帖]英伟达H100市面价格飙升！Elon Musk：每个人都在买GPU

https://cj.sina.com.cn/articles/view/5115326071/130e5ae7702001w8oz?sudaref=www.baidu.com&display=0&retcode=0 据外媒CNBC报道，随着对训练和部署人工智能软件所需芯片需求的飙升，英伟达的最先进

如何解决过度拟合

更多精彩内容，欢迎关注公众号：数量技术宅，也可添加技术宅个人微信号：sljsz01，与我交流。为何产生过度拟合我们在做数据分析建模，或是量化策略回测的过程中，会模型在训练时过度拟合了历史数据（回测），导致在新数据上的预测（实盘）效果不佳。造成这种现象有以下几种原因：一是这可能是因为模型过于复杂

残差神经网络：原理与实践

VGGNet和GoogLeNet等网络都表明有足够的深度是模型表现良好的前提，但是在网络深度增加到一定程度时，更深的网络意味着更高的训练误差。误差升高的原因是网络越深，梯度弥散[还有梯度爆炸的可能性]的现象就越明显，所以在后向传播的时候，无法有效的把梯度更新到前面的网络层，靠前的网络层参数无法更新，

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese

Langchain-Chatchat项目：1.1-ChatGLM2项目整体介绍

ChatGLM2-6B是开源中英双语对话模型ChatGLM-6B的第2代版本，引入新的特性包括更长的上下文(基于FlashAttention技术，将基座模型的上下文长度由ChatGLM-6B的2K扩展到了32K，并在对话阶段使用8K的上下文长度训练)；更高效的推理(基于Multi-QueryAtte

消除视觉Transformer与卷积神经网络在小数据集上的差距

摘要：本文通过多种操作构建混合模型，增强视觉Transformer捕捉空间相关性的能力和其进行通道多样性表征的能力，弥补了Transformer在小数据集上从头训练的精度与传统的卷积神经网络之间的差距。本文分享自华为云社区《[NeurIPS 2022] 消除视觉Transformer与卷积神经网络

基于随机森林算法进行硬盘故障预测

摘要：本案例将带大家使用一份开源的S.M.A.R.T.数据集和机器学习中的随机森林算法，来训练一个硬盘故障预测模型，并测试效果。本文分享自华为云社区《基于随机森林算法进行硬盘故障预测》，作者：HWCloudAI 。实验目标掌握使用机器学习方法训练模型的基本流程；掌握使用pandas做数据分析

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化