与#训练#相关的内容第6页 - PmDaddy

全部分类数据库前端云计算

记一次 .NET 某设备监控系统死锁分析

一：背景 1. 讲故事上周看了一位训练营朋友的dump，据朋友说他的程序卡死了，看完之后发现是一例经典的死锁问题，蛮有意思，这个案例算是学习 .NET高级调试入门级的案例，这里和大家分享一下。二：WinDbg 分析 1. 程序为什么会卡死因为是窗体程序，所以看主线程的线程栈就好了，如果卡在

记一次 .NET某医疗器械清洗系统卡死分析

一：背景 1. 讲故事前段时间协助训练营里的一位朋友分析了一个程序卡死的问题，回过头来看这个案例比较经典，这篇稍微整理一下供后来者少踩坑吧。二：WinDbg 分析 1. 为什么会卡死因为是窗体程序，理所当然就是看主线程此时正在做什么? 可以用 ~0s ; k 看一下便知。 0:000> k #

浅聊一下 C#程序的内存映射文件玩法

## 一：背景 ### 1. 讲故事前段时间训练营里有朋友问 `内存映射文件` 是怎么玩的？说实话这东西理论我相信很多朋友都知道，就是将文件映射到进程的虚拟地址，说起来很容易，那如何让大家眼见为实呢？可能会难倒很多人，所以这篇我以自己的认知尝试让大家眼见为实。 ## 二：如何眼见为实 ### 1.

ScaleDet：AWS 基于标签相似性提出可扩展的多数据集目标检测器 | CVPR 2023

论文提出了一种可扩展的多数据集目标检测器(ScaleDet)，可通过增加训练数据集来扩大其跨数据集的泛化能力。与现有的主要依靠手动重新标记或复杂的优化来统一跨数据集标签的多数据集学习器不同，论文引入简单且可扩展的公式来为多数据集训练产生语义统一的标签空间，通过视觉文本对齐进行训练，能够学习跨数据集的

PaddleNLP UIE -- 药品说明书信息抽取(名称、规格、用法、用量）

详细描述了语料库、材料、训练、评估、预测，完整流程。对于细分场景推荐使用轻定制功能（标注少量数据进行模型微调）以进一步提升效果

Java开发者的神经网络进阶指南：深入探讨交叉熵损失函数

在本文中，我们深入探讨了交叉熵函数作为一种重要的损失函数，特别适用于神经网络训练中。交叉熵通过衡量真实标签分布与模型预测分布之间的差异，帮助优化模型的性能。我们从信息论的角度解释了交叉熵的概念，它是基于Shannon信息论中的熵而来，用于度量两个概率分布之间的差异。

LangChain结合LLM做私有化文档搜索

我们知道LLM（大语言模型）的底模是基于已经过期的公开数据训练出来的，对于新的知识或者私有化的数据LLM一般无法作答，此时LLM会出现“幻觉”。针对“幻觉”问题，一般的解决方案是采用RAG做检索增强。

【AI应用开发全流程】使用AscendCL开发板完成模型推理

从模型推理需要的开发板环境搭建到执行推理，本文主要是为大家介绍从Ascend910训练到Ascend310推理的昇腾开发全流程。

【OpenVINO™】在C#中使用 OpenVINO™ 部署 YOLOv10 模型实现目标

最近YOLO家族又添新成员：YOLOv10，YOLOv10 提出了一种一致的双任务方法，用于无nms训练的YOLOs，它同时带来了具有竞争力的性能和较低的推理延迟。此外，还介绍了整体效率-精度驱动的模型设计策略,从效率和精度两个角度对YOLOs的各个组成部分进行了全面优化，大大降低了计算开销，增强了...

大模型高效微调详解-从Adpter、PrefixTuning到LoRA

一、背景目前NLP主流范式是在大量通用数据上进行预训练语言模型训练，然后再针对特定下游任务进行微调，达到领域适应（迁移学习）的目的。指令微调是预训练语言模型微调的主流范式其目的是尽量让下游任务的形式尽量接近预训练任务，从而减少下游任务和预训练任务之间的Gap, 实现预训练语言模型适应下游任务，

Pytorch DistributedDataParallel（DDP）教程二：快速入门实践篇

一、简要回顾DDP 在上一篇文章中，简单介绍了Pytorch分布式训练的一些基础原理和基本概念。简要回顾如下： 1，DDP采用Ring-All-Reduce架构，其核心思想为：所有的GPU设备安排在一个逻辑环中，每个GPU应该有一个左邻和一个右邻，设备从它的左邻居接收数据，并将数据汇总后发送给右邻。

机器学习数据顺序随机打乱：Python实现

本文介绍基于Python语言，实现机器学习、深度学习等模型训练时，数据集打乱的具体操作~

[转帖]自动驾驶网络优化

https://cloud.tencent.com/developer/article/2003355 在自动驾驶中，需要大量的sensor信息上传到服务器进行训练。即使在车辆的行驶过程中也需要相关的sensor信息进行融合，感知。而sensor的信息可能来自不同的域，这样就需要高速稳定的网络来提供

轻松玩转70亿参数大模型！借助Walrus在AWS上部署Llama2

Llama 2 是 Meta 的下一代开源大语言模型。它是一系列经过预训练和微调的模型，参数范围从 70 亿到 700 亿个。Meta Llama 2 可免费用于研究和商业用途并且提供了一系列具有不同大小和功能的模型，因此一经发布备受关注。在[之前的文章](https://www.cnblogs.c

中文句子关系推断

本文通过ChnSentiCorp数据集介绍了中文句子关系推断任务过程，主要使用预训练语言模型bert-base-chinese直接在测试集上进行测试，也简要介绍了模型训练流程，不过最后没有保存训练好的模型。一.任务简介和数据集通过模型来判断2个句子是否连续，使用ChnSentiCorp数据集，不

Langchain-Chatchat项目：1.2-Baichuan2项目整体介绍

由百川智能推出的新一代开源大语言模型，采用2.6万亿Tokens的高质量语料训练，在多个权威的中文、英文和多语言的通用、领域benchmark上取得同尺寸最佳的效果，发布包含有7B、13B的Base和经过PPO训练的Chat版本，并提供了Chat版本的4bits量化。一.Baichuan2模型 B

git clone开启云上AI开发

摘要：相比于传统的软件开发，AI开发存在以下4个痛点：算法繁多；训练时间长；算力需求大；模型需手动管理，我们可以使用云上AI开发的方式来缓解以上4个痛点。本文分享自华为云社区《git clone开启云上AI开发》，作者：ModelArts开发者。已发布地址：https://developer.h

手把手教您在PyCharm中连接云端资源进行代码调试

摘要：ModelArts提供了一个PyCharm插件工具PyCharm ToolKit，协助用户完成代码上传、提交训练作业、将训练日志获取到本地展示等，用户只需要专注于本地的代码开发即可。本文分享自华为云社区《手把手教您在PyCharm中连接云端资源进行代码调试》，作者：Hello EI。 Mod

基于OCR进行Bert独立语义纠错实践

摘要：本案例我们利用视频字幕识别中的文字检测与识别模型，增加预训练Bert进行纠错本文分享自华为云社区《Bert特调OCR》，作者：杜甫盖房子。做这个项目的初衷是发现图比较糊/检测框比较长的时候，OCR会有一些错误识别，所以想对识别结果进行纠错。一个很自然的想法是利用语义信息进行纠错，其实在OC

JavaCV人脸识别三部曲之一：视频中的人脸保存为图片

先介绍人脸识别，再用JavaCV，将摄像头中的人脸提取出来保存为小图片，用于训练

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化