与#模型#相关的内容第11页 - PmDaddy

全部分类数据库前端云计算

LLM探索：环境搭建与模型本地部署

## 前言最近一直在炼丹（搞AIGC这块），突然发现业务代码都索然无味了… 上次发了篇AI画图的文章，ChatGPT虽然没法自己部署，但现在开源的LLM还是不少的，只要有一块差不多的显卡，要搞个LLM本地部署还是没问题的。本文将介绍这以下两个国产开源LLM的本地部署 - ChatGLM-6B -

LLM探索：GPT类模型的几个常用参数 Top-k, Top-p, Temperature

## 前言上一篇文章介绍了几个开源LLM的环境搭建和本地部署，在使用ChatGPT接口或者自己本地部署的LLM大模型的时候，经常会遇到这几个参数，本文简单介绍一下~ - temperature - top_p - top_k ### 关于LLM 上一篇也有介绍过，这次看到一个不错的图 >A rec

一文详解扩散模型：DDPM

我们要介绍的扩散模型的理论基础和非常重要的DDPM，扩散模型的实现并不复杂，但其背后的数学原理却非常丰富。在这里我会介绍这些重要的数学原理，省去了这些公式的推导计算，如果你对这些推导感兴趣，可以学习参

一个基于GPT模型实现的Git Commit信息自动生成工具

每次提交代码的时候，你是否有为如何写Commit Message而迟迟按不下提交的时刻呢？然后，死磨硬泡写了一些并提交后，又被review的小伙伴吐槽了呢？相信很多小伙伴有过这样的经历吧？趁着最近ChatGPT那么火，就来顺手推荐一个可以用于解决这个问题的VS Code插件：vscode-gpto

提前预体验阿里大模型“通义千问”的方法来了！

随着AI大模型的浪潮席卷全球，如今的AI技术已经颠覆了大家对传统AI的认识，微软更是用浏览器与搜索引擎上的实践，证明了当今的AI技术具备打破行业格局的能力。对于我们应用开发者来说，AI基建的建设与竞争是无法参与的，但在AI的应用领域依然大有可为！目前，国内各大科技公司已经陆续推出了各自的AI大模型

基于 Three.js 的 3D 模型加载优化

作为一个3D的项目，从用户打开页面到最终模型的渲染加载的时间也会比普通的H5项目要更长一些，从而造成大量的用户流失。为了提升首屏加载的转化率，需要尽可能的降低loading的时间。这里就分享一些我们在模型加载优化方面的心得。

MViT：性能杠杠的多尺度ViT | ICCV 2021

论文提出了多尺度视觉Transformer模型MViT，将多尺度层级特征的基本概念与Transformer模型联系起来，在逐层扩展特征复杂度同时降低特征的分辨率。在视频识别和图像分类的任务中，MViT均优于单尺度的ViT。来源：晓飞的算法工程笔记公众号论文: Multiscale Vision

为视觉语言多模态模型进行偏好优化

为视觉语言多模态模型进行偏好优化训练模型使得它能够理解并预测人类偏好是一项比较复杂的任务。诸如 SFT (Supervised finetuning) 的传统的方法一般都需要耗费较大成本，因为这些算法需要对数据打上特定的标签。而偏好优化 (Preference Optimization) 作为一种

在MoneyPrinterPlus中使用本地chatTTS语音模型

chatTTS是一个开源的优秀语音合成工具，现在你可以在MoneyPrinterPlus中轻松的使用本地chatTTS模型来为视频生成语音了。

MoneyPrinterPlus全面支持本地Ollama大模型

MoneyPrinterPlus现在支持批量混剪,一键AI生成视频，一键批量发布短视频这些功能了。之前支持的大模型是常用的云厂商，比如OpenAI,Azure,Kimi,Qianfan,Baichuan,Tongyi Qwen, DeepSeek这些。支持云厂商的原因是现在大模型使用基本都很便宜

今天我们来聊Java IO模型，BIO、NIO、AIO三种常见IO模型

一、写在开头很久没更新喽，最近build哥一直在忙着工作，忙着写小说，都忘记学习自己的本职了，哈哈，不过现在正式回归！我们继续学习Java的IO相关内容，之前我们了解到，所谓的IO（Input/Output）就是计算机系统与外部设备之间通信的过程。二、IO调用过程接下来我们从应用调用的过程中

[大数据][机器学习]之Model Card（模型卡片）介绍

每当我们在公有云或者私有云发布训练好的大数据模型，为了方便大家辨识、理解和运用，参照huggingface所制定的标准制作一个Model Card展示页，是种非常好的模型展示和组织形式。下面就是一个Model Card 的示例，我试着把它翻译成了中文，源网址，并且提供了Markdown的模板，供大

你真的了解Java内存模型JMM吗?

面试连环call： 1. 什么是Java内存模型(JMM)? 为什么需要JMM? 2. Java线程的工作内存和主内存各自的作用? 3. Java缓存一致性问题? 4. Java的并发编程问题?

灰色预测GM(1,1)模型的理论原理

灰色预测是对时间有关的灰色过程进行预测。通过建立相应的微分方程模型，从而预测事物未来发展趋势的状况。由于笔者的水平不足，本章只是概括性地介绍GM（1，1）模型的理论原理，便于对初学者的初步理解目录一、灰色系统二、GM(1,1)灰色预测模型1.生成累加数据与紧临均值生成序列2.建立预测方程与参数估

算法金 | 一个强大的算法模型，GPR ！！

大侠幸会，在下全网同名「算法金」 0 基础转 AI 上岸，多个算法赛 Top 「日更万日，让更多人享受智能乐趣」抱个拳，送个礼高斯过程回归（GPR）是一种非参数化的贝叶斯方法，用于解决回归问题。与传统的线性回归模型不同，GPR 能够通过指定的核函数捕捉复杂的非线性关系，并提供不确定性的估计。在本

一文为你深度解析LLaMA2模型架构

本文对比LLaMA1和 LLaMA2模型的技术细节，了解LLaMA2模型的内部核心算法，包括与Transformers架构的差异，以及LLaMA2与国内大模型的异同，进一步加深了大家对LLaMA的理解。

聊一聊领域驱动与贫血模型

写在前面前段时间跟领导讨论技术债概念时不可避免地提到了代码的质量，而影响代码质量的因素向来都不是单一的，诸如项目因素、管理因素、技术选型、人员素质等等，因为是技术债务，自然就从技术角度来分析，单纯从技术角度来看代码质量，其实又细分很多原因，如代码设计、代码规范、编程技巧等等，但我个人觉得这些都是技

快速调用 GLM-4-9B-Chat 语言模型

一、确认本机显卡配置二、下载大模型国内可以从魔搭社区下载，下载地址：https://modelscope.cn/models/ZhipuAI/glm-4-9b-chat/files 三、运行官方代码 import torch from transformers import AutoModel

Swin Transformer：最佳论文，准确率和性能双佳的视觉Transformer | ICCV 2021

论文提出了经典的Vision Transormer模型Swin Transformer，能够构建层级特征提高任务准确率，而且其计算复杂度经过各种加速设计，能够与输入图片大小成线性关系。从实验结果来看，Swin Transormer在各视觉任务上都有很不错的准确率，而且性能也很高来源：晓飞的算法工程

BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准

HumanEval 是一个用于评估大型语言模型 (LLM) 在代码生成任务中的参考基准，因为它使得对紧凑的函数级代码片段的评估变得容易。然而，关于其在评估 LLM 编程能力方面的有效性越来越多的担忧，主要问题是HumanEval 中的任务太简单，可能不能代表真实世界的编程任务。相比于 HumanEv

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化