与#模型#相关的内容第8页 - PmDaddy

全部分类数据库前端云计算

langchain中的LLM模型使用介绍

# 简介构建在大语言模型基础上的应用通常有两种，第一种叫做text completion,也就是一问一答的模式，输入是text，输出也是text。这种模型下应用并不会记忆之前的问题内容，每一个问题都是最新的。通常用来做知识库。还有一种是类似聊天机器人这种会话模式，也叫Chat models。这种

使用管道工具

HuggingFace本身就是一个模型库，包括了很多经典的模型，比如文本分类、阅读理解、完形填空、文本生成、命名实体识别、文本摘要、翻译等，这些模型即使不进行任何训练也能直接得出比较好的预测结果。pipeline是HuggingFace提供的一个非常实用的工具，但是封装程度太高，需要看源码才能理解其

基于Llama2模型的开源模型

2023年7月18日Meta开源了Llama2，在2万亿个Token上训练，可用于商业和研究，包括从7B到70B模型权重、预训练和微调的代码。相比Llama1，Llama2有较多提升，评估结果如下所示：基于Llama2模型的开源模型如下所示： 1.WizardCoder Python V1.0 h

使用自动模型

本文通过文本分类任务演示了HuggingFace自动模型使用方法，既不需要手动计算loss，也不需要手动定义下游任务模型，通过阅读自动模型实现源码，提高NLP建模能力。一.任务和数据集介绍 1.任务介绍前面章节通过手动方式定义下游任务模型，HuggingFace也提供了一些常见的预定义下游任务模

Llama2-Chinese项目：1-项目介绍和模型推理

Atom-7B与Llama2间的关系：Atom-7B是基于Llama2进行中文预训练的开源大模型。为什么叫原子呢？因为原子生万物，Llama中文社区希望原子大模型未来可以成为构建AI世界的基础单位。目前社区发布了6个模型，如下所示： FlagAlpha/Atom-7BFlagAlpha/Llama2

Llama2-Chinese项目：2.2-大语言模型词表扩充

因为原生LLaMA对中文的支持很弱，一个中文汉子往往被切分成多个token，因此需要对其进行中文词表扩展。思路通常是在中文语料库上训练一个中文tokenizer模型，然后将中文tokenizer与LLaMA原生tokenizer进行合并，最终得到一个扩展后的tokenizer模型。国内Chinese

Falcon-7B大型语言模型在心理健康对话数据集上使用QLoRA进行微调

文本是参考文献[1]的中文翻译，主要讲解了Falcon-7B大型语言模型在心理健康对话数据集上使用QLoRA进行微调的过程。项目GitHub链接为https://github.com/iamarunbrahma/finetuned-qlora-falcon7b-medical，如下所示：使用领域适

Llama2-Chinese项目：5-推理加速

随着大模型参数规模的不断增长，在有限的算力资源下，提升模型的推理速度逐渐变为一个重要的研究方向。常用的推理加速框架包含lmdeploy、FasterTransformer和vLLM等。一.lmdeploy推理部署 lmdeploy由上海人工智能实验室开发，推理使用C++/CUDA，对外提供pyth

Llama2-Chinese项目：6-模型评测

测试问题筛选自AtomBulb[1]，共95个测试问题，包含：通用知识、语言理解、创作能力、逻辑推理、代码编程、工作技能、使用工具、人格特征八个大的类别。 1.测试中的Prompt 例如对于问题"列出5种可以改善睡眠质量的方法"，如下所示： [INST] <>You are a helpf

Llama2-Chinese项目：7-外延能力LangChain集成

本文介绍了Llama2模型集成LangChain框架的具体实现，这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。 1.调用Llama2类针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py，调用代码如下

广告流量反作弊风控中的模型应用

商业化广告流量变现，媒体侧和广告主侧的作弊现象严重，损害各方的利益，基于策略和算法模型的业务风控，有效保证各方的利益；算法模型可有效识别策略无法实现的复杂作弊模型，本文首先对广告反作弊进行简介，其次介绍风控系统中常用算法模型，以及实战过程中具体风控算法模型的应用案例。

图数据挖掘：小世界网络模型和分散式搜索

哈佛大学心理学教授斯坦利·米尔格拉（Stanley Milgram）早在1967年就做过一次连锁实验，他将一些信件交给自愿的参加者，要求他们通过自己的熟人将信传到信封上指明的收信人手里。他发现，296封信件中有64封最终送到了目标人物手中。而在成功传递的信件中，平均只需要5次转发，就能够到达目标。也就是说，在社会网络中，任意两个人之间的“距离”是6。这就是所谓的六度分隔理论，也称小世界现象。尽管他

图数据挖掘：基于概率的流行病模型

这篇博客让我们来介绍基于概率的传播模型，这种模型基于对数据的观测来构建，不过不能对因果性进行建模。基于随机树的传染病模型是分支过程（branching processes）的一种变种。在这种模型中，一个病人可能接触d个其他人，对他们中的每一个都有概率q>0将其传染，接下来我们来看当d和q取何值时，流行病最终会消失（die out）

SICP：求值和环境模型（Python实现）

一个环境就是帧（frame）的一个序列，每个帧是包含着一些绑定（bindings）的表格。这些约束将一些变量名字关联于对应的值（在一个帧内，任何变量至多只有一个绑定）。每个帧还包含一个指针，指向这个帧的外围环境（enclosing environment）。如果由于当前讨论的目的，将相应的帧看做是全局（global）的，那么它将没有外围环境。一个变量相对于某个特定环境的值，也就是在这一环境中

Linux：进程模型和进程管理

在Linux系统中，执行一个程序或命令就可以触发一个进程，系统会给予这个进程一个ID，称为PID，同时根据触发这个进程的用户与相关属性关系，基于这个PID一组有效的权限设置。举个常见的例子，我们要操作系统的时候通常是利用ssh连接程序或直接在主机上登录，然后获取shell。默认的shell是bash，对应的路径为/bin/bash，那么同时间的每个人登录都是执行/bin/bash，不过每个人获取的

解读Java内存模型中Happens-Before的8个原则

摘要：本文我们就结合案例程序来说明Java内存模型中的Happens-Before原则。本文分享自华为云社区《【高并发】一文秒懂Happens-Before原则》，作者：冰河。在正式介绍Happens-Before原则之前，我们先来看一段代码。【示例一】 class VolatileExa

如何利用动态配置中心在JavaAgent中实现微服务的多样化治理

Sermant的动态配置模型不仅可以实现了微服务的动态治理，还可以提高配置的可维护性以及可读性，帮助用户更方便地进行微服务治理和运维操作。

面试官：什么是双亲委派模型？

本文已经收录进 JavaGuide（「Java学习+面试指南」一份涵盖大部分 Java 程序员所需要掌握的核心知识。）参加过校招面试的同学，应该对这个问题不陌生。一般提问 JVM 知识点的时候，就会顺带问你双亲委派模型（别扭的翻译。。。）。就算是不准备面试，学习双亲委派模型对于我们也非常有帮助。

学习下Redis内存模型

redis，对于一个java开发工程师来讲，其实算不得什么复杂新奇的技术，但可能也很少人去深入了解学习它的底层的一些东西。下面将通过对内存统计、内存划分、存储细节、对象类型&内部编码这四个模块来学习学习redis的内存模型，手字笔录，潜心修行。

说透IO多路复用模型

在说IO多路复用模型之前，我们先来大致了解下Linux文件系统。在Linux系统中，不论是你的鼠标，键盘，还是打印机，甚至于连接到本机的socket client端，都是以文件描述符的形式存在于系统中，诸如此类，等等等等，所以可以这么说，一切皆文件。

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化