与#llm#相关的内容第3页 - PmDaddy

全部分类数据库前端云计算

解密Prompt系列16. LLM对齐经验之数据越少越好？LTD & LIMA & AlpaGasus

总结下指令微调、对齐样本筛选相关的方案包括LIMA，LTD等。论文都是以优化指令样本为核心，提出对齐阶段的数据质量优于数量，少量+多样+高质量的对齐数据，就能让你快速拥有效果杠杠的模型

拆解LangChain的大模型记忆方案

之前我们聊过如何使用LangChain给LLM（大模型）装上记忆，里面提到对话链ConversationChain和MessagesPlaceholder，可以简化安装记忆的流程。下文来拆解基于LangChain的大模型记忆方案。

5分钟了解LangChain的路由链

路由链（RouterChain）是由LLM根据输入的Prompt去选择具体的某个链。路由链中一般会存在多个Prompt，Prompt结合LLM决定下一步选择哪个链。

基于ReAct机制的AI Agent

当前，在各个大厂纷纷卷LLM的情况下，各自都借助自己的LLM推出了自己的AI Agent，比如字节的Coze，百度的千帆等，还有开源的Dify。你是否想知道其中的原理？是否想过自己如何实现一套AI Agent？当然，借助LangChain就可以。

微软开源了一个助力开发LLM 加持的应用的工具包 semantic-kernel

在首席执行官萨蒂亚·纳德拉（Satya Nadella）的支持下，微软似乎正在迅速转变为一家以人工智能为中心的公司。最近微软的众多产品线都采用GPT-4加持，从Microsoft 365等商业产品到“新必应”搜索引擎，再到低代码/无代码Power Platform等面向开发的产品，包括软件开发组件P

[转帖]大型语言模型

`https://wiki.mbalib.com/wiki/LLMs` 出自 MBA智库百科(https://wiki.mbalib.com/) (重定向自LLMs) 大型语言模型，也叫大语言模型、大模型（Large Language Model，LLM；Large Language Models，

AIGC的隐私安全问题及隐私保护技术

Chatgpt的风靡，也让其背后LLM（大型语言模型）技术中的数据隐私保护问题进一步受到关注。作为国内隐私计算行业领军者，京东科技全程深度参与了「4大报告+3大标准」的编写研制工作，取得丰硕成果。

手动实现Transformer

Transformer和BERT可谓是LLM的基础模型，彻底搞懂极其必要。Transformer最初设想是作为文本翻译模型使用的，而BERT模型构建使用了Transformer的部分组件，如果理解了Transformer，则能很轻松地理解BERT。一.Transformer模型架构 1.编码器（

ChatGPT小型平替之ChatGLM-6B本地化部署、接入本地知识库体验

本文期望通过本地化部署一个基于LLM模型的应用，能让大家对构建一个完整的应用有一个基本认知。包括基本的软硬环境依赖、底层的LLM模型、中间的基础框架及最上层的展示组件，最终能达到在本地零编码体验的目的。

开源医疗大模型排行榜: 健康领域大模型基准测试

多年来，大型语言模型 (LLMs) 已经发展成为一项具有巨大潜力，能够彻底改变医疗行业各个方面的开创性技术。这些模型，如 GPT-3，GPT-4 和 Med-PaLM 2，在理解和生成类人文本方面表现出了卓越的能力，使它们成为处理复杂医疗任务和改善病人护理的宝贵工具。它们在多种医疗应用中显示出巨大的

BigCodeBench: 继 HumanEval 之后的新一代代码生成测试基准

HumanEval 是一个用于评估大型语言模型 (LLM) 在代码生成任务中的参考基准，因为它使得对紧凑的函数级代码片段的评估变得容易。然而，关于其在评估 LLM 编程能力方面的有效性越来越多的担忧，主要问题是HumanEval 中的任务太简单，可能不能代表真实世界的编程任务。相比于 HumanEv

DashVector x 通义千问大模型：打造基于专属知识的问答服务

本教程演示如何使用向量检索服务（DashVector），结合LLM大模型等能力，来打造基于垂直领域专属知识等问答服务。其中LLM大模型能力，以及文本向量生成等能力，这里基于灵积模型服务上的通义千问 API以及Embedding API来接入。背景及实现思路大语言模型（LLM）作为自然语言处理领域

笔记本电脑上的聊天机器人: 在英特尔 Meteor Lake 上运行 Phi-2

对应于其强大的能力，大语言模型 (LLM) 需要强大的算力支撑，而个人计算机上很难满足这一需求。因此，我们别无选择，只能将它们部署至由本地或云端托管的性能强大的定制 AI 服务器上。为何需要将 LLM 推理本地化如果我们可以在典配个人计算机上运行最先进的开源 LLM 会如何？好处简直太多了: 增

SK 简化流行编程语言对生成式AI 应用开发的支持

Semantic Kernel[1] 是一个开源的将大型语言模型（LLM）与流行的编程语言相结合的SDK，Microsoft将Semantic Kernel（简称SK）称为轻量级SDK，结合了OpenAI，Azure OpenAI和Hugging Face等AI LLM的集成。它使开发人员能够通过编

聊聊语言模型与知识图谱

## 语言模型语言模型泛指：大语言模型LLM、通用模型GLM。语言模型也是知识库。基于语言模型下的实现，比如ChatGPT，BERT，ChatGLM等等，这类知识库就像是已经人为处理好、编排好、可直接使用的知识库。 ## 知识图谱知识图谱的定义由Google公司在2012年提出,被界定为用来提

Langchain-Chatchat项目：2.1-通过GPT2模型来检索NebulaGraph

在官方例子中给出了通过chain = NebulaGraphQAChain.from_llm(ChatOpenAI(temperature=0), graph=graph, verbose=True)来检索NebulaGraph图数据库。本文介绍了通过GPT2替换ChatOpenAI的思路和实现，暂

StarCoder2-Instruct: 完全透明和可自我对齐的代码生成

指令微调是一种技术，它能让大语言模型 (LLMs) 更好地理解和遵循人类的指令。但是，在编程任务中，大多数模型的微调都是基于人类编写的指令 (这需要很高的成本) 或者是由大型专有 LLMs 生成的指令 (可能不允许使用)。我们推出了一个叫做 StarCoder2-15B-Instruct-v0.

Semantic Kernel（语义内核）秋季路线图

Semantic Kernel 是一个开源的 SDK，它允许开发人员将大型语言模型（LLM）与传统的编程语言进行混合使用。微软Semantic Kernel团队在博客上正式公布了Semantic Kernel 项目秋季发展路线图[1]。这家公司的设计和AI副总裁John Maeda在官方博客中写

Semantic Kernel .NET SDK 的 v1.0.0 Beta1 发布

介绍 Semantic Kernel （SK）是一个开源的将大型语言模型（LLM）与流行的编程语言相结合的SDK，Microsoft将Semantic Kernel（简称SK）称为轻量级SDK，结合了OpenAI，Azure OpenAI和Hugging Face等AI LLM的集成。它使开发人员

使用SemanticKernel 进行智能应用开发（2023-10更新）

以OpenAI 的ChatGPT 所掀起的GenAI 快速创新浪潮，其中连接LLM 和应用之间的桥梁的两大开源项目：LangChain[1]和Semantic Kernel[2] ，在半年前写过一篇文章 LangChain vs Semantic Kernel [3]，这半年以来Semantic

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化