与#llm#相关的内容第5页 - PmDaddy

全部分类数据库前端云计算

Bi-encoder vs Cross encoder?

本文永久地址：https://wanger-sjtu.github.io/encoder-cross-bi/ Bi-encoder和Cross-encoder是在自然语言理解任务模型的两种不同方法，在信息检索和相似性搜索二者的使用更为广泛。在LLM大火的今天，RAG的pipe line中这两个模块作

深入探讨Function Calling：在Semantic Kernel中的应用实践

引言上一章我们熟悉了 OpenAI 的 function calling 的执行原理，这一章节我们讲解一下 function calling 在 Semantic Kernel 的应用。在OpenAIPromptExecutionSettings跟 LLM 交互过程中，ToolCallBehav

深入探讨Function Calling：实现外部函数调用的工作原理

引言 Function Calling 是一个允许大型语言模型（如 GPT）在生成文本的过程中调用外部函数或服务的功能。 Function Calling允许我们以 JSON 格式向 LLM 模型描述函数，并使用模型的固有推理能力来决定在生成响应之前是否调用该函数。模型本身不执行函数，而是生成包含函

什么是Token？为什么大模型要计算Token数

本文分享自华为云社区《【技术分享】什么是Token？为什么GPT基于Token定价》，作者：开天aPaaS小助手Tracy。在使用LLM大模型时，我们经常会遇到一个关键词，叫：Token。比如：最新版 GPT-4 Turbo 模型最高支持 128k token 上下文；曾经 GPT 最强对手

5分钟明白LangChain 的输出解析器和链

本文介绍 LangChain 的输出解析器OutputParser的使用，和基于LangChain的LCEL构建链。 1. 输出解析器OutputParser 1.1、为什么需要OutputParser 常规的使用LangChain构建LLM应用的流程是：Prompt 输入、调用LLM 、LLM输出

mac本地搭建ollama

mac本地搭建ollama webUI *简介：ollama-webUI是一个开源项目，简化了安装部署过程，并能直接管理各种大型语言模型（LLM）。本文将介绍如何在你的macOS上安装Ollama服务并配合webUI调用api来完成聊天。开源地址 https://github.com/812781

Schillace 定律背后的 Sam Schillace

微软semantic-kernel(SK)团队发布了一篇博客文章：Early Lessons From GPT-4: The Schillace Laws[1] ,微软的CVP , Deputy CTO Sam Schillace 根据他在GPT-4方面的经验制定了使用LLM创建软件的九项原则，称之

使用 Semantic Kernel 实现 Microsoft 365 Copilot 架构

3月16日，微软发布了微软365 Copilot[1]。 Microsoft 365 Copilot 将您现有的 Word、Excel、PowerPoint、Outlook 和 Teams 与大型语言模型（LLM）的强大功能以及来自 Microsoft Graph 和 Microsoft 365

Copilot Chat示例应用程序

微软在Semantic Kernel博客上发布了文章：https://devblogs.microsoft.com/semantic-kernel/announcing-copilot-chat/。 Copilot Chat示例应用程序展示了开发人员如何将AI和LLM智能集成到自己的应用程序中，使开

本地推理,单机运行,MacM1芯片系统基于大语言模型C++版本LLaMA部署“本地版”的ChatGPT

OpenAI公司基于GPT模型的ChatGPT风光无两，眼看它起朱楼，眼看它宴宾客，FaceBook终于坐不住了，发布了同样基于LLM的人工智能大语言模型LLaMA，号称包含70亿、130亿、330亿和650亿这4种参数规模的模型，参数是指神经网络中的权重和偏置等可调整的变量，用于训练和优化神经网络

[转帖][github]Chinese-LLaMA-Alpaca Public

`https://github.com/ymcui/Chinese-LLaMA-Alpaca#%E6%A8%A1%E5%9E%8B%E4%B8%8B%E8%BD%BD` 以ChatGPT、GPT-4等为代表的大语言模型（Large Language Model, LLM）掀起了新一轮自然语言处理领域

【转帖】调教LLaMA类模型没那么难，LoRA将模型微调缩减到几小时

https://www.thepaper.cn/newsDetail_forward_23250236 LoRA 微调方法，随着大模型的出现而走红。最近几个月，ChatGPT 等一系列大语言模型（LLM）相继出现，随之而来的是算力紧缺日益严重。虽然人人都想打造专属于自己的大模型，但是能负担得起上亿

[转帖]GPT4All 一个开源 ChatGPT

https://zhuanlan.zhihu.com/p/618947904 通用预训练语言模型. ChatGPT 正在迅速发展与传播，新的大型语言模型 (LLM) 正在以越来越快的速度开发。就在过去几个月，有了颠覆性的 ChatGPT 和现在的 GPT-4。明确定义，GPT 代表（Generati

NebulaGraph实战：1-NebulaGraph安装和基础操作

以前使用Neo4j图数据库，考虑到生产环境需要最终选择了NebulaGraph图数据库。对于数据要求比较高的领域，比如医疗、财务等，暂时还是离不开知识图谱的。后面主要围绕LLM+KG做一些行业解决方案和产品，涉及的技术主要是对话、推荐、检索这3个大的方向，可用于客服系统和聊天机器人等。 1.安装Ne

Llama2-Chinese项目：7-外延能力LangChain集成

本文介绍了Llama2模型集成LangChain框架的具体实现，这样可更方便地基于Llama2开发文档检索、问答机器人和智能体应用等。 1.调用Llama2类针对LangChain[1]框架封装的Llama2 LLM类见examples/llama2_for_langchain.py，调用代码如下

Langchain-Chatchat项目：3-Langchain计算器工具Agent思路和实现

本文主要讨论Langchain-Chatchat项目中自定义Agent问答的思路和实现。以"计算器工具"为例，简单理解就是通过LLM识别应该使用的工具类型，然后交给相应的工具（也是LLM模型）来解决问题。一个LLM模型可以充当不同的角色，要把结构化的Prompt模板写好，充分利用LLM的Zero/O

C#使用iKvm黑科技无缝接入JVM生态

前言时间过得飞快，一转眼国庆假期也要过去了，再不更新博客就太咸鱼了…… 最近在开发AIHub的时候想找个C#能用的命名实体识别库，但一直没找到，AI生态方面C#确实不太丰富，这块还是得Python，但我又不想跟LLM一样用gRPC的方式来调用，感觉有点麻烦。这时候发现好像JVM生态有不少这类NL

论文分享丨Holistic Evaluation of Language Models

摘要：该文为大模型评估方向的综述论文。本文分享自华为云社区《【论文分享】《Holistic Evaluation of Language Models》》，作者：DevAI。大模型（LLM）已经成为了大多数语言相关的技术的基石，然而大模型的能力、限制、风险还没有被大家完整地认识。该文为大模型评估

【GPT-4理论篇-1】GPT-4核心技术探秘

在本文中，我将结合GPT-4的技术报告、GPT-4相对于GPT 3.5/ChatGPT的提升、GPT-4和ChatGPT的对比、OpenAI的近期工作，大语言模型（Large Language Model，LLM）模型的科研进展，多模态模型的科研进展等多方面的信息，深入分析GPT-4的技术细节。

揭秘ChatGPT，如何打造自己的自定义指令

在大语言模型的训练中，经常会看到 Instruct Tuning（指令微调）这个单词，GPT家族中也有一个 InstructGPT的模型（指令微调后的GPT），通过指令微调的LLM会更按照我们期望的方式输出

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化