与#文本处理#相关的内容第12页 - PmDaddy

全部分类数据库前端云计算

手动实现Transformer

Transformer和BERT可谓是LLM的基础模型，彻底搞懂极其必要。Transformer最初设想是作为文本翻译模型使用的，而BERT模型构建使用了Transformer的部分组件，如果理解了Transformer，则能很轻松地理解BERT。一.Transformer模型架构 1.编码器（

vue3 + mark.js | 实现文字标注功能

页面效果具体实现新增 1、监听鼠标抬起事件，通过window.getSelection()方法获取鼠标用户选择的文本范围或光标的当前位置。 2、通过选中的文字长度是否大于0或window.getSelection().isCollapsed (返回一个布尔值用于描述选区的起始点和终止点是否位于

视觉享受，兼顾人文观感和几何特征的字体「GitHub 热点速览 v.22.46」

GitHub 上开源的字体不在少数，但是支持汉字以及其他非英文语言的字体少之又少，记得上一个字体还是霞鹜文楷，本周 B 站知名设计 UP 主开源了的得意黑体在人文观感和几何特征之间找到了美的平衡。而文本编辑器剪视频 autocut 则优雅和便捷之间找到它的平衡，分布式时序数据库 greptime

又一个开源便斩获 7k star 的新模型「GitHub 热点速览」

Star 并不能代表什么，但是绝对能表示一个项目的受欢迎程度。就像刚开源一周就有 7k+ star 的新模型，输入文本 / 图像就能获得 3D 对象。除了这个新模型，本周还有一款新的 Web 3D 渲染引擎 Orillusion，向量数据库新晋成员 qdrant。还有老牌魔兽世界为它站台的游戏解决方

CTPN+CRNN算法端到端实现文字识别的实战开发

本文分享自华为云社区《CTPN+CRNN 算法端到端实现文字识别》，作者：HWCloudAI。 OCR介绍光学字符识别（英语：Optical Character Recognition，OCR）是指对文本资料的图像文件进行分析识别处理，获取文字及版面信息的过程。发展时间较长，使用很普遍。OCR作为

DBA必备的Mysql知识点：数据类型和运算符

摘要：本文主要为大家带来Mysql中的3种数据类型和3种运算符。本文分享自华为云社区《Mysql中的数据类型和运算符》，作者： 1+1=王。 Mysql的数据类型 Mysql支持数值型、文本型和日期时间型三大数据类型。数值型数据数值型是描述定量数据的数据类型，包括整数型数据类型和浮点型数据类型

带你上手基于Pytorch和Transformers的中文NLP训练框架

基于pytorch、transformers做中文领域的nlp开箱即用的训练框架，提供全套的训练、微调模型（包括大模型、文本转向量、文本生成、多模态等模型）的解决方案。

【玩转鲲鹏DevKit系列】何如快速迁移有源码应用

本文分享自华为云社区《【玩转鲲鹏DevKit系列】何如快速迁移有源码应用》，作者：华为云社区精选。源码（也称源程序）是程序员编写的计算机程序的文本形式，不同的编程语言有不同的语法和规则，常见类型包含解释型语言（JAVA/Python 等 )编译型语言（C/C++/GO等）、汇编语言等。程序员可以

Meta AI 开源万物可分割 AI 模型(SAM)

4 月 6 日，根据 Meta AI 官方博客，Meta AI 宣布推出了一个 AI 模型 Segment Anything Model（SAM，分割一切模型）。据介绍，该模型能够根据文本指令等方式实现图像分割，而且万物皆可识别和一键抠图。

ChatGPT+Mermaid自然语言流程图形化产出小试

本文旨在介绍如何使用ChatGPT和Mermaid语言生成流程图的技术。在现代软件开发中，流程图是一种重要的工具，用于可视化和呈现各种流程和结构。结合ChatGPT的自然语言处理能力和Mermaid的简单语法，可以轻松地将文本描述转化为图形表示，使技术文档更具可读性和易懂性。

Jekyll安装

本文来自Jekyll官方文档。简介 Jekyll是一个静态网站生成器，它可以把Markdown写就的文本根据指定的布局生成静态网站。你可以调整网站的外观、URL、页面展示数据等信息。准备工作 Jekyll的安装需要以下几个软件： Ruby v2.5.0或更高版本 RubyGems gcc和mak

bash shell 无法使用 perl 正则

哈喽大家好，我是咸鱼。今天跟大家分享一个关于正则表达式的案例，希望能够对你有所帮助案例现象前几天有一个小伙伴在群里求助，说他这个 shell 脚本有问题，让大家帮忙看看可以看到，这个脚本首先将目标文本文件的名字当作该脚本的第一个参数（$1）传递进去，然后查看这个文本文件的内容（cat $1），

Python 3.12 抢先看——关于 f-string 的改动

# Python 3.12 抢先看——关于 f-string 的改动哈喽大家好，我是咸鱼相信小伙伴们对 python 中的 f-string 都不陌生 f-string 是格式化字符串的缩写，是以小写或大写字母 F 为前缀的字符串文本 f-string 提供简洁明了的语法，**允许对变量和表达式

CSS概念与CSS选择器

CSS简述 CSS被称为级联样式表或者CSS样式表。CSS也是一种标记语言。 CSS主要用于设置HTML页面中的: 1.文本内容（字体，大小，对齐方式等）， 2.图片的外形（宽高，边框样式，边距等）, 3.版面的布局和外观显示样式。它的使用分两步 1.定义： .red {color: red} 2

ScaleDet：AWS 基于标签相似性提出可扩展的多数据集目标检测器 | CVPR 2023

论文提出了一种可扩展的多数据集目标检测器(ScaleDet)，可通过增加训练数据集来扩大其跨数据集的泛化能力。与现有的主要依靠手动重新标记或复杂的优化来统一跨数据集标签的多数据集学习器不同，论文引入简单且可扩展的公式来为多数据集训练产生语义统一的标签空间，通过视觉文本对齐进行训练，能够学习跨数据集的

可视化—gojs 超多超实用经验分享(四)

目录41.监听连线拖拽结束后的事件42.监听画布的修改事件43.监听节点被 del 删除后回调事件(用于实现调用接口做一些真实的删除操作)44.监听节点鼠标移入移出事件，hover 后显示特定元素45.监听树图实现鼠标点击节点本身展开或收起子节点的功能,而不是点击另外的按钮46.监听文本块编辑结束后

可视化学习：如何用WebGL绘制3D物体

在学习2D绘图的时候，我们提过很多次关于GPU的高效渲染，但是2D图形的绘制只展示了WebGL部分的能力，WebGL更强大的地方在于，它可以绘制各种3D图形，而3D图形能够极大地增强可视化的表现能力。相信很多小伙伴都对此有所耳闻，也有不少人学习WebGL，就是冲着它的3D绘图能力。接下来，文本就用一...

基于Bootstrap Blazor开源的.NET通用后台权限管理系统

前言今天大姚给大家分享一个基于Bootstrap Blazor开源的.NET通用后台权限管理系统，后台管理页面兼容所有主流浏览器，完全响应式布局（支持电脑、平板、手机等所有主流设备），可切换至 Blazor 多 Tabs 模式，权限控制细化到网页内任意元素（按钮、表格、文本框等等）：Bootstr

高级前端开发需要知道的 25 个 JavaScript 单行代码

1. 不使用临时变量来交换变量的值 2. 对象解构，让数据访问更便捷 3. 浅克隆对象 4. 合并对象 5. 清理数组 6. 将 NodeList 转换为数组 7. 检查数组是否满足指定条件 8. 将文本复制到剪贴板 9. 删除数组重复项 10. 取两个数组的交集 11. 求数组元素的总和 12. ...

AIGC底层技术介绍

1.AIGC概述 AIGC，全称Artificial Intelligence Generated Content，即人工智能生成内容。这是一种新兴的人工智能技术，其核心思想是利用人工智能模型，根据给定的主题、关键词、格式、风格等条件，自动生成各种类型的文本、图像、音频、视频等内容。 1.1定义与背

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化