与#it#相关的内容第11页 - PmDaddy

全部分类数据库前端云计算

聊聊Flink必知必会(四)

### 概述 Flink Streaming API借鉴了谷歌数据流模型(Google Data Flow Model)，它的流API支持不同的时间概念。Flink明确支持以下3个不同的时间概念。 Flink明确支持以下3个不同的时间概念。 (1)事件时间：事件发生的时间，由产生（或存储）事件的设备

聊聊Zookeeper的Session会话超时重连

### 概述简单地说，ZooKeeper的连接与会话就是客户端通过实例化ZooKeeper对象来实现客户端与服务器创建并保持TCP连接的过程。本质上，Session就是一个TCP 长连接。 ### 会话 Session会话的作用： 1. ZK Server 执行任何请求之前，都需要 Client

聊聊Flink CDC必知必会

CDC是(Change Data Capture变更数据获取)的简称。核心思想是，监测并捕获数据库的变动（包括数据或数据表的插入INSERT、更新UPDATE、删除DELETE等），将这些变更按发生的顺序完整记录下来，写入到消息中间件中以供其他服务进行订阅及消费。 ## Flink CDC的设

从kafka与Flink的事务原理来看二阶段提交与事务日志的结合使用

两阶段提交的成立要基于以下假设： - 该分布式系统中，存在一个节点作为协调者，其他节点作为参与者，且节点之间可以进行网络通信。 - 所有节点都采用预写式日志，且日志被写入后即被保存在可靠的存储设备上，即使节点损坏也不会导致日志数据的丢失。 - 所有节点不会永久性损坏，即使损坏后也可以恢复。 ###

聊聊Kafka的生产者消费者确认机制

## 生产者确认机制消息从生产者客户端发送至broker服务端topic，需要ack确认。`acks`与`min.insync.replicas`是两个配置参数.其中`acks`是producer的配置参数，`min.insync.replicas`是Broker端的配置参数，这两个参数对于生产者

聊聊Zookeeper技术内幕之客户端与SetData请求处理

从客户端会话创建到网络连接、请求处理，简单的叙述下流程与逻辑 ### 客户端客户端是开发人员使用ZooKeeper最主要的途径，ZooKeeper的客户端主要由以下几个核心组件组成。 - ZooKeeper实例：客户端的入口。 - ClientWatchManager：客户端Watcher管理器。

聊聊我认为的分布式、集群实现关键点

基于常见的中间件(Mysql、ElasticSearch、Zookeeper、Kafka、Redis)等分布式集群设计的机制，自己总结了在在集群设计过程中需要考虑的通用问题。 ### 节点通信机制主节点的增加、删除、通信机制。 ### 路由算法即数据路由到哪个节点的策略机制。在集群内有多个节点，

聊聊日志聚类算法及其应用场景

阅读《[基于 Flink ML 搭建的智能运维算法服务及应用](https://mp.weixin.qq.com/s/yhXiQtUSR4hxp9XWrkiiew "基于 Flink ML 搭建的智能运维算法服务及应用")》一文后，对其中日志聚类算法有了些思考。 ### 概述日志聚类，简而言之是对

聊聊自然语言处理NLP

## 概述自然语言处理(NLP)的正式定义：是一个使用计算机科学、人工智能(AI)和形式语言学概念来分析自然语言的研究领域。不太正式的定义表明：它是一组工具，用于从自然语言源(如web页面和文本文档)获取有意义和有用的信息。NLP工具的实现一般是基于机器学习与深度学习、其它算法(Lucene Co

聊聊语言模型与知识图谱

## 语言模型语言模型泛指：大语言模型LLM、通用模型GLM。语言模型也是知识库。基于语言模型下的实现，比如ChatGPT，BERT，ChatGLM等等，这类知识库就像是已经人为处理好、编排好、可直接使用的知识库。 ## 知识图谱知识图谱的定义由Google公司在2012年提出,被界定为用来提

聊聊Transformer和GPT模型

本文基于《生成式人工智能》一书阅读摘要。感兴趣的可以去看看原文。可以说，Transformer已经成为深度学习和深度神经网络技术进步的最亮眼成果之一。Transformer能够催生出像ChatGPT这样的最新人工智能应用成果。 ## 序列到序列(seq2seq) Transformer能实现的核心

聊聊Embedding(嵌入向量)

摘要自《深入浅出Embedding》一问。具体详细内容请移步该书。 ## 概述简单来说，嵌入是用向量表示一个物体，这个物体可以是一个单词、一条语句、一个序列、一件商品、一个动作、一本书、一部电影等，可以说嵌入(Embedding)涉及机器学习、深度学习的绝大部分对象。这些对象是机器学习和深度学习中

聊聊Hugging Face

## 概述 HuggingFace是一个开源社区，提供了开源的AI研发框架、工具集、可在线加载的数据集仓库和预训练模型仓库。HuggingFace提出了一套可以依照的标准研发流程，按照该框架实施工程，能够在一定程度上规避开发混乱、开发人员水平不一致的问题，降低了项目实施的风险及项目和研发人员的耦合度

聊聊HuggingFace Transformer

## 概述参见：[聊聊HuggingFace](https://www.cnblogs.com/zhiyong-ITNote/p/17640835.html) ## 项目组件一个完整的transformer模型主要包含三部分：Config、Tokenizer、Model。 ### Config

聊聊多任务学习

最近翻译的一篇分享中，主要讲解了多任务学习的各个方面，很多的专业术语与概念都不清楚，因此简单的整理了下相关的知识，做个笔记。 ### 概述现在大多数机器学习任务都是单任务学习。对于复杂的问题，也可以分解为简单且相互独立的子问题来单独解决，然后再合并结果，得到最初复杂问题的结果。这样做看似合理，其实

聊聊HuggingFace如何处理大模型下海量数据集

翻译自： [Big data? 🤗 Datasets to the rescue!](https://huggingface.co/learn/nlp-course/chapter5/4?fw=pt#big-data-datasets-to-the-rescue "Big data? 🤗 Dat

聊聊预训练模型的微调

翻译自：[Fine-tuning a model with the Trainer API](https://huggingface.co/learn/nlp-course/chapter3/3?fw=pt "Fine-tuning a model with the Trainer API") `T

聊聊数据库事务内嵌TCP连接

最近再看项目代码，发现很多的service里面，喜欢在事务内部再去调用HTTP请求，简单分析下此种方式的利弊与解决策略。概述在数据库内部嵌套TCP连接(一般是HTTP调用或是RPC远程调用)。 @Transactional(rollbackFor = Exception.class) publi

聊聊神经网络的基础知识

来自《深度学习入门:基于Python的理论与实现》张量 Numpy、TensorFlow、Pytorch等框架主要是为了计算张量或是基于张量计算。标量：0阶张量；12,4,3, 向量：一阶张量；[12,4,3] 矩阵：二阶张量；[ [12,4,3], [11,2,3] ] 多阶张量：多维数组；

[转帖]Mach是什么

https://product.pconline.com.cn/itbk/software/os/1112/2610866.html Mach 是一个由卡内基梅隆大学发展的微内核的操作系统，为了用于操作系统之研究，特别是在分散与平行运算上。是最早实现微核心操作系统的例子之一，是许多其它相似的计划的标

# 热门排行

微软 New Bing AI 申请与使用保姆级教程（免魔法） ChatGPT API使用介绍 ChatGPT开发实战一篇带你了解如何使用纯前端类Excel表格构建现金流量表手把手教你玩转 Excel 数据透视表为什么 C# 可能是最好的第一编程语言 .NET 入门到高级路线提高工作效率的神器：基于前端表格实现Chrome Excel扩展插件 React + Springboot + Quartz，从0实现Excel报表自动化用Echarts实现前端表格引用从属关系可视化